分析測(cè)試百科網(wǎng) > 行業(yè)資訊 > 焦點(diǎn)事件

一夜易主——全球最強(qiáng)大模型由GPT-4進(jìn)入Claude 3 時(shí)代

2024.3.05

Anthropic公司發(fā)布了最新的Claude 3系列模型，一舉擊敗了全球最強(qiáng)AI模型GPT-4。Claude 3在多模態(tài)和語(yǔ)言能力等指標(biāo)上表現(xiàn)出色，樹(shù)立了新的行業(yè)基準(zhǔn)。

Claude 3系列包括Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus，能力逐級(jí)增強(qiáng)。Opus作為最先進(jìn)模型，在多項(xiàng)評(píng)估標(biāo)準(zhǔn)上領(lǐng)先同行，展現(xiàn)出幾乎與人類(lèi)相媲美的理解和表達(dá)能力，是AGI領(lǐng)域的領(lǐng)跑者。Claude 3在分析預(yù)測(cè)、代碼生成、多語(yǔ)言理解和視覺(jué)識(shí)別等方面實(shí)現(xiàn)了顯著進(jìn)步。Opus在處理復(fù)雜任務(wù)時(shí)表現(xiàn)出色，Sonnet在速度和計(jì)算效率上找到平衡，Haiku則具備快速響應(yīng)的優(yōu)勢(shì)。Claude 3 Opus在多項(xiàng)基準(zhǔn)測(cè)試中完勝GPT-4和Gemini 1.0 Ultra，Sonnet也在部分基準(zhǔn)上超越GPT-4。Opus在LSAT、MBE、數(shù)學(xué)競(jìng)賽等考試中表現(xiàn)出色，展示出高智能水平。

全球最強(qiáng)LLM易主

Opus，是Claude 3系列中最先進(jìn)的模型。

它在多項(xiàng)AI系統(tǒng)常用評(píng)估標(biāo)準(zhǔn)，包括本科級(jí)別專(zhuān)業(yè)知識(shí)（MMLU）、研究生級(jí)別專(zhuān)家推理（GPQA）、基礎(chǔ)數(shù)學(xué)（GSM8K），均取得領(lǐng)先業(yè)界LLM的性能。

尤其是，Opus在處理復(fù)雜任務(wù)時(shí)，展現(xiàn)了幾乎與人類(lèi)相媲美的理解和表達(dá)能力，是AGI領(lǐng)域的領(lǐng)跑者。

Claude 3系列模型在分析預(yù)測(cè)、創(chuàng)建細(xì)微內(nèi)容、代碼生成，以及用西班牙語(yǔ)、日語(yǔ)、法語(yǔ)等非英語(yǔ)語(yǔ)言交流的能力上都實(shí)現(xiàn)了顯著進(jìn)步。

最小規(guī)模，3秒讀完10k token論文

Claude 3系列模型能夠支持實(shí)時(shí)用戶(hù)交流、自動(dòng)完成和數(shù)據(jù)提取等任務(wù)（需要立即且實(shí)時(shí)的反饋）。

在同類(lèi)智能模型中，Haiku以其卓越的速度和成本效益成為市場(chǎng)上的佼佼者。

Haiku可以在不到3秒時(shí)間，閱讀一個(gè)包含圖表和圖形的信息和數(shù)據(jù)密集型的研究論文（大約10k token）。

多模態(tài)視覺(jué)能力

另外，值得一提的是，Claude 3系列模型具備與其他領(lǐng)先模型相媲美的高級(jí)視覺(jué)識(shí)別能力。

它們能夠處理各種視覺(jué)格式，包括照片、圖表、圖形和技術(shù)繪圖等。

大模型 gpt-4

環(huán)球網(wǎng) 虎嗅網(wǎng)

喜歡作者我要約稿