久草久草欧美看看日毛片|亚洲色情电影在线观看|中国一极毛片爱爱欧美一区|国产精品丝袜美腿|干人人操人人干人人|av黄色无码亚洲v视频|全国一级黄片在哪里看|国产精品av影院|特级一级黄色视频|亚洲黄色导航网站在线观看

當(dāng)前位置: 首頁(yè) ? 資訊 ? 熱點(diǎn) ? 正文

OpenAI勁敵丟炸彈,新一代大模型性能超越GPT-4o

作者:Jessica 來(lái)源: 硅星人 228006/23

今天, OpenAI勁敵Anthropic忽然丟炸彈,發(fā)布下一代旗艦大模型Claude 3.5 Sonnet。3個(gè)月前Claude 3曾艷壓全場(chǎng),首次讓大批用戶有了超越GPT-4的推背體驗(yàn)。這次作為最新升級(jí),也是即將推出的Claude 3.

標(biāo)簽: Claude 3.5 Sonnet 大模型 AI

今天, OpenAI勁敵Anthropic忽然丟炸彈,發(fā)布下一代旗艦大模型Claude 3.5 Sonnet。

3個(gè)月前Claude 3曾艷壓全場(chǎng),首次讓大批用戶有了超越GPT-4的推背體驗(yàn)。這次作為最新升級(jí),也是即將推出的Claude 3.5全系列中*版本,Anthropic更是自豪地稱Claude 3.5 Sonnet已領(lǐng)跑全行業(yè)智能水準(zhǔn),不僅在廣泛評(píng)估中勝過(guò)GPT-4o等一眾競(jìng)爭(zhēng)對(duì)手,也保持了中端模型Sonnet的*性價(jià)比。

價(jià)格上,Claude 3.5 Sonnet每百萬(wàn)輸入3美元,每百萬(wàn)輸出15美元,只有上一代超大杯Opus的1/5,運(yùn)行速度卻是它的兩倍,并擁有20萬(wàn) token上下文窗口。

現(xiàn)在所有用戶都可以登錄Claude.ai和移動(dòng)客戶端免費(fèi)體驗(yàn)新模型,訂閱用戶將獲得更高訪問(wèn)權(quán)限(官方稱比免費(fèi)版5倍好用)。也可以通過(guò)Anthropic API、Amazon Bedrock等平臺(tái)獲得。

一向眼疾手快的Poe表示,已經(jīng)安排上了。

速度翻倍,寫(xiě)作更自然、編程更智能

具體來(lái)看性能表現(xiàn)。Claude 3.5 Sonnet在研究生級(jí)推理能力(GPQA)、本科生級(jí)知識(shí)(MMLU)和編程能力(Humaneval)方面樹(shù)立了新的行業(yè)基準(zhǔn)。在把握語(yǔ)義的細(xì)微差別、幽默和復(fù)雜指令上有顯著改進(jìn),能以更自然、親和的語(yǔ)氣輸出高質(zhì)量的寫(xiě)作內(nèi)容。

代碼方面表現(xiàn)優(yōu)異。在團(tuán)隊(duì)考察AI能否根據(jù)文字需求改進(jìn)代碼的內(nèi)部編程測(cè)試中, Claude 3.5 Sonnet成功解決了64%的問(wèn)題,而Claude 3 Opus只解決了38%。研究人員發(fā)現(xiàn),只要給Claude 3.5 Sonnet清晰的指令和必要工具, 它就能獨(dú)立編寫(xiě)、編輯和執(zhí)行代碼,并具備復(fù)雜推理和故障排除能力。并能輕松處理代碼翻譯,特別適合更新遺留應(yīng)用程序和遷移代碼庫(kù)。

Anthropic開(kāi)發(fā)者關(guān)系工程師Alex Albert表示,Claude在編寫(xiě)代碼和自主修復(fù)pull requests方面變得非常出色。“顯然,一年之后,大部分代碼將由大語(yǔ)言模型編寫(xiě)?!?/p>

他在日常工作中發(fā)現(xiàn),代碼測(cè)試和修復(fù)通常比編寫(xiě)本身更花時(shí)間。此時(shí)Cloud 3.5 Sonnet可以充當(dāng)一個(gè)成熟的編程代理。Albert在視頻中展示了如何在最少輸入和沒(méi)有互聯(lián)網(wǎng)訪問(wèn)的沙盒環(huán)境下,借助Claude將一個(gè)裁切圓形頭像的bug函數(shù)修復(fù),并轉(zhuǎn)變?yōu)橐粋€(gè)包括單元測(cè)試在內(nèi)的功能齊全的實(shí)現(xiàn)。

最強(qiáng)視覺(jué)模型,解放生產(chǎn)力

此次3.5 Sonnet在視覺(jué)能力上也實(shí)現(xiàn)了巨大突破,是Anthropic迄今為止最強(qiáng)大的視覺(jué)模型。

它在解釋圖表、圖形等視覺(jué)推理任務(wù)中改進(jìn)明顯??梢詼?zhǔn)確地從粗略圖像中轉(zhuǎn)錄文本,并輸出更多洞察,這也是零售、物流和金融服務(wù)等領(lǐng)域的核心能力。

示例視頻中,用戶表示要做一個(gè)人類基因組的班級(jí)演講。給出一張測(cè)序里程碑時(shí)間線圖片和一個(gè)測(cè)序成本隨時(shí)間變化的圖表,要求Claude 3.5 Sonnet把圖中數(shù)據(jù)轉(zhuǎn)錄成 JSON格式 。Claude 3.5 Sonnet馬上從圖中抓取數(shù)據(jù),創(chuàng)建了兩個(gè)主要數(shù)組的 JSON 結(jié)構(gòu)。接著根據(jù)進(jìn)一步指令,將兩個(gè)數(shù)組相結(jié)合創(chuàng)建了一個(gè)交互式 Plotly.js 圖表。最后繼續(xù)出大招,把完整的演講demo給搞定了。

圖像信息提取和轉(zhuǎn)錄、數(shù)據(jù)結(jié)構(gòu)化、上下文理解、用戶協(xié)作....Claude 3.5 Sonnet*示范了什么叫解放生產(chǎn)力。再加上速度提升和成本效益,使它成為處理例如上下文敏感的客戶支持、協(xié)調(diào)多步驟工作流程等復(fù)雜任務(wù)的理想選擇。

引入新功能Artifacts,實(shí)時(shí)查看任務(wù)的小監(jiān)視器

此外另一個(gè)亮點(diǎn)是在Claude.ai上引入Artifacts預(yù)覽版。

這也是這個(gè)此前一直強(qiáng)調(diào)模型安全和底層研究的Anthropic ,在產(chǎn)品交互上的一次大更新。

這是一項(xiàng)擴(kuò)展用戶與Claude互動(dòng)方式的新功能。當(dāng)要求Claude生成代碼、文本或網(wǎng)站設(shè)計(jì)等內(nèi)容時(shí),Artifacts會(huì)出現(xiàn)在對(duì)話旁邊的專用窗口中,供用戶實(shí)時(shí)查看、編輯和構(gòu)建Claude的創(chuàng)作。相當(dāng)于形成了一個(gè)動(dòng)態(tài)工作空間,將AI生成的內(nèi)容更無(wú)縫集成到自己的項(xiàng)目和工作流程中。

Anthropic稱,這項(xiàng)功能標(biāo)志著Claude從對(duì)話式AI向協(xié)作工作環(huán)境的演變。這只是Claude.ai更廣泛愿景的開(kāi)始,不久的將來(lái)將擴(kuò)展到支持團(tuán)隊(duì)協(xié)作。最終甚至整個(gè)組織都能夠在同一個(gè)共享空間中安全地集中他們的知識(shí)、文檔和正在進(jìn)行的工作,Claude將作為一個(gè)隨時(shí)待命的隊(duì)友。

這乍聽(tīng)有點(diǎn)像微軟的團(tuán)隊(duì)助手Team Copilot。但Team Copilot管理會(huì)議、分配任務(wù)、記錄筆記等的定位類似一個(gè)項(xiàng)目經(jīng)理;Claude則聽(tīng)起來(lái)更像把團(tuán)隊(duì)請(qǐng)進(jìn)一間屋子舒服地坐著,動(dòng)動(dòng)手指,一起觀看Claude“為打工人打工”。

Anthropic:我每隔幾個(gè)月就會(huì)厲害一次

作為一家主打安全的AI公司, Anthropic當(dāng)然也用大量篇幅強(qiáng)調(diào)新一代模型經(jīng)過(guò)了嚴(yán)格的安全測(cè)試。

抱著每隔幾個(gè)月就大幅改善智能、速度和成本之間的權(quán)衡曲線的目標(biāo),Anthropic還表示將在今年晚些時(shí)候發(fā)布同系列的另兩個(gè)成員:Claude 3.5 Haiku和Claude 3.5 Opus。除此以外,公司也在開(kāi)發(fā)新的模態(tài)和功能,以支持更多的企業(yè)用例。

自從今年3月初發(fā)布Claude 3系列以來(lái),Anthropic久未有大動(dòng)作。上次被社區(qū)熱議還是Jan Leike和Sam Altman鬧翻,從OpenAI激情離職加入“我方陣營(yíng)”的時(shí)候。

Jan Leike在社交平臺(tái)表示,自己已加入Anthropic繼續(xù)大模型可解釋性和超級(jí)對(duì)齊研究。

此次Claude 3.5 Sonnet發(fā)布,Jan Leike也繼宣告入職消息后首次發(fā)文站臺(tái)。

“我喜歡新的Sonnet。我經(jīng)常讓它為我解釋機(jī)器學(xué)習(xí)論文。雖然不總是百分百準(zhǔn)確,但可能比我粗略閱讀要好,而且速度快得多。自動(dòng)化的對(duì)齊研究正在越來(lái)越接近現(xiàn)實(shí)...”

鑒于昨天Ilya Sutskever宣布成立新公司的消息,也有八卦的網(wǎng)友問(wèn),“是什么讓你選擇加入Anthropic而不是SSI ?”

一位用戶實(shí)測(cè)讓Claude 3.5 Sonnet創(chuàng)建一個(gè)能在短時(shí)間內(nèi)玩的原創(chuàng)游戲。它隨即設(shè)計(jì)了「Color Cascade」,一個(gè)需要從一系列掉落的形狀中抓住正確顏色的游戲。這名用戶表示,感受到了AGI的味兒。

Perplexity CEO Aravind Srinivas也發(fā)文說(shuō),Claude 3.5 Sonnet現(xiàn)已對(duì)平臺(tái)訂閱用戶開(kāi)放。在Perplexity內(nèi)部評(píng)估中,它取得了比GPT-4o更高的分?jǐn)?shù)。

不過(guò)也有人發(fā)現(xiàn)了華點(diǎn):

當(dāng)然,這湊巧只是某位Anthropic測(cè)試員工的名字。但典中典已成,另外一位在Anthropic做AI對(duì)齊的Sam Bowman回復(fù)說(shuō):“我想我們整代人中大約有三分之一都叫Sam。Anthropic至少有十幾個(gè)叫這個(gè)名字的,包括聯(lián)合創(chuàng)始人在內(nèi)。”

原來(lái)世界是一個(gè)巨大的Sam。

免責(zé)聲明:本網(wǎng)轉(zhuǎn)載合作媒體、機(jī)構(gòu)或其他網(wǎng)站的公開(kāi)信息,并不意味著贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性,信息僅供參考,不作為交易和服務(wù)的根據(jù)。轉(zhuǎn)載文章版權(quán)歸原作者所有,如有侵權(quán)或其它問(wèn)題請(qǐng)及時(shí)告之,本網(wǎng)將及時(shí)修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者,視為自愿接受本網(wǎng)站聲明的約束。聯(lián)系電話 010-57193596,謝謝。

財(cái)中網(wǎng)合作