OpenAI王炸新一波:向開發(fā)者開放滿血o1,測(cè)試中全面超越人類博士專家 ,準(zhǔn)確率達(dá)到78.3%
來源:每日經(jīng)濟(jì)新聞2024-12-18 07:39

在人工智能領(lǐng)域,英偉達(dá)再次引領(lǐng)技術(shù)革新,于當(dāng)?shù)貢r(shí)間12月17日推出了Jetson Orin Nano Super,一款手掌大小的生成式AI超級(jí)計(jì)算機(jī)。這款僅售249美元的開發(fā)者套件,以其卓越的性能和親民的價(jià)格,為商業(yè)AI開發(fā)者、愛好者和學(xué)生提供了一個(gè)強(qiáng)大的工具。英偉達(dá)CEO黃仁勛強(qiáng)調(diào),Jetson Orin Nano Super的性能提升了70%,每秒可執(zhí)行高達(dá)67萬億次的INT8運(yùn)算。

同時(shí),OpenAI也不甘示弱,推出了最強(qiáng)推理模型o1,其在多個(gè)基準(zhǔn)測(cè)試中超越人類專家,預(yù)示著通用人工智能(AGI)的進(jìn)一步發(fā)展。

OpenAI王炸新一波:向開發(fā)者開放滿血o1,全面超越人類博士專家

在為期12個(gè)工作日的線上新品和新技術(shù)發(fā)布活動(dòng)中,OpenAI的王炸又來了一波:將OpenAI的最強(qiáng)推理模型o1向開發(fā)者開放,用于開發(fā)語音類App的API中納入了收費(fèi)更低的先進(jìn)模型GPT-4o版本。

今年9月,OpenAI 發(fā)布了o1的預(yù)覽版o1 preview,稱o1是第一個(gè)具備真正通用推理能力的大模型,它的核心能力推理在測(cè)試化學(xué)、物理和生物學(xué)專業(yè)知識(shí)的基準(zhǔn)GPQA-diamond上得到了充分體現(xiàn)。

據(jù)OpenAI的評(píng)估,o1在該測(cè)試中全面超過了人類博士專家,準(zhǔn)確率達(dá)到78.3%,而人類專家的得分為69.7%。OpenAI稱,“通用人工智能(AGI)之路,已經(jīng)沒有任何阻礙”。此外,o1在多個(gè)高難度的推理基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,例如在美國數(shù)學(xué)邀請(qǐng)賽(AIME)中,o1的正確率達(dá)到了83.3%,遠(yuǎn)超其前身GPT-4o的表現(xiàn)。

12月5日,OpenAI在預(yù)告的連續(xù)12日王炸發(fā)布活動(dòng)首日就推出了正式版的o1,所謂滿血o1,它被納入ChatGPT Plus套餐。正式版o1支持多模態(tài)輸入,具備視覺推理能力。相比o1 preview版本,正式版o1的平均響應(yīng)速度快了60%,OpenAI還發(fā)現(xiàn)正式版o1在推理時(shí)犯重大錯(cuò)誤的頻率比o1 preview減少34%。

在包括編碼、數(shù)學(xué)和視覺推理任務(wù)在內(nèi)的一系列基準(zhǔn)測(cè)試中,正式版o1都相比預(yù)覽版取得了明顯進(jìn)步。例如在SWE-bench Verified基準(zhǔn)的編碼測(cè)試中,o1的評(píng)分從o1 preview的41.3提高到48.9,而以數(shù)學(xué)為重點(diǎn)的AIME測(cè)試中的評(píng)分甚至從42躍升至79.2。

O1的新功能為開發(fā)者提供更多幫助。比如結(jié)構(gòu)性輸出Structured Outputs功能讓響應(yīng)可靠地匹配自定義格式,如JSON模式,從而確保與外部系統(tǒng)交互時(shí)的一致性;函數(shù)調(diào)用Function calling功能簡化了將o1連接到API和數(shù)據(jù)庫的過程;對(duì)視覺輸入進(jìn)行推理的能力Vison capabilities發(fā)掘了制造、科學(xué)和編碼方面用例的前景。

開發(fā)人員還可以使用新的reasoning_effort參數(shù)微調(diào)o1的行為,該參數(shù)控制模型在任務(wù)上花費(fèi)的時(shí)間,以此平衡性能和響應(yīng)時(shí)間。

同時(shí),o1的延遲更低,對(duì)于給定的請(qǐng)求,o1使用的推理token比o1-preview平均少60%。

本周二OpenAI還更新了支持語音助手、實(shí)時(shí)翻譯工具等低延遲自然對(duì)話體驗(yàn)的Realtime API。OpenAI同時(shí)降低Realtime API的收費(fèi),將GPT-4o音頻的定價(jià)降低了60%,降至每100萬個(gè)輸入token收費(fèi)40美元,每100萬個(gè)輸出token收費(fèi)80美元。GPT-4o mini的文本token費(fèi)率也大幅下調(diào),輸入token起步價(jià)0.60美元,輸出token起步價(jià)2.40美元。

英偉達(dá)推出僅249美元的AI超級(jí)電腦 生成式AI性能提高達(dá)1.7倍

另外值得注意的是,英偉達(dá)當(dāng)?shù)貢r(shí)間12月17日推出了一款名為Jetson Orin Nano Super的生成式AI超級(jí)計(jì)算機(jī)。英偉達(dá)CEO黃仁勛表示,這款開發(fā)者套件通過軟件升級(jí)實(shí)現(xiàn)了更高性能和更低價(jià)格,僅售249美元,尺寸小巧,可放在手掌中,可將生成式AI性能提高高達(dá)1.7倍。

該公司表示,這款產(chǎn)品適合商業(yè)AI開發(fā)者、愛好者和學(xué)生,與其前代產(chǎn)品相比,其生成式AI推理性能提升了1.7倍,性能提高了70%,每秒可以執(zhí)行高達(dá)67萬億次的INT8運(yùn)算(67 INT8 TOPS),內(nèi)存帶寬也提升了50%,達(dá)到了102GB/s。

黃仁勛還特意為這款產(chǎn)品錄制了一段視頻,如同2021年發(fā)布Hopper H100時(shí)一樣,展現(xiàn)英偉達(dá)對(duì)這款產(chǎn)品的重視。在視頻中,黃仁勛表示,從Xavier開始,英偉達(dá)就創(chuàng)造了一種新的處理器,也就是機(jī)器人處理器,當(dāng)時(shí)沒人知道他們?cè)谧鍪裁础?/p>

黃仁勛表示,Jetson Orin Nano Super非常適合那些希望在生成式AI、機(jī)器人技術(shù)或計(jì)算機(jī)視覺領(lǐng)域發(fā)展技能的人士。在AI領(lǐng)域從任務(wù)專用模型向基礎(chǔ)模型轉(zhuǎn)變的趨勢(shì)下,它也為開發(fā)者提供了一個(gè)將創(chuàng)意變?yōu)楝F(xiàn)實(shí)的易用平臺(tái)。

Jetson Orin Nano Super性能增強(qiáng),為所有流行的生成式AI模型,例如Meta的LLaMA、阿里巴巴的通義千問以及谷歌的Gemma。這款套件基于Transformer的計(jì)算機(jī)視覺模型帶來了顯著提升,進(jìn)一步提升效能表現(xiàn)。

英偉達(dá)強(qiáng)調(diào),隨著AI技術(shù)逐漸從云端走向終端,實(shí)體AI將是下一波發(fā)展重點(diǎn),Jetson Orin Nano Super不僅可以用于開發(fā)聊天機(jī)器人,也適合簡歷視覺AI代理或部署AI機(jī)器人等應(yīng)用。

英偉達(dá)也宣布將為Jetson Orin NX和Nano系列的系統(tǒng)模塊提供軟件更新,讓它們也能享受到Super模式的性能提升,最高可達(dá)70%。這些更新將通過Jetpack SDK管理器發(fā)布在英偉達(dá)網(wǎng)站和GitHub上。

責(zé)任編輯: 胡青
聲明:證券時(shí)報(bào)力求信息真實(shí)、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實(shí)質(zhì)性投資建議,據(jù)此操作風(fēng)險(xiǎn)自擔(dān)
下載“證券時(shí)報(bào)”官方APP,或關(guān)注官方微信公眾號(hào),即可隨時(shí)了解股市動(dòng)態(tài),洞察政策信息,把握財(cái)富機(jī)會(huì)。
網(wǎng)友評(píng)論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評(píng)論僅供其表達(dá)個(gè)人看法,并不表明證券時(shí)報(bào)立場(chǎng)
暫無評(píng)論
為你推薦
時(shí)報(bào)熱榜
換一換
    熱點(diǎn)視頻
    換一換