7月19日消息, OpenAI宣布推出GPT-4o mini模型,并稱其為最具成本效益的小型模型。GPT-4o mini 可以替代 GPT-3.5 Turbo,對(duì)標(biāo)的是 Claude 3 Haiku 和 Gemini 1.5 Flash, OpenAI預(yù)計(jì)GPT-4o mini更加經(jīng)濟(jì)實(shí)惠,將能顯著擴(kuò)大使用人工智能構(gòu)建的應(yīng)用范圍。
據(jù)悉,GPT-4o mini在MMLU上的得分為82%,目前在 LMSYS 排行榜的聊天方面分?jǐn)?shù)優(yōu)于 GPT-4。
GPT-4o mini 的商用價(jià)格是每百萬(wàn)輸入 token 15 美分,每百萬(wàn)輸出 token 60 美分,比GPT-3.5 Turbo便宜60%以上。
GPT-4o-mini在API(應(yīng)用程序編程接口)中支持文本和視覺(jué),并在未來(lái)支持文本、圖像、視頻和音頻輸入和輸出。該模型具有 128K token 的上下文窗口,知識(shí)截至 2023 年 10 月。得益于與 GPT-4o 共享的改進(jìn)版 tokenizer,處理非英語(yǔ)文本能力也更加經(jīng)濟(jì)高效。
具有卓越文本智能和多模態(tài)推理的小型模型
GPT-4o mini在文本智能和多模式推理的學(xué)術(shù)基準(zhǔn)上超越了GPT-3.5 Turbo和其他小型模型,并支持與GPT-4o相同的語(yǔ)言范圍。
GPT-4o mini還展示了函數(shù)調(diào)用的強(qiáng)大性能,這使開(kāi)發(fā)人員能夠構(gòu)建獲取數(shù)據(jù)或與外部系統(tǒng)進(jìn)行操作的應(yīng)用程序,與GPT-3.5 Turbo相比,它還提高了長(zhǎng)上下文性能。
GPT-4o mini已經(jīng)在多個(gè)關(guān)鍵基準(zhǔn)測(cè)試中進(jìn)行了評(píng)估:
推理任務(wù):GPT-4o mini在涉及文本和視覺(jué)的推理任務(wù)中優(yōu)于其他小型模型,在文本智能和推理基準(zhǔn)MMLU上的得分為82.0%,而Gemini Flash的得分為77.9%,Claude Haiku的得分為73.8%。
數(shù)學(xué)和編碼能力:GPT-4o mini在數(shù)學(xué)推理和編碼任務(wù)方面表現(xiàn)出色,優(yōu)于市場(chǎng)上其他小型模型。在測(cè)量數(shù)學(xué)推理的MGSM上,GPT-4o mini的得分為87.0%,而Gemini Flash的得分為75.5%,Claude Haiku的得分為71.7%。
GPT-4o mini在衡量編碼性能的HumanEval上的得分為87.2%,而Gemini Flash的得分為71.5%,Claude Haiku的得分為75.9%。
多模態(tài)推理:GPT-4o mini在多模態(tài)推理評(píng)估MMMU上也表現(xiàn)出色,得分為59.4%,而Gemini Flash和Claude Haiku的得分分別為56.1%和50.2%。
安全性方面,GPT-4o mini 內(nèi)置了與 GPT-4o 相同的安全緩解措施,OpenAI 根據(jù) Preparedness Framework 和自愿承諾,通過(guò)自動(dòng)和人工評(píng)估對(duì)其進(jìn)行了仔細(xì)評(píng)估。70 多名社會(huì)心理學(xué)和錯(cuò)誤信息等領(lǐng)域的外部專家對(duì) GPT-4o 進(jìn)行了測(cè)試,以確定潛在風(fēng)險(xiǎn),這些問(wèn)題的解決方法會(huì)在即將發(fā)布的 GPT-4o system card 和 Preparedness 記分卡中分享。這些專家評(píng)估得出的見(jiàn)解有助于提高 GPT-4o 和 GPT-4o mini 的安全性。
可用性和定價(jià)
GPT-4o-mini現(xiàn)在可以作為文本和視覺(jué)模型在 Assistant API、Chat Completions API 和 Batch API 中使用。開(kāi)發(fā)人員每 100 萬(wàn)輸入 token 價(jià)格為 15 美分,每 100 萬(wàn)輸出 token(大約相當(dāng)于一本標(biāo)準(zhǔn)書(shū)的 2500 頁(yè))價(jià)格為 60 美分。
OpenAI 計(jì)劃在未來(lái)幾天推出GPT-4o mini的微調(diào)版。
從今天開(kāi)始,在ChatGPT中,F(xiàn)ree、Plus和Team用戶能夠訪問(wèn)GPT-4o mini,以代替取代 GPT-3.5 Turbo。
企業(yè)用戶將從下周開(kāi)始獲得訪問(wèn)權(quán)限。
OpenAI 表示,在過(guò)去的幾年里見(jiàn)證了人工智能的顯著進(jìn)步,同時(shí)成本大幅降低。例如,自 2022 年 OpenAI 推出功能較弱的模型 text-davinci-003 ,至如今的 GPT-4o mini ,每個(gè) token 成本已下降了 99%。OpenAI 致力于繼續(xù)降低成本,同時(shí)增強(qiáng)模型功能。人工智能正變得越來(lái)越容易獲得、可靠,并嵌入我們的日常數(shù)字體驗(yàn)中。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- TechWeb一周熱點(diǎn)匯總:特斯拉下月量產(chǎn)改款Model Y,阿里“甩賣”銀泰
- 蔚來(lái)第三品牌firefly螢火蟲(chóng)首款車型正式亮相 預(yù)售價(jià)14.88萬(wàn)元
- 首發(fā)線控轉(zhuǎn)向等多項(xiàng)技術(shù) 蔚來(lái)旗艦車型ET9正式上市:78.8萬(wàn)元起
- Fortinet李宏凱:2025年在中國(guó)大陸啟動(dòng)SASE PoP節(jié)點(diǎn)部署 助力企業(yè)出海
- Fortinet李宏凱:2024年Fortinet全球客戶已超80萬(wàn)
- 網(wǎng)信辦:從嚴(yán)打擊網(wǎng)上侵害未成年人合法權(quán)益行為
- 豆包大模型全面升級(jí),相關(guān)概念股瘋漲,字節(jié)發(fā)布緊急警示
- TechWeb微晚報(bào):“小紅書(shū)封號(hào)”沖上熱搜,小米YU7無(wú)偽裝實(shí)車首次曝光
- “小米SU7墜崖一家四口安然無(wú)恙”沖上熱搜 車主回應(yīng)
- 奇富科技發(fā)布AI產(chǎn)品小奇等金融AI大模型成果
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。