5月14日消息,今日凌晨,OpenAI正式發(fā)布了新一代的旗艦模型GPT-4o,可以利用語音、視頻和文本信息進行實時推理。
據(jù)介紹,GPT-4o在英文文本和代碼中的表現(xiàn)與GPT-4 Turbo相當,但在非英文文本上的能力大幅提升,在視頻和音頻的理解上,GPT-4o要明顯強于當前的其他模型。
此外,能力更全面的GPT-4o,響應速度也更快,最快232毫秒響應音頻輸入,平均響應時間為320毫秒,與人類在對話中的響應速度相當。
除了更強、更全面的能力,OpenAI也在推動GPT-4o更廣泛的應用。GPT-4o的文本和圖片功能自推出之日起就向ChatGPT推送,ChatGPT用戶可免費使用,ChatGPT Plus用戶的數(shù)據(jù)量上限將是免費用戶的5倍,新版本的音頻模式將在未來幾周向ChatGPT Plus用戶推送。
TechWeb第一時間對GPT-4o進行了實測,不過目前免費用戶還不能使用圖片生成功能。我們使用GPT-4o來描述圖片,并讓其分別對一張中文圖表和一張英文圖表進行了分析,來看看結果。
我們首先讓GPT-4o描述了一張圖片,發(fā)現(xiàn)描述的非常準確,并可以對單獨人物的動作進行描述,最后還可以用文字來分析該圖片場景。
隨后是一張中文圖表,不但可以讀懂上面的數(shù)字含義,還可以對差異和趨勢進行非常詳細的分析。
最后是一張英文圖表,GPT-4o可以讀懂并翻譯圖表展示的數(shù)據(jù)內容,最后根據(jù)圖表數(shù)據(jù)總結得出分析結論。
總體來說,GPT-4o的能力的確有了很大的提升,未來在所有功能開放的時候,TechWeb也將繼續(xù)為大家?guī)砀敿毜膶崪y體驗。(蕭健)
(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )