OpenAI正在開發(fā)名為“草莓”的AI項(xiàng)目,以提升其模型的高級推理能力,力求實(shí)現(xiàn)自主互聯(lián)網(wǎng)導(dǎo)航與深度研究。
OpenAI正在開發(fā)一個(gè)名為“草莓”(Strawberry)的新項(xiàng)目,這一消息來自知情人士和路透社審查的內(nèi)部文件。
這個(gè)項(xiàng)目的細(xì)節(jié)此前從未被報(bào)道。微軟支持的這家初創(chuàng)公司正在加緊展示其模型能夠提供先進(jìn)推理能力。
根據(jù)路透社5月看到的一份OpenAI內(nèi)部文件,OpenAI內(nèi)部團(tuán)隊(duì)正在進(jìn)行“草莓”項(xiàng)目。路透社無法確定文件的具體日期,但文件詳細(xì)說明了OpenAI計(jì)劃如何利用“草莓”進(jìn)行研究。消息人士將該計(jì)劃描述為一個(gè)正在進(jìn)行中的項(xiàng)目。路透社無法確定“草莓”距離公開發(fā)布有多近。
消息人士稱,“草莓”的工作原理在OpenAI內(nèi)部也是一個(gè)高度保密的秘密。
該文件描述了一個(gè)使用“草莓”模型的項(xiàng)目,旨在讓公司的AI不僅能夠生成答案,還能提前計(jì)劃,足夠可靠地自主導(dǎo)航互聯(lián)網(wǎng),執(zhí)行OpenAI稱之為“深度研究”的任務(wù)。
根據(jù)與十多位AI研究人員的采訪,這種能力目前尚未被AI模型實(shí)現(xiàn)。
當(dāng)被問及“草莓”和這篇報(bào)道中提到的細(xì)節(jié)時(shí),OpenAI的一位發(fā)言人在一份聲明中表示:“我們希望我們的AI模型能像我們一樣看到和理解世界。持續(xù)研究新的AI能力是行業(yè)中的常見做法,大家普遍認(rèn)為這些系統(tǒng)的推理能力會隨著時(shí)間的推移而改進(jìn)?!?/p>
這位發(fā)言人沒有直接回應(yīng)有關(guān)“草莓”的問題。
“草莓”項(xiàng)目曾被稱為Q*,路透社去年報(bào)道,這個(gè)項(xiàng)目在公司內(nèi)部已經(jīng)被視為一次突破。
兩位消息人士描述了今年早些時(shí)候看到的Q*演示,OpenAI工作人員告訴他們這些演示能夠回答目前市面上模型無法回答的復(fù)雜科學(xué)和數(shù)學(xué)問題。
據(jù)彭博社報(bào)道,周二在一次內(nèi)部全體會議上,OpenAI展示了一個(gè)研究項(xiàng)目的演示,聲稱該項(xiàng)目具有新的類似人類的推理能力。OpenAI的一位發(fā)言人確認(rèn)了這次會議,但拒絕提供內(nèi)容的詳細(xì)信息。路透社無法確定展示的項(xiàng)目是否為“草莓”。
熟悉此事的人士表示,OpenAI希望這一創(chuàng)新能顯著提升其AI模型的推理能力,補(bǔ)充說“草莓”涉及一種特殊的方式來處理AI模型,該模型在預(yù)訓(xùn)練了大量數(shù)據(jù)集后進(jìn)行。
接受路透社采訪的研究人員表示,推理是AI實(shí)現(xiàn)人類或超人類智能的關(guān)鍵。
雖然大型語言模型已經(jīng)能夠快速總結(jié)密集文本和創(chuàng)作優(yōu)美的文章,但在解決一些對人類來說直覺性的常識問題時(shí),這項(xiàng)技術(shù)常常表現(xiàn)不佳,比如識別邏輯謬誤和玩井字棋。當(dāng)模型遇到這些問題時(shí),往往會產(chǎn)生虛假的信息。
路透社采訪的AI研究人員普遍認(rèn)為,在AI中,推理涉及到形成一個(gè)模型,使得AI能夠提前計(jì)劃,反映物理世界的運(yùn)作方式,并可靠地解決復(fù)雜的多步驟問題。
提升AI模型的推理能力被視為實(shí)現(xiàn)從重大科學(xué)發(fā)現(xiàn)到規(guī)劃和構(gòu)建新軟件應(yīng)用程序等一切能力的關(guān)鍵。
OpenAI的CEO Sam Altman今年早些時(shí)候表示,在AI領(lǐng)域,“最重要的進(jìn)展領(lǐng)域?qū)⑹峭评砟芰Α薄?/p>
Google、Meta和Microsoft等公司也在嘗試不同的技術(shù)以改進(jìn)AI模型的推理能力,幾乎所有進(jìn)行AI研究的學(xué)術(shù)實(shí)驗(yàn)室也是如此。然而,研究人員對大型語言模型(LLM)是否能夠?qū)⑾敕ê烷L期規(guī)劃融入其預(yù)測方式存在分歧。例如,現(xiàn)代AI的先驅(qū)之一、在Meta工作的Yann LeCun,經(jīng)常表示LLM無法實(shí)現(xiàn)類似人類的推理。
AI挑戰(zhàn)
熟悉此事的消息人士稱,“草莓”是OpenAI計(jì)劃克服這些挑戰(zhàn)的關(guān)鍵組成部分。路透社看到的文件描述了“草莓”旨在實(shí)現(xiàn)的目標(biāo),但沒有說明具體實(shí)現(xiàn)方式。
據(jù)四位了解公司情況的人士透露,最近幾個(gè)月,OpenAI私下向開發(fā)者和其他外部人士暗示,他們即將推出具有顯著更先進(jìn)推理能力的技術(shù)。這些人拒絕透露身份,因?yàn)樗麄儧]有被授權(quán)談?wù)撍饺耸聞?wù)。
據(jù)其中一位消息人士稱,“草莓”包括一種專門的“后訓(xùn)練”O(jiān)penAI生成AI模型的方法,即在模型已經(jīng)“訓(xùn)練”了大量通用數(shù)據(jù)后,調(diào)整基本模型以特定方式提升其性能。
開發(fā)模型的后訓(xùn)練階段涉及“微調(diào)”等方法,這是幾乎所有語言模型今天都在使用的過程,有多種形式,例如讓人類根據(jù)模型的響應(yīng)提供反饋,并向其提供好的和壞的答案示例。
據(jù)知情人士透露,“草莓”與斯坦福大學(xué)2022年開發(fā)的一種方法“自我教學(xué)推理者”(Self-Taught Reasoner, 簡稱“STaR”)有相似之處。STaR使AI模型能夠通過反復(fù)創(chuàng)建自己的訓(xùn)練數(shù)據(jù)來自我提升智能水平,理論上可用于讓語言模型超越人類智能水平,其創(chuàng)造者之一、斯坦福大學(xué)教授Noah Goodman告訴路透社。
Goodman說:“我認(rèn)為這既令人興奮又可怕……如果事情朝這個(gè)方向發(fā)展,我們作為人類有一些嚴(yán)肅的事情需要考慮?!?Goodman不隸屬于OpenAI,對“草莓”也不了解。
據(jù)文件顯示,OpenAI希望“草莓”能夠完成長周期任務(wù)(LHT),即需要模型提前計(jì)劃并在較長時(shí)間內(nèi)執(zhí)行一系列動作的復(fù)雜任務(wù)。
為了實(shí)現(xiàn)這一目標(biāo),OpenAI正在創(chuàng)建、訓(xùn)練和評估一種“深度研究”數(shù)據(jù)集。據(jù)OpenAI內(nèi)部文件稱,路透社無法確定該數(shù)據(jù)集的具體內(nèi)容或所需的長時(shí)間范圍。
根據(jù)文件和其中一位消息人士,OpenAI特別希望其模型使用這些能力通過“CUA”(計(jì)算機(jī)使用代理)自主瀏覽互聯(lián)網(wǎng),進(jìn)行研究,并根據(jù)發(fā)現(xiàn)采取行動。OpenAI還計(jì)劃測試其在軟件和機(jī)器學(xué)習(xí)工程師工作中的能力。
本文譯自 Reuters,由 BALI 編輯發(fā)布。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )