OpenAI是一家以追求通用人工智能為目標(biāo)的研究機(jī)構(gòu),為AI研究和社區(qū)提供了一系列高性能的研究成果和開(kāi)源模型。其使命在于構(gòu)建出高度自主并在大多數(shù)工作崗位上達(dá)到或者超過(guò)人類(lèi)的表現(xiàn),為人類(lèi)提供安全、共贏的人工智能系統(tǒng)。
但純粹的研究理想也需要負(fù)擔(dān)龐大的科研開(kāi)銷(xiāo),為了平衡使命和現(xiàn)實(shí),OpenAI開(kāi)始嘗試將研發(fā)出的高性能算法GPT-3構(gòu)建成API以實(shí)現(xiàn)商業(yè)化,以反哺消耗巨大的研究,同時(shí)促進(jìn)算法和研究的進(jìn)一步迭代改進(jìn)。
基于這一強(qiáng)大的自然語(yǔ)言模型,OpenAI發(fā)布了一款通用的文本處理接口,與先前為特定目標(biāo)設(shè)計(jì)的AI系統(tǒng)不同的是,此API可以允許用戶(hù)任務(wù)嘗試任意英文語(yǔ)言任務(wù)。研究人員和開(kāi)發(fā)者可以利用它構(gòu)建更為優(yōu)秀的產(chǎn)品或者更具智能化水平的應(yīng)用,同時(shí)還能為探索這一技術(shù)的優(yōu)點(diǎn)和局限做出貢獻(xiàn)。目前已經(jīng)有十多個(gè)公司利用這一API在語(yǔ)義搜索、聊天機(jī)器人、客戶(hù)服務(wù)、文本生成、生產(chǎn)力工具和內(nèi)容補(bǔ)全等方面開(kāi)發(fā)了一系列有效的產(chǎn)品。
在強(qiáng)大的語(yǔ)言模型下,API可以實(shí)現(xiàn)對(duì)于輸入文本信息模式的有效學(xué)習(xí)和處理。用戶(hù)可以用少數(shù)幾個(gè)樣本對(duì)模型進(jìn)行“編程”,使它按照你的方式來(lái)回答問(wèn)題。下圖中顯示了調(diào)用API的一個(gè)樣例,可以看到在提供了一個(gè)問(wèn)答樣本后(紅框中),模型可以根據(jù)問(wèn)答樣例的語(yǔ)言模式回答新的問(wèn)題(藍(lán)色)。模型不僅可以實(shí)現(xiàn)問(wèn)答任務(wù),還顯示出了其中已經(jīng)涵蓋了非常豐富的語(yǔ)料和知識(shí)信息。
用戶(hù)可以按照這種方式對(duì)模型進(jìn)行定制化的打磨,一方面通過(guò)數(shù)據(jù)集(大數(shù)據(jù)或者是少量數(shù)據(jù))對(duì)模型進(jìn)行調(diào)優(yōu)訓(xùn)練,另一方面也可以通過(guò)人機(jī)交互的反饋來(lái)對(duì)模型的輸出進(jìn)行改進(jìn)。
此API同時(shí)兼顧了易用性和靈活性,一方面可以讓任何人都有接入最前沿人工智能技術(shù)的簡(jiǎn)單方式,同時(shí)也為研究人員提供了增加生產(chǎn)力的靈活方式,使得團(tuán)隊(duì)可以集中精力處理機(jī)器學(xué)習(xí)的核心問(wèn)題。目前支持該API的是最新的GPT-3模型,GPT-3是OpenAI最近發(fā)布的非常強(qiáng)大的自然語(yǔ)言處理模型,完整模型包含了175 billion的參數(shù)。下表顯示了GPT-3相關(guān)模型的架構(gòu)和參數(shù)量。
機(jī)器學(xué)習(xí)領(lǐng)域的發(fā)展一日千里,所以背后所支撐的處理流程和模型也在不斷迭代和更新。下面幾個(gè)小視頻展示了如何應(yīng)用這一API到用戶(hù)的日常工作生活中,以此來(lái)解決問(wèn)題并提高生產(chǎn)力。
針對(duì)電子表格的制作,Tabulate插件提供了結(jié)構(gòu)化的表格生成方案。用戶(hù)僅僅需要輸入想要制表的主體,模型就能生成比較理想的表頭。在少量的修改后,選擇填充表格模型就能從已有知識(shí)中填充出內(nèi)容。這一例子中顯示了公司名稱(chēng)、代碼和上市的年份。為了聚焦互聯(lián)網(wǎng)公司,只需要輸入兩個(gè)互聯(lián)網(wǎng)公司的名字,模型就能找到相關(guān)內(nèi)內(nèi)容進(jìn)行填充,還能按照創(chuàng)立年份排序。此外還能夠從非結(jié)構(gòu)文本中對(duì)文本信息進(jìn)行結(jié)構(gòu)化填充!突然感覺(jué)以后不用做excel了
第二個(gè)例子是利用模型對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行語(yǔ)義搜索。比如你打開(kāi)了一個(gè)wiki百科頁(yè)面來(lái)尋找答案,現(xiàn)在再也不需要一字一句讀完整篇文章了,只需要利用網(wǎng)頁(yè)插件輸出你想要問(wèn)的問(wèn)題,模型就能根據(jù)語(yǔ)義搜索到頁(yè)面中對(duì)應(yīng)的段落,不僅解答了你的疑問(wèn)還能對(duì)文本位置進(jìn)行定位,大幅度地提高了資料檢索的效率。
下面的例子完整地展示了如何構(gòu)建個(gè)性化的應(yīng)用,通過(guò)簡(jiǎn)單的linux指令和對(duì)應(yīng)含義的描述,就能構(gòu)建出一條語(yǔ)義操作模型。直接輸出各種口語(yǔ)化表達(dá)模型,就能生成對(duì)應(yīng)的命令和命令組合來(lái)實(shí)現(xiàn)你想要的結(jié)果。這個(gè)例子中,我們看到了API將人機(jī)交互簡(jiǎn)化到了何種程度,極大地減少了初學(xué)者的學(xué)習(xí)成本、提高了使用者的利用效率,看來(lái)用自然語(yǔ)言和計(jì)算機(jī)交互的時(shí)代已經(jīng)非常近了。
但技術(shù)的進(jìn)步是一把雙刃劍,在大規(guī)模應(yīng)用的同時(shí)也需要避免惡意使用。API在源頭已經(jīng)切斷了一系列明顯的惡意應(yīng)用,包括騷擾、垃圾郵件、激進(jìn)言論和病毒營(yíng)銷(xiāo)等,但想要窮盡所有可能的惡意應(yīng)用是不可能的,除了產(chǎn)品開(kāi)發(fā)者的把控,更需要社區(qū)的努力。開(kāi)發(fā)者可以探索控制API返回惡意內(nèi)容的工具,研究人員需要在語(yǔ)言模型的安全方面進(jìn)行更加深入的研究(包括對(duì)于有害偏見(jiàn)的分析檢測(cè)、緩和與阻斷等等)。
123下一頁(yè)>(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )