廣義人工智能時代:通往通用人工智能(AGI)之路
By Imtiaz Adam
人工智能(AI)將于2024年進(jìn)一步改進(jìn),大型語言模型有望進(jìn)一步發(fā)展。
2023年對于人工智能和生成式人工智能來說是激動人心的一年,特別是那些采用大型語言模型(LLM)架構(gòu)的人工智能,比如來自開放人工智能(GPT 4)、Anthropic(Claude)和開源社區(qū)(Llama 2、Falcon、Mistral、Mixtral等)的模型,獲得了動力和快速采用。
2024年可能會是更加激動人心的一年,因為人工智能將成為包括CES 2024在內(nèi)的所有地方的中心舞臺,大型語言模型有望進(jìn)一步發(fā)展。
什么是人工智能(AI)以及我們處于什么階段?
人工智能涉及開發(fā)計算系統(tǒng)的領(lǐng)域,這些系統(tǒng)能夠執(zhí)行人類非常擅長的任務(wù),如識別物體,識別和理解語音,以及在受限環(huán)境下做出決策。
狹義人工智能(ANI):人工智能的一個領(lǐng)域,機器被設(shè)計為執(zhí)行單一任務(wù),并且機器非常擅長執(zhí)行該特定任務(wù)。然而,一旦機器被訓(xùn)練,就不能推廣到未知的領(lǐng)域。這是人工智能的形式,例如,Google翻譯,代表了我們直到最近所處的人工智能時代。
廣義人工智能(ABI):麻省理工學(xué)院IBM沃森實驗室解釋道:“廣義人工智能是下一個。我們剛剛進(jìn)入這個前沿領(lǐng)域,但當(dāng)它完全實現(xiàn)時,它將以使用和集成多模式數(shù)據(jù)流的人工智能系統(tǒng)為特色,更有效、更靈活地學(xué)習(xí),并跨越多個任務(wù)和領(lǐng)域。廣義的人工智能將對商業(yè)和社會產(chǎn)生強大的影響。”
IBM進(jìn)一步解釋:“在單一領(lǐng)域執(zhí)行特定任務(wù)的系統(tǒng)正在讓位于廣義的人工智能,后者可以更廣泛地學(xué)習(xí),并跨領(lǐng)域和跨問題工作。在大型未標(biāo)記數(shù)據(jù)集上訓(xùn)練并針對一系列應(yīng)用進(jìn)行微調(diào)的基礎(chǔ)模型正在推動這一轉(zhuǎn)變?!?/p>
廣義的人工智能能力是最近出現(xiàn)的,F(xiàn)rancois Chollet在2019年提出“即使是當(dāng)今最先進(jìn)的人工智能系統(tǒng)也不屬于這個類別......”
廣義人工智能是一個復(fù)雜的自適應(yīng)系統(tǒng),它憑借其感官知覺、先前的經(jīng)驗和學(xué)到的技能成功地執(zhí)行任何認(rèn)知任務(wù)。
但作者澄清,ABI模型不具備人腦的整體通用能力。
通用人工智能(AGI):人工智能的一種形式,可以完成人類可以完成的任何智力任務(wù)。它更有意識,做出的決策與人類的決策方式類似。它也被稱為“強人工智能”,IBM將AGI或強人工智能描述為擁有與人類同等的智能,具有自我意識和解決問題、學(xué)習(xí)和規(guī)劃未來的能力。實際上,它將產(chǎn)生“與人類思維沒有區(qū)別的智能機器”。
目前,AGI仍然是一個愿望,有各種預(yù)測,從2025年到2049年,甚至永遠(yuǎn)不會到來。它可能會在未來十年內(nèi)實現(xiàn),但面臨著硬件方面的挑戰(zhàn),即當(dāng)今強大機器所需的能源消耗。作者個人認(rèn)為,2030年代是一個比較有可能到來的時間。
超級人工智能(ASI):是一種在所有領(lǐng)域都超過人類表現(xiàn)的智能形式(由Nick Bostrom定義)。這是指一般智慧、解決問題和創(chuàng)造力等方面。作者個人的觀點是,人類將通過人機接口(可能是無線帽或耳機)來利用先進(jìn)的人工智能,成為ASI(未來可能是神經(jīng)擬態(tài)計算與量子能力的合并,被稱為量子神經(jīng)擬態(tài)計算)。
如今我們在人工智能方面處于什么位置?
Open AI的GPT-4的到來引發(fā)了社交媒體上的大量爭論,一些人認(rèn)為,由于GPT-4不是狹義的人工智能,因此它必須是通用人工智能(AGI)。作者將解釋后者并非如此。
AGI不太可能在一夜之間神奇地出現(xiàn),而更有可能通過人工智能研究和開發(fā)的持續(xù)進(jìn)化進(jìn)步過程而實現(xiàn)。
直到最近,我們一直處于狹義人工智能時代。然而,許多最先進(jìn)的(SOTA)模型現(xiàn)在可以超越狹義的人工智能(ANI),我們越來越多地體驗利用LLM的生成式AI模型,這些模型反過來又應(yīng)用具有自注意力機制架構(gòu)的變壓器,它們是能夠展示多模式、多任務(wù)處理能力。
然而,說當(dāng)前的SOTA模型處于人腦水平(AGI)是不準(zhǔn)確的,特別是在邏輯和推理任務(wù)方面,包括常識。
我們正處于廣義人工智能(或ABI)時代,在這個時代,生成式人工智能模型既不是狹義的,因為它們可以執(zhí)行多個任務(wù);但也不是AGI,因為它們沒有達(dá)到人類大腦的智力和能力水平。
科幻電影中的先進(jìn)機器人還沒有出現(xiàn)在我們的日常生活中,但是隨著人工智能技術(shù)的進(jìn)步,人工智能越來越多地嵌入到先進(jìn)的機器人中,機器人技術(shù)正在迅速發(fā)展,例如斯坦福大學(xué)的研究人員推出了移動Aloha機器人,它可以向人類學(xué)習(xí)做飯、打掃衛(wèi)生、洗衣服。
通往先進(jìn)人工智能能力的道路
內(nèi)存:據(jù)傳GPT-5將解決這個問題,其他模型也一直在尋求解決內(nèi)存問題,以便AI代理能夠回憶起之前的參與情況。此外,在記憶和LLM方面,值得注意的是Dale Schuurmann的論文(2023年)以及Jesus Rodriguez提供的概述,還有Langchain的潛力、王等人(2023)發(fā)表了用長期記憶增強語言模型。邏輯、推理、因果推理:常識和因果推理是LLM和深度神經(jīng)網(wǎng)絡(luò)/機器學(xué)習(xí)模型的其他領(lǐng)域經(jīng)常遇到困難的領(lǐng)域。雖然思維鏈(CoT)已顯示出希望,但生成式AI模型仍遠(yuǎn)未達(dá)到先進(jìn)的人類邏輯推理水平。神經(jīng)符號方法,包括通過LLM插件利用符號人工智能,可能有助于在未來解決這些問題,并為通向AGI開辟道路。從更小的數(shù)據(jù)集學(xué)習(xí):零樣本學(xué)習(xí)和零樣本提示,以及具有自關(guān)注機制的變壓器采用自監(jiān)督學(xué)習(xí),以提高人工智能能力的狀態(tài)。微調(diào),師生模型初始訓(xùn)練之外,持續(xù)更新的世界知識–RAG:檢索增強生成使LLM模型能夠通過互聯(lián)網(wǎng)連接到外部數(shù)據(jù)源,或通過Langchain或LlamaIndex等框架連接到私有數(shù)據(jù),并檢索最新信息。對不確定世界的動態(tài)響應(yīng)/動態(tài)學(xué)習(xí)。多模式多任務(wù)處理:LLM正在開發(fā)多模式、多任務(wù)處理功能,Open AI的GPT 5預(yù)計將展示這些功能,其他模型也是如此。數(shù)據(jù):訪問、有效且高效的存儲、安全性和質(zhì)量都是人工智能模型的關(guān)鍵。越來越多的合成數(shù)據(jù)本身可能是由生成式人工智能模型創(chuàng)建的,可能在人工智能的發(fā)展中發(fā)揮關(guān)鍵作用。模型行為-強化學(xué)習(xí)(RL):將人類反饋強化學(xué)習(xí)(RLHF)應(yīng)用于LLM,以減少偏差,同時提高性能、公平性和代表性。RLHF需要一個動態(tài)環(huán)境,在這個環(huán)境中,當(dāng)AI代理進(jìn)入一個新的狀態(tài)(AI代理采取的行動)時,它會尋求最大的獎勵(獲得最優(yōu)或至少更好的行動),并在什么是RLHF中提供了一個很好的概述。提高LLM效率的技術(shù)
科術(shù)專業(yè)和開源社區(qū)一直在推進(jìn)使LLM模型更加高效的方法。對于開源社區(qū)而言,尋找效率的解決方案非常重要,因為社區(qū)中許多人缺乏大型專業(yè)的資源。然而,即使是技術(shù)專業(yè)人士也越來越意識到,將大規(guī)模的LLM模型擴展到大量用戶會導(dǎo)致巨大的服務(wù)器成本和能源成本,從而對碳足跡不利。
使生成式AI模型更加高效的進(jìn)步示例:
LoRA:是一種在訓(xùn)練過程中顯著減少參數(shù)數(shù)量的技術(shù),它通過將更少數(shù)量的新權(quán)重插入模型中而只訓(xùn)練這些新權(quán)重來實現(xiàn)。這反過來又導(dǎo)致訓(xùn)練過程顯著更快,內(nèi)存效率更高,并且由于降低了模型權(quán)重而更容易共享和存儲。Flash Attention是另一項創(chuàng)新,它可以快速和高效地利用內(nèi)存,具有輸入和輸出意識的精確注意力。模型修剪:可以對這些非必要的組件進(jìn)行修剪,使模型更加緊湊,同時保持模型的性能。LLM量化:量化是一種壓縮技術(shù),可將這些參數(shù)轉(zhuǎn)換為單字節(jié)或更小的整數(shù),從而顯著減小LLM的大小。
此外,硬件解決方案還可以提高計算資源效率,從而節(jié)省能源和減少碳足跡,例如第五代英特爾至強可擴展處理器、IBM正在利用模擬AI芯片等開展的工作。這將推動AIoT的興起,在電力有限的環(huán)境中,人工智能可以跨設(shè)備擴展網(wǎng)絡(luò)邊緣,而效率和低延遲是關(guān)鍵。
企業(yè)可能希望考慮平衡性能能力與資源成本(包括能源和碳足跡的計算成本),和硬件的凈現(xiàn)值回報(NPV)或投資回報(ROI)的模型架構(gòu)。高效的硬件,如第五代英特爾至強可擴展處理器可能提供,特別是對于推理和/或微調(diào)模型低延遲小于200億個參數(shù)的模型,如作者之前提出的。
作者認(rèn)為,從長遠(yuǎn)來看,量子計算可能為推動人工智能邁向ASI提供潛在的途徑,然而,峰值神經(jīng)網(wǎng)絡(luò)與樹突計算和神經(jīng)形態(tài)計算相結(jié)合,可能會為AGI(也很節(jié)能)提供一條可能的途徑。
與深度學(xué)習(xí)中典型的人工神經(jīng)網(wǎng)絡(luò)(ANN)架構(gòu)相比,峰值神經(jīng)網(wǎng)絡(luò)(SNN)與樹突計算相結(jié)合時,更接近我們自己的人類大腦。相對于人工神經(jīng)網(wǎng)絡(luò),SNN更節(jié)能,并且可以被設(shè)計成超低延遲,可以參與持續(xù)學(xué)習(xí),并且由于它們可以部署在網(wǎng)絡(luò)的邊緣,因此數(shù)據(jù)更加安全
神經(jīng)科學(xué)家發(fā)現(xiàn)樹突有助于解釋我們大腦獨特的計算能力,據(jù)報道,科學(xué)家首次觀察到人腦內(nèi)一種被認(rèn)為是獨特的細(xì)胞信息傳遞形式,并可能表明我們的人腦擁有比之前認(rèn)為的更強大的計算能力。
研究已經(jīng)闡明了樹突放大的潛在計算優(yōu)勢,以及利用樹突特性推進(jìn)機器學(xué)習(xí)和神經(jīng)啟發(fā)計算的潛力。
此外,研究還表明,僅靠樹突就可以執(zhí)行復(fù)雜的計算,因此單個神經(jīng)元的多并行處理能力遠(yuǎn)遠(yuǎn)超出了常規(guī)假設(shè)。
研究人員正在尋求更好地了解記憶如何存儲在大腦內(nèi)的樹突棘中,以及治療阿爾茨海默氏癥等疾病的潛力。這表明樹突在人腦中發(fā)揮著重要作用,但ANN架構(gòu)并不具有樹突。
而且,樹突預(yù)處理已被證明可以減少閾值性能所需的網(wǎng)絡(luò)大小。此外,具有樹突計算的SNN可能需要以瓦數(shù)而不是兆瓦數(shù)運行。
通過利用模擬信號和連續(xù)動態(tài),神經(jīng)形態(tài)計算可以提高人工智能應(yīng)用的速度、準(zhǔn)確性和適應(yīng)性,同時克服傳統(tǒng)計算的限制,例如延遲、功耗和可擴展性。
這將導(dǎo)致萬物互聯(lián)(IoE),其中高效的人工智能代理將超越本地所有互聯(lián)網(wǎng)連接設(shè)備,提供智能響應(yīng),從而在所有交互中實現(xiàn)大規(guī)模的超個性化,進(jìn)而稱為AIoE。
AIoT以及隨后的AloE是一個設(shè)備相互通信,并與人類動態(tài)交互的世界。
總結(jié)
本文是對人工智能現(xiàn)狀的戰(zhàn)略分析。進(jìn)入人工智能和LLM領(lǐng)域,總是充滿未知及挑戰(zhàn),畢竟在這個廣義的人工智能時代,探索通往通用人工智能(AGI)的路,還很長。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- Meta開源AI模型:視頻理解新篇章,讓AI看懂世界
- 谷歌發(fā)布 AI 基準(zhǔn):揭秘大語言模型“真相”,Gemini、GPT-4o、Claude 接受挑戰(zhàn)
- 2024中國高校計算機大賽-人工智能創(chuàng)意賽在中華世紀(jì)壇落幕,小學(xué)生投出TOP人氣獎
- AI助力混凝土延長壽命至200年,創(chuàng)新科技為建筑行業(yè)賦能
- 明年中國智能家居市場穩(wěn)健增長,2.8億臺出貨量再創(chuàng)新高
- 字節(jié)跳動發(fā)布豆包新模型:視覺理解與3D生成,音樂創(chuàng)作新紀(jì)元來臨
- 通義應(yīng)用團隊拆分阿里云,轉(zhuǎn)投智能信息事業(yè)群,揭秘企業(yè)動態(tài)新趨勢
- AI初創(chuàng)公司Databricks宣布融資100億美元,估值為620億美元
- ChatGPT搜索功能更新升級 真正的AI助理來了
- 字節(jié)跳動與中興通訊合作成立新品牌?回應(yīng)來了
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。