科技云報(bào)道原創(chuàng)。
一年前,ChatGPT橫空出世;7個(gè)多月后,Meta宣布開(kāi)源LLaMA 2,并且可免費(fèi)商用。
這一天,也成為大模型發(fā)展的分水嶺。短時(shí)間內(nèi),LLaMA 2對(duì)一些閉源的大模型廠(chǎng)商造成了致命性的打擊。
隨后,全球頭部廠(chǎng)商和創(chuàng)業(yè)公司紛紛加入開(kāi)源浪潮中。目前,國(guó)內(nèi)也有近一半的大模型選擇了開(kāi)源的方式:
今年7月,智譜AI宣布開(kāi)源大模型ChatGLM-6B和ChatGLM2-6B,這兩個(gè)模型的下載量已經(jīng)先后超過(guò)300萬(wàn)和120萬(wàn)。8月,阿里宣布開(kāi)源通義千問(wèn)70億參數(shù)模型Qwen-7B,一個(gè)多月下載量破100萬(wàn);12月,阿里持續(xù)開(kāi)源通義千問(wèn)720億參數(shù)模型Qwen-72B、18億參數(shù)模型Qwen-1.8B和音頻大模型Qwen-Audio。9月,百川智能宣布開(kāi)源Baichuan-7B、13B兩款大模型,其下載量目前已經(jīng)突破500萬(wàn),200多家企業(yè)申請(qǐng)部署開(kāi)源大模型。11月,元象XVERSE宣布開(kāi)源650億參數(shù)高性能通用大模型XVERSE-65B;11月底,浪潮信息發(fā)布完全開(kāi)源且可免費(fèi)商用的源2.0基礎(chǔ)大模型,包含1026億、518億、21億不同參數(shù)規(guī)模......
僅僅在過(guò)去的一個(gè)月內(nèi),國(guó)內(nèi)最大開(kāi)源模型的參數(shù)紀(jì)錄就已經(jīng)被刷新了N次。性能參數(shù)、性?xún)r(jià)比、可靠性,正成為搶占先機(jī)的關(guān)鍵詞,而開(kāi)源似乎也成為大模型發(fā)展的主流趨勢(shì)。
開(kāi)源大模型快速趕超
開(kāi)源大模型的核心理念是開(kāi)放源代碼,允許公眾訪(fǎng)問(wèn)、使用、修改和分發(fā)模型的源代碼。
面對(duì)市場(chǎng)競(jìng)爭(zhēng),開(kāi)源大模型的免費(fèi)使用是非常有吸引力的獲客手段;同時(shí),低成本的試錯(cuò)也有助于開(kāi)源大模型更快觸達(dá)潛在用戶(hù)群體,降低企業(yè)認(rèn)知和決策難度,加速創(chuàng)新。
從技術(shù)角度看,大模型涉及許多技術(shù)問(wèn)題,單靠一家企業(yè)很難解決。開(kāi)源大模型鼓勵(lì)全球開(kāi)發(fā)者社區(qū)的參與和貢獻(xiàn),這種集體智慧能夠加速技術(shù)的迭代和創(chuàng)新,如GitHub上的眾多AI項(xiàng)目就證明了這一點(diǎn)。
不僅如此,開(kāi)源代碼使得研究人員和用戶(hù)能夠?qū)彶槟P偷墓ぷ髟砗蜎Q策過(guò)程,從而提高大模型的透明度和可信賴(lài)性。這對(duì)于解決AI的公平性、偏見(jiàn)和倫理問(wèn)題至關(guān)重要。
事實(shí)上,自從LLaMA 2開(kāi)源后,業(yè)界開(kāi)始意識(shí)到大模型技術(shù)沒(méi)有任何護(hù)欄。
基于成本的考慮,許多企業(yè)選擇放棄支付上千萬(wàn)元的調(diào)用閉源大模型API的費(fèi)用,轉(zhuǎn)而部署和微調(diào)LLaMA 2。
創(chuàng)業(yè)者們的目光從解構(gòu)、增強(qiáng)LLaMA 2轉(zhuǎn)向了構(gòu)建行業(yè)專(zhuān)有大模型,又掀起了一波LLaMA 2+司法、LLaMA 2+醫(yī)療等一系列的行業(yè)開(kāi)源大模型。據(jù)不完全統(tǒng)計(jì),LLaMA 2開(kāi)源后,國(guó)內(nèi)就涌現(xiàn)出了十幾個(gè)開(kāi)源行業(yè)大模型。
一份從谷歌內(nèi)部泄露出來(lái)的備忘錄(標(biāo)題是《我們沒(méi)有護(hù)城河》)證實(shí)了這種觀點(diǎn):
“我們無(wú)法贏得這場(chǎng)軍備競(jìng)賽,OpenAI 也一樣。當(dāng)我們爭(zhēng)吵不休的時(shí)候,第三個(gè)派系(開(kāi)源)卻在悄悄地吃掉我們的午餐”。
谷歌備忘錄作者發(fā)現(xiàn),自從LLaMA開(kāi)源后,立刻出現(xiàn)了大量的創(chuàng)新,重大開(kāi)發(fā)成果之間的間隔也在縮短。
Meta是一個(gè)明顯的贏家,他們有效地獲得了整個(gè)星球的免費(fèi)勞動(dòng)力,大多數(shù)開(kāi)源創(chuàng)新都發(fā)生在他們的架構(gòu)之上,沒(méi)有什么能阻止他們將其直接整合到他們的產(chǎn)品中。
“當(dāng)免費(fèi)、不受限制的替代品在質(zhì)量上具有可比性時(shí),人們就不會(huì)為受限制的模型付費(fèi)”,備忘錄里寫(xiě)道。
最近,Meta首席AI科學(xué)家Yann LeCun轉(zhuǎn)發(fā)了方舟投資(ARK Invest)制作的一張趨勢(shì)圖,描繪了開(kāi)源社區(qū)與閉源模型在生成式AI上的發(fā)展。
“開(kāi)源人工智能模型正走在超越專(zhuān)有模型的路上”,他感概道。
有網(wǎng)友甚至表示,我們正在接近一個(gè)臨界點(diǎn)。以目前開(kāi)源社區(qū)項(xiàng)目的發(fā)展速度,開(kāi)源大模型將在未來(lái)12個(gè)月內(nèi)達(dá)到GPT-4的水平。
未來(lái)1-2年,開(kāi)源力量可能在與閉源大模型分庭抗禮。
開(kāi)源大模型的商業(yè)化挑戰(zhàn)
盡管開(kāi)源已成為現(xiàn)階段大模型發(fā)展的一種主流趨勢(shì),開(kāi)源大模型的發(fā)展速度也遠(yuǎn)快于封閉生態(tài)系統(tǒng),但并非所有的廠(chǎng)商都選擇開(kāi)源路線(xiàn),也并不代表廠(chǎng)商會(huì)一直開(kāi)源所有的大模型。
比如,以開(kāi)源切入大模型賽道的百川智能,在發(fā)布完Baichuan-7B、Baichuan-13B開(kāi)源大模型后,參數(shù)更大的Baichuan-53B大模型則選擇了閉源。
由此可見(jiàn),開(kāi)源或閉源并非大模型的唯一發(fā)展路徑。在當(dāng)下,能夠閉源的大模型一定是可以提供足夠高的價(jià)值,幫用戶(hù)更好地完成高性能的大模型訓(xùn)練、推理和部署,通過(guò)調(diào)用API的方式來(lái)幫助用戶(hù)降低門(mén)檻。
這也是OpenAI等AI巨頭閉源的思路,因其自身技術(shù)的絕對(duì)領(lǐng)先優(yōu)勢(shì),使得其價(jià)值也非常的大。
相比之下,開(kāi)源大模型除了快速迭代、證明自己的價(jià)值,還面臨著更多的挑戰(zhàn),比如:
由于源代碼的公開(kāi)性,開(kāi)源大模型可能更容易受到惡意攻擊或?yàn)E用,確保數(shù)據(jù)安全和用戶(hù)隱私需要額外的努力和監(jiān)管。
同時(shí),來(lái)自商業(yè)模式的不確定性,如何在保持開(kāi)放的同時(shí)實(shí)現(xiàn)可持續(xù)的商業(yè)發(fā)展,始終是開(kāi)源需要解決的重要問(wèn)題。
回顧歷史,紅帽在開(kāi)源商業(yè)化成功的道路上已做出了示范。作為最早通過(guò)提供企業(yè)級(jí) Linux 發(fā)行版和相關(guān)服務(wù)的公司,紅帽通過(guò)訂閱模式為客戶(hù)提供技術(shù)支持、更新和定制化服務(wù)。
紅帽的商業(yè)化路徑具體而言:在最上游的開(kāi)源社區(qū),參與開(kāi)源技術(shù)貢獻(xiàn),做大做強(qiáng)生態(tài);提取開(kāi)源社區(qū)中的上游技術(shù)產(chǎn)品,沉淀到自己小開(kāi)源社區(qū);再將其認(rèn)為最有價(jià)值的技術(shù)檢驗(yàn)、測(cè)試、打包,形成新的產(chǎn)品組合,完成閉源出售給客戶(hù)。
同樣將開(kāi)源成功商業(yè)化的公司還有MongoDB, Databricks, Cloudera, GitLab, Docker, MySQL AB......這些案例都表明,開(kāi)源軟件可以通過(guò)提供增值服務(wù)、技術(shù)支持、企業(yè)級(jí)特性、云服務(wù)等方式實(shí)現(xiàn)商業(yè)化,同時(shí)保持與開(kāi)源社區(qū)的互動(dòng)和合作。
盡管珠玉在前,但并不代表開(kāi)源大模型商業(yè)化是一件容易的事。
在如此多的開(kāi)源大模型競(jìng)爭(zhēng)壓力下,如何提高自身大模型在用戶(hù)中的知名度和接受度,讓用戶(hù)從免費(fèi)使用轉(zhuǎn)向付費(fèi)服務(wù),同時(shí)還要防止競(jìng)爭(zhēng)對(duì)手可能基于相同的代碼庫(kù)創(chuàng)建自己的產(chǎn)品或服務(wù),都考驗(yàn)著開(kāi)源大模型廠(chǎng)商的能力和速度。
開(kāi)源與閉源大模型的協(xié)同演化
實(shí)際上,開(kāi)源大模型和閉源大模型各有優(yōu)劣,且在不同的應(yīng)用場(chǎng)景和需求下各有其適用性,兩者并非絕對(duì)的對(duì)立面,而是可以在某些方面相互借鑒和融合。
開(kāi)源是為了保持社區(qū)的繁榮和多樣性,能夠保證技術(shù)、產(chǎn)品能夠源源不斷補(bǔ)充新鮮的血液和產(chǎn)生新的變化。
閉源的商業(yè)化版本是用來(lái)滿(mǎn)足商業(yè)化的需求,即安全、低成本、高效、持續(xù)有價(jià)值的服務(wù)。對(duì)比商業(yè)版本,開(kāi)源版本一定是滯后的,包括技術(shù)的迭代、維護(hù)等等。
因此,兩者的優(yōu)勢(shì)并不在同一個(gè)位置,也很難斷言哪一個(gè)模式將完全主導(dǎo)大模型的未來(lái)。相反,可以預(yù)見(jiàn)的是,開(kāi)源和閉源大模型將在以下幾個(gè)方面實(shí)現(xiàn)協(xié)同演化:
一是,共享與競(jìng)爭(zhēng)并存。
開(kāi)源大模型和閉源大模型將在某些領(lǐng)域展開(kāi)激烈的競(jìng)爭(zhēng),如自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等。同時(shí),它們也可能在其他領(lǐng)域共享成果和技術(shù),推動(dòng)整個(gè)AI行業(yè)的進(jìn)步。
二是,混合模式的出現(xiàn)。
為了兼顧創(chuàng)新速度、透明度、安全性和商業(yè)利益,一些公司可能會(huì)選擇采用混合模式,即開(kāi)放基礎(chǔ)模型的源代碼,但保留高級(jí)功能或特定應(yīng)用的閉源。
這種模式既可以吸引開(kāi)發(fā)者和用戶(hù)的參與,又可以保護(hù)公司的核心競(jìng)爭(zhēng)力。
三是,標(biāo)準(zhǔn)化與監(jiān)管的加強(qiáng)。
隨著AI技術(shù)的發(fā)展和應(yīng)用的普及,政府和行業(yè)組織可能會(huì)加強(qiáng)對(duì)開(kāi)源和閉源大模型的標(biāo)準(zhǔn)化和監(jiān)管工作,以確保模型的安全、公平和透明。
這將進(jìn)一步規(guī)范市場(chǎng)行為,促進(jìn)開(kāi)源和閉源大模型的健康發(fā)展。
結(jié)語(yǔ)
當(dāng)然,無(wú)論是開(kāi)源還是閉源,重要的是持續(xù)創(chuàng)新、提升透明度和安全性,以及實(shí)現(xiàn)AI技術(shù)的社會(huì)價(jià)值和經(jīng)濟(jì)價(jià)值的最大化。比起斷定誰(shuí)會(huì)是大模型的未來(lái),不如去關(guān)注如何合理利用這兩種模式,去塑造一個(gè)更加智能、開(kāi)放、安全和可持續(xù)的AI未來(lái)。
【關(guān)于科技云報(bào)道】
專(zhuān)注于原創(chuàng)的企業(yè)級(jí)內(nèi)容行家——科技云報(bào)道。成立于2015年,是前沿企業(yè)級(jí)IT領(lǐng)域Top10媒體。獲工信部權(quán)威認(rèn)可,可信云、全球云計(jì)算大會(huì)官方指定傳播媒體之一。深入原創(chuàng)報(bào)道云計(jì)算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 僅售999元 月底開(kāi)售 閃極打響AI眼鏡量產(chǎn)發(fā)令槍
- 蘿卜快跑走紅、滴滴加碼,中國(guó)Robotaxi大戰(zhàn)升級(jí)
- 雷軍無(wú)暇顧及董明珠
- 不僅漲價(jià),美國(guó)芯片還得求著要,臺(tái)積電技術(shù)遙遙領(lǐng)先有底氣!
- 掃地機(jī)新技術(shù)看追覓
- 特朗普示好,最高法介入,TikTok賣(mài)家極限生死局
- 釋放數(shù)字金融向新力 奇富科技金融AI大模型成果落地上海金融科技國(guó)際論壇特展周活動(dòng)
- 劉興亮|酒局十誡
- 未來(lái)屬于會(huì)用AI的企業(yè)!自己做的免費(fèi)智慧發(fā)票助手,簡(jiǎn)單又強(qiáng)大
- 一觸“伙伴+華為”體系,傳媒行業(yè)點(diǎn)亮數(shù)智之光
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。