GPT-4、百度文心一言擺擂，AI大模型將掀起新一輪AIGC軍備競賽？

科技云報道原創(chuàng)。

一覺醒來，萬眾期待的GPT-4來了。OpenAI老板Sam Altman直接開門見山地介紹說：“這是我們迄今為止功能最強大的模型！”僅隔一天，“中國版ChatGPT”百度文心一言正式發(fā)布，雙方大有擺擂之勢。

當深度學習推動AI技術又一次復興，人類對它的最高期待，就是讓AI成為第四次產(chǎn)業(yè)革命中的“蒸汽機”。

而近幾年身處智能革命前沿的，就是預訓練大模型。

ChatGPT的橫空出世，不僅在科技圈引起嘩然，更是點燃了創(chuàng)投圈的創(chuàng)業(yè)激情。

國內企業(yè)的大規(guī)模預訓練模型（以下簡稱“大模型”）賽道也已經(jīng)開始進入白熱化的競爭階段。

在過去的兩周內，諸多以AI大模型為技術底層的廠商，開始獲得資本的青睞。

那么，AI大模型目前的主要技術路徑是怎樣的？在產(chǎn)業(yè)側的成長如何？

“通用大模型+產(chǎn)業(yè)模型”的技術路徑

必須正視的是，全球大模型競賽中，我們看到大模型的參數(shù)越來越大，數(shù)據(jù)集記錄不斷被刷新。

“在各種專業(yè)和學術基準上和人類相當。”對于剛剛發(fā)布的GPT-4，OpenAI對于其表現(xiàn)相當滿意。

OpenAI在官網(wǎng)表示，GPT-4是一個能接受圖像和文本輸入，并輸出文本的多模態(tài)模型，是OpenAI在擴展深度學習方面的最新里程碑。

從性能表現(xiàn)看，GPT-4的語言理解和生成能力均超過了ChatGPT，可以解答ChatGPT無法完成的問題，同時GPT-4可以描述并理解圖片，并且可接受的文字輸入長度也增加到約2.4萬個單詞。

升級之后，GPT-4在各種職業(yè)和學術考試上表現(xiàn)和人類水平相當。

比如模擬律師考試，GPT-4取得了前10%的好成績，相比之下GPT-3.5是倒數(shù)10%。

做美國高考SAT試題，GPT-4也在閱讀寫作中拿下710分高分、數(shù)學700分（滿分800）。

但真正的產(chǎn)業(yè)空間里，卻很難看到大模型規(guī)模化、標準化應用。

這可能是因為大模型與行業(yè)知識不相匹配，行業(yè)算力基礎難以負載大模型部署等等問題。

過去多年的一個市場共識是，如果要實現(xiàn)AI規(guī)?；a(chǎn)業(yè)落地，底層AI大模型就必須是一個通用的大模型平臺，廠商根據(jù)用戶需求在平臺之上，進行多場景、多領域的模型生產(chǎn)，從而實現(xiàn)具體行業(yè)模型的落地。

對于廠商而言，這也是一個新的方向。即AI廠商以“通用模型+產(chǎn)業(yè)模型”不斷賦能企業(yè)、產(chǎn)業(yè)，從而加速中國的產(chǎn)業(yè)數(shù)字化進程。

更為重要的是，這種模式一旦落地成功或將快速實現(xiàn)規(guī)?；驅轭^部AI廠商帶來高回報，擺脫當下AI技術落地難，盈利難的現(xiàn)狀。

底層AI大模型的研發(fā)具有數(shù)據(jù)規(guī)模大、質量參差不齊、模型體積大、訓練難度高、算力規(guī)模大、性能要求高等挑戰(zhàn)。

這樣的高研發(fā)門檻，不利于人工智能技術在千行百業(yè)的推廣。

而具有數(shù)據(jù)、算力、算法綜合優(yōu)勢的企業(yè)可以將模型的復雜生產(chǎn)過程封裝起來，通過低門檻、高效率的生產(chǎn)平臺，向千行百業(yè)提供大模型服務。

各個行業(yè)的企業(yè)只需要通過生產(chǎn)平臺提出在實際AI應用中的具體需求，生產(chǎn)大模型的少數(shù)企業(yè)就能夠根據(jù)應用場景進一步對大模型開發(fā)訓練，幫助應用方實現(xiàn)大模型的精調，以達到各行業(yè)對于AI模型的直接應用。

彼時，AI大模型就會真正意義上實現(xiàn)產(chǎn)業(yè)化，成為產(chǎn)業(yè)模型。

目前，國內布局AI大模型廠商百度、阿里、騰訊、商湯、華為等企業(yè)，正在不斷夯實通用大模型，打造產(chǎn)業(yè)模型，助力AI大模型產(chǎn)業(yè)化。

其中，百度以文心大模型+飛槳PaddlePaddle深度學習平臺；騰訊以HunYuan大模型+太極機器學習平臺；阿里以通義大模型+M6-OFA；華為以盤古大模型+ModelArts，都打造了自然語言處理大模型、計算機視覺大模型以及多模態(tài)大模型方面。

值得注意的是，各個廠商AI大模型的布局，有所差異。

百度由于多年在AI領域的深耕，其文心大模型涵蓋基礎大模型、任務大模型、行業(yè)大模型的三級體系，打造大模型總量約40個，產(chǎn)業(yè)應用也較為廣泛，例如電力、燃氣、金融、航天等，構建了國內業(yè)界較大的產(chǎn)業(yè)大模型。

目前來看，屬于國內大模型廠商的第一梯隊中的佼佼者。

騰訊產(chǎn)業(yè)化應用方向則主要是騰訊自身生態(tài)的降本增效，其中廣告類應用表現(xiàn)出色。

阿里更重技術，例如M6大模型基于阿里云、達摩院打造的硬件優(yōu)勢，可將大模型所需算力壓縮到極致；另外其底層技術優(yōu)勢還有利于構建AI的統(tǒng)一底層。

目前，主要應用方向是為下游任務提質增效，例如在淘寶服飾類搜索場景中實現(xiàn)了以文搜圖的跨模態(tài)搜索。

華為的優(yōu)勢則在于其訓練出業(yè)界首個2000億參數(shù)以中文為核心的預訓練生成語言模型。

目前發(fā)布了盤古氣象大模型、盤古礦山大模型、盤古OCR大模型三項較為重磅的行業(yè)大模型。

可以發(fā)現(xiàn)，在商業(yè)模式上各個廠商都是通用大模型路徑，在通用大模型架構之上，搭建具體行業(yè)模型。

映射到產(chǎn)業(yè)層面，即“通用大模型+產(chǎn)業(yè)模型”的路徑。

然而，手握入場券，并不代表能跑到終點。

對于廠商而言，其可以搭建通用大模型，并不意味著其能把通用大模型搭建的好；其有能力打通大模型到產(chǎn)業(yè)模型到具體場景的應用，并不意味著其可以打造出有真正價值的智能決策。AI大模型產(chǎn)業(yè)化落地的瓶頸需要被正視。

首先，國內大模型缺少數(shù)據(jù)訓練場景。類似ChatGPT的訓練場景尤為缺乏。

ChatGPT之所以短時間之內進步神速，因大量用戶為其充當了免費的數(shù)據(jù)標注員。

不過，已目前情況來看，可與ChatGPT相較的數(shù)據(jù)訓練場景在國內還鮮有見到。

其次，產(chǎn)業(yè)界對大模型有著濃烈的觀望情緒。

業(yè)界普遍存在這樣的憂慮：目前大模型應用不成熟，驟而上馬將會對原有業(yè)務造成沖擊。

以電商售后和銀行電話客服場景為例，目前行業(yè)內仍采用主流智能客服公司推出的QA問答庫技術。

客戶企業(yè)希冀大模型產(chǎn)品能夠解決QA庫無法承擔的長尾問題，覆蓋到檢索式問答路徑無法涉足的領域，但金融行業(yè)的語料庫等數(shù)據(jù)又不對外開放，讓大模型企業(yè)不得不重頭開始。

這都延遲了大模型進軍具體行業(yè)的時間表。

總結而言，通用智能企業(yè)需要客單價高、數(shù)據(jù)訓練場景豐富的派單需求，但這個問題又與企業(yè)的現(xiàn)實考量和預算投入相互矛盾。

沒得數(shù)據(jù)用來訓練、沒有大錢養(yǎng)活產(chǎn)品，是擺在現(xiàn)實的兩大難題。

一場屬于巨頭的游戲

如今，在大模型賽道中，擠滿了巨頭派、海歸派、創(chuàng)業(yè)公司轉型派、學院派等各路選手。

搶占大模型賽道頭牌的戰(zhàn)爭已經(jīng)徹底打響，但花落誰家還尚未可知。

目前，谷歌、微軟、亞馬遜、百度、阿里、騰訊等科技巨頭公司在大模型發(fā)展方面具有顯著的優(yōu)勢，均有相關雄厚的技術資源和能力，且都在通用大模型上進行了布局與投資。

總體而言，大模型的分水嶺主要集中在技術研發(fā)、數(shù)據(jù)和算法資源、商業(yè)化能力、人才儲備和管理能力四個方面。

首先，在技術研發(fā)能力方面。就目前來看，巨頭擁有更強的技術研發(fā)能力和更豐富的資源，可以投入更多的人力、物力和財力來開展大模型的研究和開發(fā)。

他們擁有更完善的數(shù)據(jù)、算法和硬件等技術支持，能夠更快速地推進大模型的研究和應用。

對比巨頭和創(chuàng)業(yè)公司，技術上的差距在一定程度上取決于人工智能領域內的領先者和后來者。

巨頭公司如Google、Facebook、Microsoft等在人工智能領域擁有大量的數(shù)據(jù)、計算資源和技術經(jīng)驗，因此有更多的能力來訓練和優(yōu)化大模型，推動人工智能技術的發(fā)展。

其次，在數(shù)據(jù)和算法資源方面，巨頭擁有更豐富和更完善的數(shù)據(jù)和算法資源，能夠更好地支持大模型的訓練和推理。

他們能夠利用自身的平臺和業(yè)務優(yōu)勢來積累海量的數(shù)據(jù)，并在此基礎上進行算法研發(fā)和優(yōu)化。而創(chuàng)業(yè)公司通常無法獲得這樣的數(shù)據(jù)和算法資源，需要通過自己的努力來積累數(shù)據(jù)和優(yōu)化算法，這需要更多的時間和精力。

以OpenAI發(fā)布于2020年的GPT-3來看，其具有1750億個參數(shù)的大模型。

在算力方面，人工智能模型的訓練和使用需要強大的算力，這就需要大量高性能的GPU來支撐。

在數(shù)據(jù)方面，據(jù)了解，ChatGPT的訓練使用了大約45TB數(shù)據(jù)，其中包含多達近1萬億個單詞的文本內容。

但是，由于大型模型需要大量的計算和存儲資源，對于初創(chuàng)公司來說，資金和技術限制可能成為了限制因素。

另外，在商業(yè)化能力方面，巨頭擁有更強的商業(yè)化能力和更完善的商業(yè)化渠道，能夠更好地將大模型應用于商業(yè)領域，實現(xiàn)商業(yè)價值。

他們可以借助自身的品牌和用戶基礎，將大模型應用于搜索、推薦、廣告等領域，并實現(xiàn)商業(yè)化變現(xiàn)。由于創(chuàng)業(yè)公司大多缺乏這樣的商業(yè)化能力和渠道，需要花費更多的時間和精力來探索商業(yè)化路徑和拓展商業(yè)合作。

最后，在人才儲備和管理能力方面，巨頭擁有更強的人才儲備和更完善的管理能力，能夠更好地吸引和管理高端人才，構建更具競爭力的團隊。

他們可以通過自身的品牌和聲譽，吸引到更多的高端人才，并通過自身的管理經(jīng)驗和制度建設，提升團隊的協(xié)作效率和創(chuàng)新能力。而創(chuàng)業(yè)公司通常需要付出更多的努力來構建高端團隊和提升管理能力。

雖然，隨著技術的不斷成熟，越來越多的創(chuàng)業(yè)公司也開始利用云計算、分布式計算等技術來加速大模型的訓練和優(yōu)化，不斷挑戰(zhàn)巨頭公司的技術壟斷。

創(chuàng)業(yè)公司在人工智能領域也有很多機會，但需要更多的創(chuàng)新和勇氣來打破技術壁壘和市場壟斷。

總之，大模型作為人工智能領域內的重要技術，已經(jīng)成為了熱門的創(chuàng)業(yè)領域。

巨頭公司擁有更多的資源和技術經(jīng)驗，而創(chuàng)業(yè)公司面對這個“燒錢”的領域，不宜盲目跟風，可以通過創(chuàng)新和勇氣來不斷挑戰(zhàn)技術壟斷，找到適合自己的業(yè)務發(fā)展之路。

免責聲明：本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時，應及時向本網(wǎng)站提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關文章源頭核實，溝通刪除相關內容或斷開相關鏈接。

精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

GPT-4、百度文心一言擺擂，AI大模型將掀起新一輪AIGC軍備競賽？

下一篇

精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

GPT-4、百度文心一言擺擂，AI大模型將掀起新一輪AIGC軍備競賽？

下一篇

GPT-4、百度文心一言擺擂，AI大模型將掀起新一輪AIGC軍備競賽？