3月18日消息,在瀾舟科技大模型技術(shù)和產(chǎn)品發(fā)布會上,瀾舟科技創(chuàng)始人&CEO周明博士發(fā)表了《大模型技術(shù)和應(yīng)用雙輪驅(qū)動加速創(chuàng)新》主題演講。他回顧了瀾舟科技的發(fā)展歷程,總結(jié)出大模型創(chuàng)業(yè)在企業(yè)級客戶中落地的“九字訣”,并展望了瀾舟科技未來的發(fā)展方向。
瀾舟科技創(chuàng)始人&CEO周明博士
瀾舟科技于2021年6月正式成立, 致力于自主研發(fā)大模型技術(shù)和行業(yè)應(yīng)用,在去年3月發(fā)布了孟子GPT V1(MChat)大模型,今年1月孟子大模型GPT V2(含孟子大模型-標(biāo)準(zhǔn)、孟子大模型-輕量、孟子大模型-金融、孟子大模型-編碼)對公眾開放。
公開資料顯示,瀾舟科技創(chuàng)始人&CEO周明是世界頂級的AI科學(xué)家,自然語言處理領(lǐng)域的代表性人物。曾任微軟亞洲研究院副院長、國際計(jì)算語言學(xué)協(xié)會(ACL)主席?,F(xiàn)任中國計(jì)算機(jī)學(xué)會副理事長、中國中文信息學(xué)會常務(wù)理事。
2024年是大模型落地元年
周明回顧了過去一年來大模型在六個領(lǐng)域的迅速發(fā)展:
? 大模型的能力得到快速提升:在更長的上下文處理能力、數(shù)學(xué)能力和推理能力、安全對齊等方面得到大幅度增強(qiáng)。
? RAG(檢索增強(qiáng)生成):通過結(jié)合搜索相關(guān)數(shù)據(jù)庫的結(jié)果與用戶指令進(jìn)行生成,可有效改善模型幻象、實(shí)時性、數(shù)據(jù)安全等問題。
? GPTs:用戶基于大模型的超強(qiáng)能力方便地搭建自定義的GPT。
? 多模態(tài)大模型:SORA突破了4秒鐘限制,可以生成60秒的視頻,而且生成的視頻質(zhì)量大幅度提升。
? 大模型原生應(yīng)用方面略現(xiàn)端倪:譬如,利用大模型構(gòu)建AI搜索、角色扮演聊天、數(shù)字人等。
? 大模型開源:LLaMA等開源模型有力地推動大模型的普及和發(fā)展,也顯著地改變了大模型的競爭格局。
周明強(qiáng)調(diào)2024年將是大模型落地元年,如何利用大模型技術(shù)助力企業(yè)成長已成為業(yè)界關(guān)注的焦點(diǎn)。政府工作報告新鮮出爐,特別強(qiáng)調(diào)以人工智能+,驅(qū)動各行各業(yè)的轉(zhuǎn)型升級。周明認(rèn)為要把握好這個歷史契機(jī),通過落地,創(chuàng)造價值,拉動創(chuàng)新。
周明強(qiáng)調(diào),瀾舟科技注重“技術(shù)創(chuàng)新和落地應(yīng)用”雙輪驅(qū)動。在積極研究和掌握前沿技術(shù)的同時,公司也致力于確保這些技術(shù)的有效應(yīng)用。
大模型落地九字法則
而談及如何做好大模型落地應(yīng)用,周明表示,雷軍所說的互聯(lián)網(wǎng)的七字法則“專注、極致、口碑和快”仍然適用,還要再加上“成本”,大模型創(chuàng)業(yè)不能不在意成本,一定要有造血的能力,形成大模型落地九字法則:“專注、極致、口碑、快、成本”。
周明稱,這“九字訣”融會貫通在瀾舟的一切行動之中:
首先,瀾舟科技定位非常清楚,就是做大模型技術(shù)+企業(yè)場景應(yīng)用的一個綜合公司。
企業(yè)定位做2B、做技術(shù)和服務(wù),需要明白克服什么挑戰(zhàn),不能盲目地天天練大模型,發(fā)布了、開源了就可以了,不是這樣的。
通過過去兩年多的積攢調(diào)研客戶,瀾舟科技發(fā)現(xiàn)了四大問題,如果解決不好,大模型基本上就是泡影。
這四大問題:一是訓(xùn)練和部署的成本問題。動輒上千萬的模型銷售,用戶是不能接受的;二是行業(yè)的適配,很多人說大模型做出來之后千行百業(yè)隨便用,肯定好使,沒有這種好事;三是幻象問題,很多大模型生成的解決內(nèi)行人看起來像外行,外行的人看起來像內(nèi)行,這樣似是而非的東西企業(yè)不敢用;四是數(shù)據(jù)安全的問題,企業(yè)的數(shù)據(jù)不愿意拿出來,怎么樣解決企業(yè)的擔(dān)心。
針對大模型訓(xùn)練和部署的成本高的問題,瀾舟科技專注把ToB場景使用最多的LLM模型(參數(shù)量7B、13B、40B最高到100B)做到最佳并大幅度提升大模型的推理效率。
針對大模型的行業(yè)落地適配問題,瀾舟科技提出了L1-L2-L3-L4的層次化分級服務(wù)體系, 基于L1-通用大模型,在此基礎(chǔ)上加入行業(yè)數(shù)據(jù)訓(xùn)練出L2-行業(yè)/垂直大模型,如金融、編程大模型。
針對大模型的幻象問題和用戶數(shù)據(jù)安全問題,孟子大模型提出了改進(jìn)的RAG能力。通過孟子大模型理解用戶意圖,可分別經(jīng)過大模型自身,或者通過RAG查找用戶知識庫,甚至通過Web搜索,最后多路召回搜索結(jié)果,經(jīng)過排序輸出最可信結(jié)果。
目前,瀾舟科技已經(jīng)形成了從預(yù)訓(xùn)練,到SFT,到強(qiáng)化學(xué)習(xí),安全,降低幻覺的完備的孟子大模型訓(xùn)練體系,并提出了“一橫N縱”的發(fā)展體系。
其中“一橫”即為孟子大模型技術(shù),而“N縱”是基于孟子大模型的面向ToB應(yīng)用最重要的技術(shù)和產(chǎn)品。“N縱”的應(yīng)用能力型產(chǎn)品,包括AI文檔理解、文檔問答、文檔輔助寫作、機(jī)器翻譯、瀾舟智會、AI搜索等。
希望通過“一橫N縱”,徹底貫徹大模型落地九字法則:專注、極致、口碑、快、成本。
周明強(qiáng)調(diào),瀾舟一方面聚焦自己擅長的能力和場景,另外一方面會注重與開源社區(qū)、與客戶和合作伙伴攜手共進(jìn),共同拓展更廣闊的市場空間,實(shí)現(xiàn)互惠共贏的局面。
據(jù)悉,瀾舟科技已經(jīng)攜手客戶及合作伙伴,如傳神、數(shù)說故事、華為云、華夏基金、同花順、中金公司等,共同開展深入合作。(宜月)
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )