5月10日,中科深智在北京正式發(fā)布GenSense數(shù)智姜尚大模型,具備輕量級、可私有化部署等優(yōu)勢。基于GenSense數(shù)智姜尚大模型,其提出的“基于生成式AI提供全流程、端到端3D虛擬人服務”的戰(zhàn)略正式達成,除了適用于虛擬直播、數(shù)字員工等成熟場景以外,還可進一步適用于對私有化部署需求更高的金融、醫(yī)療、政企等專業(yè)領域。
深耕基于生成式AI的3D虛擬人賽道
作為生成式AI虛擬人和3D AIGC技術領導者,中科深智此前已憑借自主研發(fā)的跨多模態(tài)深度學習算法——CLAP算法,通過持續(xù)的不同模態(tài)數(shù)據(jù)的關聯(lián)和交叉訓練,獲得了優(yōu)異的基于語音語義實時生成動作和表情能力。
這些實時生成的動作和表情數(shù)據(jù),通過中科深智自研的重定向算法介導,即可最終驅(qū)動虛擬人,從而完成生成式AI虛擬人的技術閉環(huán)。
以生成式AI虛擬人技術為核心,中科深智打造了生成式虛擬人實時動作表情驅(qū)動業(yè)務中臺Motionverse,可以使用音頻源、文本源、傳感器、語義、腳本等多模態(tài)輸入方式,通過生成式AI技術方案,實現(xiàn)虛擬人的身體動作、面部表情以及口型的實時驅(qū)動,提供SDK和管理后臺,解決產(chǎn)品和終端的虛擬人驅(qū)動問題。
GenSense數(shù)智姜尚大模型賦予虛擬人實時互動能力
本次發(fā)布會上,中科深智正式對外發(fā)布了GenSense數(shù)智姜尚大模型,并現(xiàn)場演示了其在數(shù)學運算、邏輯推理、日常對話等領域的互動表現(xiàn)。據(jù)中科深智CTO宋健介紹,GenSense數(shù)智姜尚是針對垂直領域、和虛擬人端到端應用而專門設計的大語言模型,可成為虛擬人的“大腦”,為其提供實時互動能力支撐。
中科深智創(chuàng)始人兼CEO成維忠認為,ChatGPT對整個虛擬人市場的影響比想象中要大得多。這個組合讓用戶發(fā)現(xiàn),虛擬人也是可以做實時交互的。不同于此前對于虛擬人的需求主要集中于“外在”表現(xiàn),用戶需要的是具有強大實時互動能力的虛擬人。
而GenSense數(shù)智姜尚大模型將能填補以往數(shù)字人只能“依照”指令進行反饋、而無“自主”互動能力的缺陷,成為虛擬人真正意義上的“大腦”。而基于中科深智此前積累的跨多模態(tài)深度學習算法——CLAP算法,能夠?qū)⑻摂M人的“大腦”和形體表現(xiàn)進一步有機融合:由GenSense數(shù)智姜尚大模型對外界互動作出實時反饋、并直接驅(qū)動虛擬人進行生動地表達,復現(xiàn)一個有“智力”、有良好表現(xiàn)力和表達能力的3D虛擬人。
可私有化部署,匹配專業(yè)級應用場景
在與ChatGPT背后的GPT模型能力類似的前提下,中科深智GenSense數(shù)智姜尚大模型還具備輕量化、可私有化部署等特點。據(jù)宋健介紹,GenSense數(shù)智姜尚大模型更加輕巧便利,本場展示的分別是200億和20億兩種參數(shù)量的大模型,占用資源相比前者極少,甚至只需要一塊NVIDIA GeForce RTX 3090顯卡便能良好運行。
在現(xiàn)場,中科深智還重點將20億參數(shù)量級版本的大模型,同ChatGPT及其他知名大廠的大模型進行了同場測試,來驗證在參數(shù)量縮小的前提下效果如何,能否滿足企業(yè)需要。從現(xiàn)場的對比表現(xiàn)來看,效果很不錯,實際體驗的差別并沒有參數(shù)量級差別那么大。這也是國內(nèi)商用大模型在輕量化領域內(nèi)的首次嘗試,有特別重要的商業(yè)意義。
因此,GenSense數(shù)智姜尚大模型更加適合對數(shù)據(jù)安全性要求更高的金融、醫(yī)療、政企、能源等行業(yè)用戶進行私有化部署應用。此類領域大多存在數(shù)據(jù)敏感性高等特點,而市場上大多數(shù)大模型產(chǎn)品由于對算力要求較高,難以進行私有化部署,導致無法滿足此類客戶的需求。
而更加輕量化的GenSense數(shù)智姜尚大模型,不僅能夠滿足此類行業(yè)客戶對于性能上的需求,同時可以進行私有化部署,可以更加深度地結合企業(yè)現(xiàn)有工作流,同時其訓練方式簡單,非常便于和現(xiàn)有數(shù)據(jù)進行集成。
形成全流程、端到端的實時3D虛擬人服務能力
在發(fā)布GenSense數(shù)智姜尚大模型后,中科深智已實現(xiàn)了包括自有大模型、自主核心算法、系列3D AIGC產(chǎn)品、生成式AI虛擬人解決方案的“全家桶”級服務能力。
此前其基于自主核心算法、生成式AI虛擬人和Motionverse業(yè)務中臺等底層技術,打造的超寫實虛擬人生成系統(tǒng)Anyhuman,以及元宇宙電商百寶箱——自動播,支持電商全平臺3D虛擬人主播、虛擬直播間、虛擬人客服、虛擬人直播助理等可視化RPA功能,可以大幅增強虛擬人電商直播交互及時性、播報趣味性,在電商直播領域服務客戶3000+家,市占率超70%。
而對于更廣泛的行業(yè)用戶,中科深智還提供了基于生成式AI技術的3D AIGC動畫視頻創(chuàng)作平臺——自動畫,是包括虛擬人捏臉、自動生成虛擬場景、自動生成物品等一站式3D動畫創(chuàng)作平臺。
此外還有一款高效的虛擬人實時交互產(chǎn)品——云小七,支持自定義虛擬人形象和聲音,通過生成式AI技術實時驅(qū)動虛擬人表情和動作,還會說不同的方言和口音。
另外,通過發(fā)布會現(xiàn)場的演示環(huán)節(jié)可以看出,GenSense數(shù)智姜尚大模型和中科深智各項數(shù)字人技術及產(chǎn)品聯(lián)動高效、流暢,展現(xiàn)了非常出色的實時互動效果和生動的表現(xiàn)、表達能力,非常有新意,也展現(xiàn)了中科深智在虛擬人方面的深厚積累。
通過以上底層技術和產(chǎn)品,中科深智可以SaaS和PaaS模式、或提供垂直領域解決方案,賦能不同行業(yè)和場景,實現(xiàn)了基于生成式AI提供全流程、端到端3D虛擬人服務的戰(zhàn)略目標。
關于中科深智
中科深智是一家專注于端到端生成式AI虛擬人技術的公司,從底層自研的大語言模型、動作和表情生成算法模型以及3D自動建模 ,到Motionverse虛擬人業(yè)務中臺,再到3D AIGC產(chǎn)品和應用層。中科深智除了為生態(tài)合作伙伴提供AI虛擬人API外,還開發(fā)了一系列3D AIGC產(chǎn)品,包括超寫實虛擬人生成系統(tǒng)Anyhuman、元宇宙電商和虛擬人直播工具百寶箱自動播、AI快速動畫生成系統(tǒng)自動畫、虛擬人實時交互和應答系統(tǒng)云小七等。
中科深智成立于2016年,由中科大校友創(chuàng)建,曾獲得北京市“專精特新”中小企業(yè)榮譽,擁有超過100項發(fā)明專利,與國際公司如英偉達、Unity、UE Metahuman合作,擁有數(shù)千家合作伙伴。中科深智的投資方包括英諾天使、金沙江創(chuàng)投、MYEG、晨山資本等知名投資機構。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )