5月15日,根據(jù)北京市生成式人工智能服務已備案信息公告,中國電信人工智能研究院(TeleAI)自主研發(fā)的星辰大模型已通過備案。今年2月星辰大模型已通過 “境內(nèi)深度合成服務算法備案” ,“雙備案”標志著星辰大模型可正式對外提供生成式人工智能服務。
TeleAI作為最早布局大模型的央企機構(gòu)之一,堅持全鏈路完全自主研發(fā)創(chuàng)新,去年便發(fā)布了千億參數(shù)“星辰”語義大模型,性能處于國內(nèi)同級別參數(shù)模型的前列。同步構(gòu)建了語義、語音、視覺及多模態(tài)等全模態(tài)完備的大模型基礎(chǔ)框架,基于星辰大模型的各領(lǐng)域算法已獲國際頂會AI競賽冠亞軍24項。TeleAI逐步形成涵蓋5大領(lǐng)域的前沿布局:1個智算云底座、1個通用大模型底座、1個數(shù)據(jù)底座、M個內(nèi)部大模型、N個行業(yè)大模型。
TeleAI積極通過開源推動大模型技術(shù)進步和大模型國產(chǎn)化進程。在中國電信CTO、院長李學龍帶領(lǐng)下,加快研發(fā)創(chuàng)新,接連開源7B、12B、52B參數(shù)規(guī)模大模型,吸引國內(nèi)外開源社區(qū)開發(fā)者廣泛討論和使用,開源模型下載量過萬,積累超40W+用戶。
本次開源的TeleChat-12B-V2(星辰12B-V2),采用3.7萬億tokens高質(zhì)量中英文預訓練數(shù)據(jù)進行訓練,并在SFT數(shù)據(jù)部分,針對幻覺、邏輯推理方向數(shù)據(jù)進行定向提升。在通用問答能力上較之前版本提升5.5%,在多輪數(shù)學性能上提升40.3%。
同時,進一步開源更大參數(shù)的語言模型TeleChat-52B(星辰52B),52B模型使用更高質(zhì)量的數(shù)據(jù)、更科學的數(shù)據(jù)配比,采用課程學習方式,在通用問答能力上大幅超過12B模型,整體性能比肩甚至超過GPT 3.5-Turbo。本次除了開源chat版本模型外,還開源了基于Deepspeed的全參微調(diào)和Lora微調(diào)方法,供大模型技術(shù)研究者和需求開發(fā)者進行自主訓練微調(diào)模型。據(jù)悉,中國電信人工智能研究院表示年內(nèi)預計將開源千億級參數(shù)大模型,逐步構(gòu)建全尺寸開源格局,通過更豐富的應用場景、更廣泛的落地應用、更繁榮的行業(yè)生態(tài),助力中國大模型技術(shù)進步與落地應用。
據(jù)悉,星辰大模型已廣泛應用落地,賦能千行百業(yè)轉(zhuǎn)型升級。星辰語義大模型已落地某市民生訴求場景,為市民提供在線文本問答服務,提升政務服務能力,提高市民滿意度;語音大模型一體機落地某小學防霸凌項目,星辰語音大模型采用億級參數(shù)進行推理,可在嘈雜環(huán)境下,實現(xiàn)報警關(guān)鍵詞的精準識別預報警,智能應對各種校園霸凌事件;星辰視覺大模型融入多源跨橫態(tài)信息,面向公安、縣鄉(xiāng)綜治、基層治理等公共安全管理單位,提供視頻圖像解析、聚檔、視頻語義檢索等能力,助力智慧城市建設(shè)。星辰多模態(tài)大模型累計研發(fā)15種文生圖、55種圖生圖能力,落地海報生成場景和卡券生成場景。
此外,中國電信憑借在各行業(yè)深耕多年的優(yōu)勢和經(jīng)驗,聯(lián)合頭部生態(tài)構(gòu)建了涵蓋教育、政務、應急等20多個行業(yè)大模型,深入推動大模型與各行各業(yè)的融合,切實賦能千行百業(yè)轉(zhuǎn)型升級。
星辰大模型通過 “雙備案”后,將進一步為客戶、生態(tài)伙伴、開發(fā)者及個人用戶等提供前沿的AI能力,賦能千行百業(yè)變革的同時也提升個人工作效率和日常生活便利性,切實推進國內(nèi)AI技術(shù)進步及落地應用,加速全社會邁向通用人工智能時代。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )