(2023年7月17日,上海)生成式AI火爆全球,國內(nèi)外AI大模型日新月異,人工智能加速走進(jìn)日常生活。如何在技術(shù)“狂飆”的同時(shí),引導(dǎo)技術(shù)應(yīng)用的正向發(fā)展?在本年度世界人工智能大會(huì)上,商湯科技就此問題給出了答案:著眼現(xiàn)實(shí)問題,用可信AI基礎(chǔ)設(shè)施“護(hù)航”大模型發(fā)展。
繼4月發(fā)布自研大模型體系后,商湯迅速升級(jí)迭代,重磅推出全面升級(jí)的“商湯日日新SenseNova”。與之一起亮相的,還有商湯可信AI基礎(chǔ)設(shè)施—SenseTrust。SenseTrust包含一套完整覆蓋數(shù)據(jù)、模型、應(yīng)用治理環(huán)節(jié)的可信AI治理工具,可為商湯自身及行業(yè)提供倫理、安全二維一體的檢測(cè)與加固解決方案,推動(dòng)發(fā)展安全可信的人工智能產(chǎn)業(yè)生態(tài)。
活動(dòng)上,商湯副總裁、AI倫理與治理委員會(huì)主席張望表示:“技術(shù)規(guī)?;涞赜袃牲c(diǎn)關(guān)鍵條件,一是成本低、應(yīng)用廣的普惠性,二是要可靠、可信的安全性。以大算力為基礎(chǔ)的大模型及通用人工智能為加速了條件一的滿足,同時(shí)也帶來了技術(shù)濫用風(fēng)險(xiǎn)的規(guī)?;?jí)。如何保障人工智能系統(tǒng)的安全可信已經(jīng)成為業(yè)界乃至全社會(huì)面臨的一項(xiàng)緊迫課題。為此,商湯針對(duì)新時(shí)期人工智能的風(fēng)險(xiǎn)特點(diǎn),打造覆蓋數(shù)據(jù)處理、模型開發(fā)、應(yīng)用部署等AI系統(tǒng)全生命周期的可信AI基礎(chǔ)設(shè)施SenseTrust,以助力打造可信的大模型。”
活動(dòng)期間,商湯也正式發(fā)布了人工智能倫理與治理的年度報(bào)告——《商湯大模型倫理原則與實(shí)踐白皮書》。白皮書由商湯智能產(chǎn)業(yè)研究院與上海交通大學(xué)計(jì)算法學(xué)與AI倫理研究中心共同編制。白皮書以大模型的發(fā)展為背景,以生成式人工智能的治理為主題,以“商湯日日新SenseNova”大模型體系治理實(shí)踐為案例,提出了生成式人工智能治理的核心原則和“三維對(duì)齊”科技倫理模式,系統(tǒng)呈現(xiàn)了雙方在AI治理領(lǐng)域的最新觀點(diǎn)。
范式變化引發(fā)新挑戰(zhàn) 業(yè)界亟需新時(shí)代下技術(shù)治理手段
大模型時(shí)代,“基礎(chǔ)模型+微調(diào)”為主要特征的生產(chǎn)范式大大降低了開發(fā)成本和應(yīng)用門檻。AI應(yīng)用場(chǎng)景更加開放、數(shù)據(jù)模態(tài)更加多元、應(yīng)用領(lǐng)域更加廣泛;與之對(duì)應(yīng)的,技術(shù)濫用、風(fēng)險(xiǎn)來源指數(shù)級(jí)增長,風(fēng)險(xiǎn)評(píng)估標(biāo)準(zhǔn)更加難以界定,潛在影響規(guī)?;瘮U(kuò)散。在應(yīng)用層面,諸如“幻覺”現(xiàn)象、數(shù)據(jù)投毒、混淆攻擊、誘導(dǎo)攻擊等具有現(xiàn)實(shí)意義的風(fēng)險(xiǎn)挑戰(zhàn)陸續(xù)顯現(xiàn)。無論是未來生命研究所發(fā)布的公開信,還是國內(nèi)外一系列監(jiān)管政策的推出,都反映出全球各方對(duì)人工智能風(fēng)險(xiǎn)挑戰(zhàn)的高度關(guān)注。
大模型時(shí)代:生產(chǎn)范式變革引發(fā)AI風(fēng)險(xiǎn)范式轉(zhuǎn)變
商湯“SenseTrust”構(gòu)筑大模型時(shí)代的“壓艙石”
作為行業(yè)領(lǐng)先的人工智能企業(yè),商湯科技一直以來高度重視人工智能倫理與治理工作,將技術(shù)創(chuàng)新與技術(shù)治理并重。早在2019年商湯就同步啟動(dòng)了兩項(xiàng)前瞻性工作,一項(xiàng)是大模型研發(fā),另一項(xiàng)就是AI倫理與治理。此前,商湯已形成較為完善的人工智能倫理與治理組織結(jié)構(gòu)、管理制度、審查機(jī)制、工具體系、倫理文化建設(shè)體系和外部生態(tài)網(wǎng)絡(luò),并收獲行業(yè)廣泛認(rèn)可。
新時(shí)代下,技術(shù)加速創(chuàng)新、應(yīng)用日新月異,傳統(tǒng)運(yùn)營式的治理手段需相應(yīng)升級(jí),以適應(yīng)飛速發(fā)展、無限拓展的治理需求。商湯整合長期倫理治理思考及技術(shù)能力,針對(duì)當(dāng)下生成式人工智能的風(fēng)險(xiǎn)特點(diǎn),打造可信AI基礎(chǔ)設(shè)施——SenseTrust,包含數(shù)據(jù)治理、模型治理、應(yīng)用治理等層面技術(shù)工具,可提供數(shù)據(jù)處理、模型訓(xùn)練、模型部署、推理服務(wù)等全方位、全鏈路的可信AI檢測(cè)與加固“工具箱”,為大模型時(shí)代構(gòu)筑“壓艙石”。
“SenseTrust”——商湯可信 AI 基礎(chǔ)設(shè)施應(yīng)用圖景
· 在數(shù)據(jù)層面,“SenseTrust” 能夠提供從數(shù)據(jù)脫敏、數(shù)據(jù)去毒、數(shù)據(jù)合規(guī)審查及偏見評(píng)估等治理工具。例如,在模型訓(xùn)練數(shù)據(jù)的預(yù)處理環(huán)節(jié),“SenseTrust”提供的數(shù)據(jù)去毒工具能夠檢測(cè)數(shù)據(jù)來源中是否包含帶有后門、擾亂的有毒數(shù)據(jù),并提供去毒方案。針對(duì)顯式、隱式等不同形式的“毒素”檢測(cè)率大于95%,結(jié)合數(shù)據(jù)清洗與對(duì)抗防御等方法,能夠?qū)崿F(xiàn)有效去毒。目前,“SenseTrust”數(shù)據(jù)脫敏工具已落地?cái)?shù)據(jù)標(biāo)注、城市管理,以及自動(dòng)駕駛相關(guān)業(yè)務(wù)場(chǎng)景。
· 在模型層面,“SenseTrust”能夠針對(duì)傳統(tǒng)判別式模型和生成式模型的不同特點(diǎn)提供標(biāo)準(zhǔn)化和定制化的模型評(píng)測(cè)能力。針對(duì)判別式模型,可就能夠面向活體識(shí)別、圖像分類、目標(biāo)檢測(cè)等商業(yè)化需求提供一鍵式評(píng)測(cè);針對(duì)生成式模型,商湯“SenseTrust”構(gòu)建了百萬量級(jí)的測(cè)試數(shù)據(jù)集,覆蓋三十余類倫理和安全測(cè)評(píng)維度,可對(duì)對(duì)抗安全、魯棒安全、后門安全、可解釋性和公平性評(píng)測(cè)。為進(jìn)一步提升模型的風(fēng)險(xiǎn)防御能力,商湯“SenseTrust”還能夠提供“AI防火墻”,從源頭過濾對(duì)抗樣本,綜合檢出率達(dá)到98%。
· 在應(yīng)用層面,商湯在涉及數(shù)據(jù)保護(hù)、數(shù)字取證及偽造檢測(cè)等技術(shù)領(lǐng)域有著深厚的積累,并逐步開發(fā)了基于生成、鑒偽和溯源三位一體的綜合解決方案。例如,針對(duì)各方頗為關(guān)注的AIGC相關(guān)確權(quán)溯源和鑒偽問題,“SenseTrust”為此開發(fā)了數(shù)字水印解決方案,可將特定信息嵌入到數(shù)字載體中,不影響載體的使用價(jià)值,也不易被人察覺,只有通過特定的解碼器和專屬密鑰才能提取,能夠支持多模態(tài)數(shù)據(jù)。數(shù)字水印技術(shù)已服務(wù)于“商湯秒畫SenseMirage”、“商湯如影SenseAvatar”等多個(gè)產(chǎn)品,以及內(nèi)容創(chuàng)作、大數(shù)據(jù)等領(lǐng)域的客戶。
今年WAIC上,“商湯日日新SenseNova”大模型體系再度升級(jí)。針對(duì)體系內(nèi)的一系列應(yīng)用平臺(tái),商湯在傳統(tǒng)“判別式模型”治理經(jīng)驗(yàn)的基礎(chǔ)上,結(jié)合生成式人工智能的風(fēng)險(xiǎn)特點(diǎn),利用SenseTrust工具體系進(jìn)行了一系列測(cè)評(píng),并開展持續(xù)的跟蹤測(cè)試,不斷提升風(fēng)險(xiǎn)防御能力。
SenseTrust可進(jìn)行全方位、全鏈路的可信AI檢測(cè)與加固
與此同時(shí),商湯也積極將大模型和生成式人工智能的治理實(shí)踐成果向外輸出。例如,將商湯“SenseTrust”綜合鑒偽解決方案投入到十余家銀行的安全系統(tǒng)中,實(shí)現(xiàn)對(duì)各類灰黑產(chǎn)攻擊攔截成功率超行業(yè)同類產(chǎn)品20%以上,有效防范了黑灰產(chǎn)身份盜取、支付盜刷等網(wǎng)絡(luò)詐騙。此外,包括模型體檢、數(shù)字水印,以及主動(dòng)投毒保護(hù)等相關(guān)技術(shù),也已通過“商湯AI安全治理開放平臺(tái)”對(duì)外開放。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )