11月7日,華為全聯(lián)接大會(huì)(HUAWEI CONNECT)2022中國(guó)站在深圳拉開帷幕。在“華為云AI持續(xù)創(chuàng)新,加速AI應(yīng)用走深向?qū)?rdquo;分論壇上,華為云發(fā)布《預(yù)訓(xùn)練大模型白皮書》,博瀚智能(深圳)有限公司CEO郭瑋、華為云EI服務(wù)產(chǎn)品部部長(zhǎng)尤鵬、華為云人工智能領(lǐng)域首席科學(xué)家、IEEE Fellow、國(guó)際歐亞科學(xué)院院士田奇共同出席發(fā)布儀式。
由田奇帶領(lǐng)的華為云盤古大模型研發(fā)團(tuán)隊(duì)認(rèn)為,大模型將成為未來AI計(jì)算的“操作系統(tǒng)”,可以向下管理AI硬件、向上支撐AI算法,使得AI開發(fā)更加規(guī)范化、可復(fù)制。尤鵬表示,華為云希望通過編寫《預(yù)訓(xùn)練大模型白皮書》,將團(tuán)隊(duì)在研究和實(shí)踐中的經(jīng)驗(yàn)固化下來,幫助更多AI從業(yè)人員快速掌握AI技能,持續(xù)創(chuàng)造商業(yè)價(jià)值。
華為云發(fā)布《預(yù)訓(xùn)練大模型白皮書》
人工智能算法落地面臨碎片化困境。當(dāng)前業(yè)界大部分人工智能開發(fā)者普遍沿用傳統(tǒng)的“小作坊模式”進(jìn)行應(yīng)用開發(fā),即針對(duì)每個(gè)場(chǎng)景,獨(dú)立地完成模型選擇、數(shù)據(jù)處理、模型優(yōu)化、模型迭代等一系列開發(fā)環(huán)節(jié)。由于無法積累通用知識(shí),而且不同領(lǐng)域的數(shù)據(jù)差異巨大、微調(diào)技巧也有所不同,導(dǎo)致開發(fā)效率比較低。
為了解決上述困境,預(yù)訓(xùn)練大模型相關(guān)研究和應(yīng)用呈井噴態(tài)勢(shì)。預(yù)訓(xùn)練大模型在大量圖像、文本等數(shù)據(jù)的基礎(chǔ)上,利用無監(jiān)督或者自監(jiān)督學(xué)習(xí)方法將數(shù)據(jù)中蘊(yùn)含的知識(shí)提取出來,存儲(chǔ)在具有大量參數(shù)的神經(jīng)網(wǎng)絡(luò)模型中。遇到特定任務(wù)時(shí),只需調(diào)用規(guī)范化的流程,就能釋放預(yù)訓(xùn)練大模型的能力,并且與行業(yè)經(jīng)驗(yàn)結(jié)合,解決實(shí)際業(yè)務(wù)問題。
華為云盤古大模型于2021年4月正式發(fā)布,到2022年聚焦行業(yè)應(yīng)用落地,已經(jīng)發(fā)展出包括基礎(chǔ)大模型(L0)、行業(yè)大模型(L1)、行業(yè)細(xì)分場(chǎng)景模型(L2)三大階段的成熟體系。在華為全聯(lián)接大會(huì)2022中國(guó)站上,華為云進(jìn)一步迭代盤古大模型的技術(shù)能力,擴(kuò)展盤古大模型的服務(wù)范圍,發(fā)布盤古氣象大模型、盤古礦山大模型、盤古OCR大模型三項(xiàng)重磅服務(wù)。
華為云盤古氣象大模型,為行業(yè)數(shù)字化插上AI氣象分析的翅膀
極端天氣會(huì)帶來巨大的生命和財(cái)產(chǎn)損失。華為云盤古氣象大模型能夠秒級(jí)預(yù)測(cè)未來7天全球天氣情況,相比傳統(tǒng)預(yù)報(bào)算法,速度提升1000倍、精度提升20%。今年8月,盤古氣象大模型預(yù)測(cè)臺(tái)風(fēng)“馬鞍”的軌跡和登陸時(shí)間,準(zhǔn)確率達(dá)90%,遠(yuǎn)超行業(yè)平均水平。在海外,華為云為印尼打造了“國(guó)家海洋人工智能平臺(tái)”,助力預(yù)測(cè)海洋災(zāi)害,保障航行安全。此外,華為云AI for Meteorology還可以用于農(nóng)業(yè)、航空、航天等領(lǐng)域。
華為云盤古礦山大模型,讓AI推動(dòng)礦山安全高效作業(yè),沉淀專家經(jīng)驗(yàn)
為了解決AI在煤礦行業(yè)落地難、門檻高等問題,華為云打造了全棧性能領(lǐng)先的盤古礦山大模型。只需導(dǎo)入海量無標(biāo)注的礦山場(chǎng)景數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,盤古礦山大模型即可進(jìn)行無監(jiān)督自主學(xué)習(xí),僅一個(gè)大模型就能覆蓋煤礦的采、掘、機(jī)、運(yùn)、通等業(yè)務(wù)流程下的1000多個(gè)細(xì)分場(chǎng)景,讓AI應(yīng)用在煤礦普及更容易。
在主運(yùn)場(chǎng)景中,基于盤古礦山大模型的AI主運(yùn)智能監(jiān)測(cè)系統(tǒng)能夠精準(zhǔn)識(shí)別大塊煤、錨桿等異常情況,異物識(shí)別準(zhǔn)確率達(dá)98%。此外,相較于人工巡檢,盤古礦山大模型實(shí)現(xiàn)了全時(shí)段巡檢,幫助工作人員及時(shí)地發(fā)現(xiàn)問題,避免因漏檢造成的安全事故,縮短停機(jī)時(shí)間,同時(shí)提升井下巡檢人員的工作效率。
在掘進(jìn)場(chǎng)景中,基于盤古礦山大模型的掘進(jìn)作業(yè)序列智能監(jiān)測(cè),動(dòng)作規(guī)范識(shí)別準(zhǔn)確率超過95%,用規(guī)范的AI流程來替代不確定的人工流程,讓AI成為礦工規(guī)范作業(yè)的好幫手,保障井下作業(yè)安全。
一個(gè)礦山大模型覆蓋多個(gè)業(yè)務(wù)場(chǎng)景,加速AI落地進(jìn)程
華為云盤古OCR大模型,一個(gè)模型覆蓋通用文字識(shí)別場(chǎng)景
OCR技術(shù)是人工智能的基礎(chǔ)之一,能夠?qū)Y(jié)構(gòu)多變、種類多樣、來源豐富的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行識(shí)別與提取。傳統(tǒng)的OCR廠商通常從特定的應(yīng)用切入,陸續(xù)發(fā)展出卡證識(shí)別、票據(jù)識(shí)別、文檔識(shí)別、表格識(shí)別、車牌識(shí)別、智能掃碼等一系列細(xì)分OCR能力,通過組合的方式服務(wù)于各個(gè)行業(yè)。行業(yè)中每產(chǎn)生一個(gè)的新的識(shí)別場(chǎng)景,都需要在標(biāo)注后才能訓(xùn)練一個(gè)新的模型。這使得OCR服務(wù)的開發(fā)、維護(hù)成本居高不下。
華為云發(fā)布盤古OCR大模型,通過獨(dú)有的對(duì)比學(xué)習(xí)與掩膜圖像建模相融合的自監(jiān)督學(xué)習(xí)方法,學(xué)習(xí)并充分利用大規(guī)模的無標(biāo)簽數(shù)據(jù),實(shí)現(xiàn)一個(gè)模型覆蓋多個(gè)領(lǐng)域的全部通用文字識(shí)別場(chǎng)景,并將標(biāo)注工作量降低90%。此外,盤古OCR大模型在11項(xiàng)經(jīng)典數(shù)據(jù)集測(cè)試中取得顯著的精度提升,而且與原本領(lǐng)先的文字識(shí)別算法相比,盤古OCR大模型的精度平均提升5%以上。
日前,華為云盤古預(yù)訓(xùn)練大模型通過了中國(guó)信息通信研究院首輪大模型測(cè)評(píng),在“模型開發(fā)”和“模型能力”兩部分達(dá)到當(dāng)前最高標(biāo)準(zhǔn)(4+級(jí)),并在計(jì)算機(jī)視覺、自然語言處理、科學(xué)計(jì)算等領(lǐng)域?yàn)闃I(yè)界貢獻(xiàn)了覆蓋百余個(gè)業(yè)務(wù)場(chǎng)景的先進(jìn)算法和解決方案。
未來,華為云將持續(xù)夯實(shí)盤古預(yù)訓(xùn)練大模型的能力,將AI技術(shù)以及行業(yè)落地經(jīng)驗(yàn)云化、服務(wù)化,讓企業(yè)創(chuàng)新觸手可及。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )