精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>
  • <span id="ixlwe"></span>

  • <abbr id="ixlwe"></abbr>

    AI的破局與落地,聯(lián)邦學習在中國的加速進化之路

    關注AI技術(shù)的人們想必都知道,聯(lián)邦學習(Federated Learning)技術(shù)最早是由谷歌在2017年公開發(fā)布,一經(jīng)提出就被業(yè)內(nèi)寄予厚望。

    由于面臨著數(shù)據(jù)孤島和數(shù)據(jù)隱私保護等問題,AI產(chǎn)業(yè)落地進程面臨著嚴重的數(shù)據(jù)困局。聯(lián)邦學習技術(shù)正是為了應對這一問題而被提出,現(xiàn)在已成為新一代人工智能最重要的技術(shù)范式之一。

    在聯(lián)邦學習出現(xiàn)并快速發(fā)展的三年多時間里,國內(nèi)外諸多科技巨頭都已經(jīng)開展聯(lián)邦學習的深入研究與應用。值得注意的是,在聯(lián)邦學習技術(shù)的研究和推廣上,我國的科技企業(yè)與研究機構(gòu)不再是處于跟隨狀態(tài),而是處于和國外科技巨頭并駕齊驅(qū)的水平。其中一些頭部企業(yè)正在積極參與到聯(lián)邦學習的技術(shù)標準制定,以及產(chǎn)業(yè)應用落地的實踐當中。

    聯(lián)邦學習為何如此重要?在最近兩年當中,聯(lián)邦學習又是如何在眾多國內(nèi)科技巨頭的支持和推動下,實現(xiàn)迅速發(fā)展和應用落地的?這成為很多人非常關心的問題。

    打破AI數(shù)據(jù)困局,聯(lián)邦學習的野馬之姿

    聯(lián)邦學習,谷歌這一技術(shù)設想,主要回應的問題是如何有效利用用戶終端上的數(shù)據(jù)進行AI模型訓練,而又不侵犯用戶的數(shù)據(jù)隱私。

    工程師們的解決方式是用戶數(shù)據(jù)只需在本地終端進行訓練,云端服務器只要獲取訓練后的訓練模型(權(quán)重)即可,也就是搭建一個大型的分布式神經(jīng)網(wǎng)絡模型訓練框架,從而讓用戶數(shù)據(jù)不離本地,同時也能獲得很好的AI服務體驗。

    聯(lián)邦學習的出現(xiàn),讓每個用戶都可能成為AI發(fā)展的貢獻者,同時又啟發(fā)了企業(yè)之間跨越AI落地的數(shù)據(jù)鴻溝的一種嶄新方式。

    所謂的“數(shù)據(jù)鴻溝”,主要是我們常聽到的“數(shù)據(jù)孤島”。一方面是企業(yè)逐利的本性,必然使其不愿拿出自身的數(shù)據(jù)與其他公司交換,導致少數(shù)幾家巨頭壟斷大量數(shù)據(jù)而小企業(yè)無數(shù)據(jù)可用的馬太效應;另一方面是全球各國對數(shù)據(jù)隱私保護的監(jiān)管越發(fā)嚴格,企業(yè)在用戶數(shù)據(jù)使用和共享上面更要考慮合規(guī)合法的應用,因而進一步加劇了數(shù)據(jù)孤島效應。

    在這一數(shù)據(jù)鴻溝的制約下,眾多行業(yè)和企業(yè)會因為沒有高質(zhì)量、大規(guī)模的數(shù)據(jù)支撐而無法得到更好的訓練模型。特別是對于一些專業(yè)性強的細分領域,如金融、風控、法律以及醫(yī)療等領域,由于各家的數(shù)據(jù)無法打通,自身的數(shù)據(jù)量又有限,會極大地限制其AI技術(shù)的發(fā)展。

    既能保護數(shù)據(jù)不共享以保護用戶隱私,同時又能在云端更新和共享通用模型,這正是聯(lián)邦學習技術(shù)所能實現(xiàn)“兩全其美”的策略。

    聯(lián)邦學習在從C端應用向B端產(chǎn)業(yè)應用演進中,形成了更為通用的解決方案:一、橫向聯(lián)邦學習,即樣本中用戶不同,特征相同,谷歌的方法即是這種;二、縱向聯(lián)邦學習,即樣本中用戶相同,特征不同,適用于擁有同一批用戶的不同企業(yè);三、遷移聯(lián)邦學習,即樣本中用戶、特征都可能不同,這樣可以通過數(shù)據(jù)的升維或降維,從而進行另外數(shù)據(jù)子空間的遷移學習。

    這樣,聯(lián)邦學習作為一種更加泛化的機器學習方式,就可以把更多像金融、保險、醫(yī)療、安防、教育等行業(yè)機構(gòu)作為數(shù)據(jù)主體來進行AI的模型應用場景了。而在聯(lián)邦學習技術(shù)的深化和擴展當中,我國的多家科技企業(yè)發(fā)揮了重要的作用。

    百舸爭流,聯(lián)邦學習在中國的成績單

    作為聯(lián)邦學習技術(shù)的深度參與方,國內(nèi)企業(yè)不僅參與了聯(lián)邦學習的技術(shù)研發(fā)和應用,同樣還參與了聯(lián)邦學習的標準制定以及貢獻了多個開源模型框架。

    首先,我國的多家企業(yè)組織和參與了聯(lián)邦學習基礎架構(gòu)與應用規(guī)范標準的制定。去年,聯(lián)邦學習基礎架構(gòu)與應用(IEEE P3652.1)標準工作組兩次會議先后在深圳、洛杉磯召開,國內(nèi)眾多企業(yè)對聯(lián)邦學習標準草案的制定提出建設性意見,并預計在今年出臺這一草案。

    業(yè)內(nèi)人士評價,聯(lián)邦學習技術(shù)正是在全球知名人工智能專家楊強教授和其團隊主導參與的IEEE聯(lián)邦學習標準制定委員會的推動下,才成為備受產(chǎn)學研各界關注的人工智能的研究領域。

    其次,國內(nèi)多家企業(yè)也都紛紛推出了可以進行產(chǎn)業(yè)落地應用的開源框架。

    比如,騰訊發(fā)起的微眾銀行早在2018年就基于聯(lián)邦學習理論研究進行相關開源軟件研發(fā),在2019年初,正式開源全球首個工業(yè)級聯(lián)邦學習框架 FATE(Federated Learning Enabler),其實現(xiàn)了基于同態(tài)加密和多方計算的安全計算協(xié)議,在信貸風控、客戶權(quán)益定價、監(jiān)管科技等領域推出了相應的商用方案。

    去年,百度在PaddlePaddle 2.0開放平臺中,也增加了PaddleFL聯(lián)合學習框架,PaddleFL主要是面向深度學習進行設計,提供了眾多在計算機視覺、自然語言處理、推薦算法等領域的聯(lián)邦學習策略及應用場景。同樣,平安科技在其提出的聯(lián)邦智能體系的基礎上,自主研發(fā)了蜂巢聯(lián)邦學習平臺,主要應用于多方信息的安全協(xié)作計算,滿足銀行和金融機構(gòu)的風險評估、反洗錢、投顧、投研、信貸、保險和監(jiān)管等多場景應用需求。

    同樣,基于聯(lián)邦學習理論的多方安全計算技術(shù),騰訊云開發(fā)出“騰訊云數(shù)盾”來滿足數(shù)據(jù)安全治理的多重需求。阿里巴巴也早在2015年就開始了與聯(lián)邦學習思路相同的共享學習技術(shù)的研究,在各方通過共享加密數(shù)據(jù)或加密機制下的參數(shù)交換方式來進行機器學習,建立虛擬的共享模型的產(chǎn)品平臺。

    此外,華為、京東、聯(lián)想以及國內(nèi)多家創(chuàng)業(yè)企業(yè)都已在聯(lián)邦學習的生態(tài)發(fā)展中貢獻進行著各種不同細分領域的實踐創(chuàng)新。

    這些國內(nèi)科技企業(yè)之所以紛紛投入到聯(lián)邦學習技術(shù)的研發(fā)和推廣,正是看到其在用戶數(shù)據(jù)隱私保護與AI技術(shù)創(chuàng)新上面實現(xiàn)的完美平衡,以及帶來的眾多產(chǎn)業(yè)的AI應用落地的機會。

    推動AI產(chǎn)業(yè)落地,聯(lián)邦學習的中國實踐

    根據(jù)聯(lián)邦學習的技術(shù)特點以及參與企業(yè)的當前的研發(fā)重點,金融領域成為聯(lián)邦學習最先進行應用落地的主要場景。其中在金融業(yè)務的眾多環(huán)節(jié)中,信貸風控可謂是典型的聯(lián)邦學習的應用落地場景。

    基于聯(lián)邦學習的信貸風控,微眾銀行提出了“同態(tài)加密中間變量”的解決方案,也就是保證原始數(shù)據(jù)不出庫的情況下,使用經(jīng)過梯度交換得到的中間變量來進行風控模型的建模,從而降低使用中心化機器學習帶來的系統(tǒng)性隱私風險。

    通過聯(lián)邦學習實現(xiàn)的信貸風控的用戶數(shù)據(jù)網(wǎng)絡增強,就可以在貸款前更好地判斷客戶風險,幫助信貸公司過濾信貸黑名單或明顯沒有轉(zhuǎn)化的貸款客戶,進一步降低貸款審批流程后期的信審成本;同時在貸款中實現(xiàn)用戶放款后行為的動態(tài)評估以輔助授信額度的調(diào)整,在貸款后期幫助放貸機構(gòu)進行催收的策略評估,調(diào)整催收策略,提升催收效率。

    在醫(yī)療健康行業(yè),同樣也長期面臨著“數(shù)據(jù)孤島”的問題,從而制約著醫(yī)療AI的發(fā)展。

    基于患者數(shù)據(jù)隱私保護的要求和各家醫(yī)療機構(gòu)數(shù)據(jù)無法互聯(lián)互通且標準不一的問題,聯(lián)邦學習可以很好地避開醫(yī)療機構(gòu)之間的信息壁壘,不再需要將各家數(shù)據(jù)做集中合并,而是通過協(xié)議在其間傳遞加密之后的信息,而各個醫(yī)療機構(gòu)通過使用這些加密的信息更新模型參數(shù),從而實現(xiàn)在不暴露原始數(shù)據(jù)的條件下使用全部患者數(shù)據(jù)的訓練過程。

    日前,騰訊的天衍實驗室和微眾銀行正是利用這一聯(lián)邦學習的方式成功構(gòu)建了一個“腦卒中發(fā)病風險預測模型”,既能利用兩家醫(yī)院的加密后的共同的患者樣本進行特征建模訓練,又能很好地保護各自的數(shù)據(jù)隱私,最終比兩家醫(yī)院各自獨立訓練的模型效果準確率有了大幅的提升。

    在安防監(jiān)控行業(yè),AI安防系統(tǒng)也同樣由于數(shù)據(jù)隱私保護的監(jiān)管要求和各家安防廠商之間各自為戰(zhàn)的狀況而難以獲得很好的發(fā)展。假如有多個廠商使用聯(lián)邦學習來訓練和優(yōu)化AI算法模型,就可以讓每家企業(yè)在自己的服務器上進行訓練,只需加密上傳訓練模型到后臺,進行模型優(yōu)化后,再反饋給各個廠商改進后的模型方案。

    除了金融、醫(yī)療和安防行業(yè)的應用外,聯(lián)邦學習正在深入到其他行業(yè)當中。未來包括像金融、醫(yī)療、保險、安防、教育、零售、工業(yè)以及智慧城市等各個行業(yè)和場景,都可以依賴聯(lián)邦學習技術(shù)實現(xiàn)行業(yè)AI能力的提升,從而實現(xiàn)降本增效的運營目標。

    總體而言,對于國內(nèi)這些聯(lián)邦學習的積極推動者和踐行者的科技企業(yè)們而言,聯(lián)邦學習到底意味著什么?

    首先,去年5月我國網(wǎng)信辦出臺了《數(shù)據(jù)安全管理辦法(征求意見稿)》這一被稱為“中國版GDPR”的法規(guī),標志著我國數(shù)據(jù)規(guī)范使用的時代已經(jīng)到來。面對越來越嚴格的數(shù)據(jù)安全的監(jiān)管要求以及日益嚴峻的用戶數(shù)據(jù)隱私保護的風險,國內(nèi)這些科技企業(yè)必須將數(shù)據(jù)的合規(guī)合法的使用當作日常運營的關鍵要務來看待。

    數(shù)據(jù)安全的嚴格限制無疑會帶來企業(yè)在AI技術(shù)應用上面的挑戰(zhàn),聯(lián)邦學習技術(shù)正是應對這一監(jiān)管挑戰(zhàn)和行業(yè)競爭限制而提出的解決方案,自然得到了科技企業(yè)的大力推崇。

    其次,對于那些科技巨頭而言,聯(lián)邦學習技術(shù)不僅能直接解決企業(yè)內(nèi)部的“數(shù)據(jù)孤島”問題,也可以使其在所要涉及的行業(yè)內(nèi)建立起數(shù)據(jù)共享的合作生態(tài)。只有搶占先機,推出自己的聯(lián)邦學習的開源架構(gòu),才能吸引更多的行業(yè)伙伴加入到這一聯(lián)邦學習的生態(tài)當中。

    另外,對于那些創(chuàng)業(yè)企業(yè)或行業(yè)客戶而言,既沒有豐富的數(shù)據(jù)資源,也沒有充足的資源投入到AI系統(tǒng)的建設上,通過加入聯(lián)邦學習的生態(tài),借助巨頭的平臺和大數(shù)據(jù)資源,進行自身AI模型的優(yōu)化,大幅降低企業(yè)智能化升級成本,成為一件非常劃算和可行的選擇。

    近兩年,我們經(jīng)常會聽到“普惠AI”這一概念。普惠AI的愿景肯定不會只是一兩家AI巨頭就能實現(xiàn)的,而是更需要各行各業(yè)的企業(yè)、組織和個人一同參與,來為AI的技術(shù)升級與落地貢獻源源不斷的數(shù)據(jù)資源。

    在AI的持續(xù)演進和數(shù)據(jù)隱私安全保護的交織下,聯(lián)邦學習正在搭建一座機構(gòu)與用戶、機構(gòu)與機構(gòu)之間數(shù)據(jù)信任、共享普惠AI成果的橋梁。而這座聯(lián)邦學習生態(tài)之橋的建設,國內(nèi)的技術(shù)建造者和各行業(yè)的參與者還有很多的工作要做。

    免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內(nèi)容。投訴郵箱:editor@fromgeek.com。

    免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

    2020-05-13
    AI的破局與落地,聯(lián)邦學習在中國的加速進化之路
    聯(lián)邦學習,谷歌這一技術(shù)設想,主要回應的問題是如何有效利用用戶終端上的數(shù)據(jù)進行AI模型訓練,而又不侵犯用戶的數(shù)據(jù)隱私。

    長按掃碼 閱讀全文