2022年7月25日,國內(nèi)隱私計(jì)算“四小龍”之一的翼方健數(shù)正式推出隱私安全計(jì)算開源技術(shù)——翼數(shù)開源,包括翼數(shù)聯(lián)邦學(xué)習(xí)框架及翼數(shù)安全計(jì)算框架,向全球開發(fā)者開源數(shù)據(jù)安全流通關(guān)鍵技術(shù)。
翼方健數(shù)表示,開源對(duì)隱私計(jì)算意義重大,尤其將在安全性驗(yàn)證、平臺(tái)互聯(lián)互通等方面推動(dòng)行業(yè)蓬勃發(fā)展,并有助于進(jìn)一步推廣隱私計(jì)算在各行各業(yè)的應(yīng)用,期待隱私計(jì)算行業(yè)所有參與者能以開源為契機(jī),攜手為全社會(huì)發(fā)掘更大數(shù)據(jù)價(jià)值。
翼方健數(shù)首席科學(xué)家張霖濤博士表示,目前翼數(shù)聯(lián)邦學(xué)習(xí)框架和翼數(shù)安全計(jì)算框架已于7月25日正式完成開源,希望通過上述開源框架讓更多用戶更便捷地使用隱私計(jì)算技術(shù)。在這兩個(gè)框架開源的引領(lǐng)下,翼方健數(shù)計(jì)劃在未來逐步開源其他自研技術(shù)棧。
翼方健數(shù)作為國內(nèi)隱私計(jì)算領(lǐng)域技術(shù)專精型企業(yè)代表率先投身開源,或預(yù)示隱私計(jì)算賽道的競爭格局與發(fā)展模式將迎來升級(jí)——技術(shù)服務(wù)商既要手握核心技術(shù)“王牌”保持競爭優(yōu)勢,又要敢于亮出開源“底牌”接受各方檢驗(yàn)。
事實(shí)上,過去一年開源正在成為隱私計(jì)算領(lǐng)域的熱點(diǎn)和趨勢之一。在近日由中國信息通信研究院、隱私計(jì)算聯(lián)盟主辦的2022隱私計(jì)算大會(huì)上,“隱私計(jì)算積極擁抱開源”入選2022隱私計(jì)算十大觀察。
翼數(shù)開源:兩大框架輕裝上陣
相比互聯(lián)網(wǎng)幾十年的開源史,隱私計(jì)算開源盡管時(shí)間不長,卻絲毫不輸前輩。其中由著名開源社區(qū)OpenMined在2017年主導(dǎo)的多方安全計(jì)算及聯(lián)邦學(xué)習(xí)開源框架PySyft可以看作是早期代表。其后兩年,谷歌、臉書等國際巨頭也都發(fā)布了可信執(zhí)行環(huán)境、多方安全計(jì)算、聯(lián)邦學(xué)習(xí)相關(guān)開源框架和平臺(tái)。
據(jù)中國信通院總結(jié),自2019年起,微眾銀行、螞蟻集團(tuán)、字節(jié)跳動(dòng)等都推出了開源框架和平臺(tái),越來越多的企業(yè)加入了隱私計(jì)算開源隊(duì)伍,有底層技術(shù)協(xié)議,也有企業(yè)的平臺(tái)類項(xiàng)目。
這些開源平臺(tái)呈現(xiàn)出四大特點(diǎn)及趨勢:一是易用性,方便流程簡易部署方便,用戶能快速上手。二是可擴(kuò)展性,產(chǎn)品架構(gòu)可分為底層算法協(xié)議、算子層和應(yīng)用層等,各層之間可獨(dú)立開發(fā),并支持模塊化。三是完備性,能支持包括聯(lián)合統(tǒng)計(jì)、隱私集合求交、建模等多種功能,每種功能也有滿足不同性能與安全要求的算法。四是兼容性,能為未來互聯(lián)互通做準(zhǔn)備,架構(gòu)設(shè)計(jì)上能兼容其他框架。
可以看出,翼方健數(shù)投身開源不僅順應(yīng)了隱私計(jì)算向開源發(fā)展的時(shí)代趨勢,相關(guān)框架的設(shè)計(jì)與表現(xiàn)也完全呼應(yīng)了目前隱私計(jì)算開源平臺(tái)的特色。張霖濤介紹說,翼數(shù)開源的兩大框架體現(xiàn)了翼方健數(shù)對(duì)開源理念的深刻理解與創(chuàng)新實(shí)踐,其中輕量化是重要原則之一,即兩大框架各自獨(dú)立、分工明確,實(shí)現(xiàn)“專用系統(tǒng)做專用事情”。
據(jù)了解,翼數(shù)聯(lián)邦學(xué)習(xí)框架(XFL)是安全高效的聯(lián)邦學(xué)習(xí)引擎,全面覆蓋聯(lián)邦學(xué)習(xí)算法,支持多種聯(lián)邦學(xué)習(xí)模式。翼數(shù)安全計(jì)算框架(XSCE)是安全密文計(jì)算算法庫,支持多種隱私加密算法,應(yīng)用部署靈活。這兩大框架均為翼方健數(shù)隱私計(jì)算框架XDP平臺(tái)的核心組成部分。
從開發(fā)角度來看,輕量化設(shè)計(jì)易于開發(fā),規(guī)避了龐大系統(tǒng)的復(fù)雜性,便于用戶各取所需、快速上手、開發(fā)擴(kuò)展。從應(yīng)用角度來說,這樣的設(shè)計(jì)商業(yè)友好,更容易適配不同場景,部件化應(yīng)用可集成可重用。
使用體驗(yàn)輕量化的背后是扎實(shí)“內(nèi)功”的支撐。在性能方面,兩大框架近期剛剛通過中國信息通信研究院「多方安全計(jì)算 性能專項(xiàng)評(píng)測」和「聯(lián)邦學(xué)習(xí) 性能專項(xiàng)評(píng)測」雙認(rèn)證,各項(xiàng)計(jì)算時(shí)間均優(yōu)于參評(píng)項(xiàng)目平均值。在安全性方面,翼數(shù)聯(lián)邦學(xué)習(xí)框架采用一次一密、CKKS及 Paillier同態(tài)加密算法等安全技術(shù),確保計(jì)算安全性。并且翼數(shù)聯(lián)邦學(xué)習(xí)框架還支持多種主流深度學(xué)習(xí)框架,如TensorFlow、PyTorch等。
翼方健數(shù)團(tuán)隊(duì)還著力提高代碼質(zhì)量,解決了現(xiàn)有各類多方安全計(jì)算開源代碼偏重學(xué)術(shù)研究、,不適于產(chǎn)業(yè)應(yīng)用的問題,重新測試、修改、增強(qiáng)了相關(guān)算法,包括PSI/PIR/聯(lián)合統(tǒng)計(jì)/特征工程/邏輯回歸/線性回歸/深度學(xué)習(xí)模型推斷等,令翼數(shù)安全計(jì)算框架擁有更加高效、全面的算法庫,并可與聯(lián)邦學(xué)習(xí)結(jié)合,形成完整的工作流。
此外,翼數(shù)開源還賦予用戶極大的開放性。基于Apache License 2.0軟件許可證,用戶擁有充分空間使用和修改相關(guān)代碼。張霖濤認(rèn)為,這樣的寬松度更便于用戶在他人工作的基礎(chǔ)上貢獻(xiàn)自己的智慧,把整個(gè)系統(tǒng)越做越好,無需從頭開始或“重造輪子”。
他還強(qiáng)調(diào),開源在技術(shù)層面有利于提升隱私計(jì)算安全性,但更重要的還是能讓更多人了解和利用隱私計(jì)算技術(shù)。翼方健數(shù)雖然是一家年輕的公司,卻已是隱私計(jì)算領(lǐng)域的“老兵”,愿意把多年技術(shù)積累和市場經(jīng)驗(yàn)開放給更多終端行業(yè)使用,開源正是理想的分享與推廣方式,有利于擴(kuò)大隱私計(jì)算的整體市場規(guī)模。
與業(yè)界一起“做大蛋糕”正是翼數(shù)開源的核心愿景之一。翼方健數(shù)聯(lián)邦學(xué)習(xí)研發(fā)負(fù)責(zé)人同樣認(rèn)為,借助聯(lián)邦學(xué)習(xí)技術(shù)加速數(shù)據(jù)價(jià)值流通,賦能千行百業(yè)。翼方健數(shù)多方安全計(jì)算研發(fā)負(fù)責(zé)人也表示,MPC技術(shù)具有數(shù)據(jù)隱私高安全和參與方地位平等的特點(diǎn),在業(yè)界同仁的通力合作下定能加速M(fèi)PC技術(shù)規(guī)模化落地應(yīng)用。
精準(zhǔn)解決安全與互通兩大痛點(diǎn)
隱私計(jì)算擁抱開源絕非偶然,開源本身就是整個(gè)軟件產(chǎn)業(yè)的重要模式和趨勢。
中國信通院云計(jì)算與大數(shù)據(jù)研究所副主任姜春宇指出,開源模式正在“吞噬”整個(gè)軟件產(chǎn)業(yè),近年來我國在政策層面鼓勵(lì)開源軟件、開源項(xiàng)目的發(fā)展。從基礎(chǔ)軟件到新技術(shù)領(lǐng)域,開源都在逐步變成軟件研發(fā)迭代,甚至商業(yè)模式的主要形式,整個(gè)軟件產(chǎn)業(yè)走向開源模式已經(jīng)成為明顯趨勢。
對(duì)隱私計(jì)算來說,開源的最大必然性就在于有望徹底解決隱私計(jì)算長久以來急需自證清白、亟待互聯(lián)互通的迫切需求。
中國信通院云計(jì)算與大數(shù)據(jù)研究所所長何寶宏表示,隱私計(jì)算作為數(shù)據(jù)流通的基礎(chǔ)設(shè)施,除了開源的通用優(yōu)勢外,由于數(shù)據(jù)全流程的安全性非常重要,將代碼開放會(huì)讓安全性變得更加易于驗(yàn)證;開源社區(qū)內(nèi)的交流和反饋也會(huì)激發(fā)技術(shù)創(chuàng)新,創(chuàng)造滿足不同場景需求的多種技術(shù)方案。
在閉源模式下,自證清白可謂是隱私計(jì)算的一個(gè)先天難題。尤其在推進(jìn)商業(yè)落地的過程中,隱私計(jì)算技術(shù)服務(wù)商始終難以從根本上向用戶證明數(shù)據(jù)在隱私計(jì)算過程中的安全性。開源意味著用戶可以直接在代碼層面檢驗(yàn)相關(guān)系統(tǒng)機(jī)制,為用戶提供了徹底的安全性驗(yàn)證。
張霖濤表示,盡管絕對(duì)安全并不存在,但相比閉源,開源無疑是隱私計(jì)算在自證清白這條路上邁進(jìn)了一大步。
當(dāng)然,心存惡意的技術(shù)服務(wù)商畢竟是極少數(shù)。除了自證清白外,開源提升安全性的更常見場景是把代碼交給更多人檢驗(yàn),發(fā)現(xiàn)bug及時(shí)修補(bǔ)??v觀軟件發(fā)展史,業(yè)界或用戶通過開源為技術(shù)服務(wù)商“捉蟲”的案例經(jīng)常發(fā)生,對(duì)于改進(jìn)代碼,提升系統(tǒng)安全性起到了重要作用。
互聯(lián)互通也是近年來隱私計(jì)算領(lǐng)域面對(duì)的又一大難題。各家技術(shù)服務(wù)商紛紛推出隱私計(jì)算平臺(tái),在為各行各業(yè)消除數(shù)據(jù)孤島的同時(shí),這些隱私計(jì)算平臺(tái)卻各自為政,形成了新的孤島。以宏觀和長遠(yuǎn)眼光來看,這樣的局面仍然阻礙了數(shù)據(jù)價(jià)值發(fā)掘的效率,也影響了隱私計(jì)算產(chǎn)業(yè)的發(fā)展。
近兩年,隱私計(jì)算業(yè)界一直在努力解決互聯(lián)互通問題。中國信通院云計(jì)算與大數(shù)據(jù)研究所工程師呂艾臨表示,目前業(yè)界技術(shù)專家形成的共識(shí)是,隱私計(jì)算互聯(lián)互通在于如何實(shí)現(xiàn)算法的互通,其中算法的開源程度正是關(guān)鍵指標(biāo)。算法開源程度越高,建立信任就更容易,實(shí)現(xiàn)互聯(lián)互通就越簡單直觀。
對(duì)此張霖濤認(rèn)為,隱私計(jì)算平臺(tái)的互聯(lián)互通需要基于共識(shí),還要有實(shí)實(shí)在在的基礎(chǔ)和抓手,代碼就是基礎(chǔ),開源正是抓手和推動(dòng)力。開源有利于各方形成共同代碼,繼而建立連接。翼數(shù)開源也秉承了這一理念,令用戶可以很容易與其他隱私計(jì)算平臺(tái)建立連接。
近年來,翼方健數(shù)一直致力于在更大范圍、更高維度上打通數(shù)據(jù)。翼方健數(shù)相信,隱私計(jì)算平臺(tái)的演化會(huì)經(jīng)歷單體、聯(lián)盟、生態(tài)網(wǎng)絡(luò)三大階段,分別包括單體平臺(tái)(局域網(wǎng))、平臺(tái)聯(lián)盟(專業(yè)網(wǎng)絡(luò))及數(shù)據(jù)和計(jì)算互聯(lián)網(wǎng)IoDC (Internet of Data & Computing)。
張霖濤表示,梅特卡夫定律揭示網(wǎng)絡(luò)價(jià)值與連接用戶數(shù)的平方成正比,用戶越多,網(wǎng)絡(luò)價(jià)值越大。互聯(lián)網(wǎng)如此,數(shù)據(jù)網(wǎng)絡(luò)也是如此,IoDC的建設(shè)就是希望促進(jìn)數(shù)據(jù)流通,建立更廣泛的數(shù)據(jù)連接,讓數(shù)據(jù)產(chǎn)生更大價(jià)值,相信開源能夠起到橋梁與催化劑的作用。
技術(shù)之上:商業(yè)模式的創(chuàng)新契機(jī)
時(shí)至今日,開源的涵義早已超越了開放源代碼,而是開啟了軟件業(yè)創(chuàng)新商業(yè)模式的新契機(jī)。隱私計(jì)算進(jìn)入開源時(shí)代,同樣將對(duì)技術(shù)服務(wù)商、用戶、產(chǎn)業(yè)帶來深遠(yuǎn)影響。
中國開源軟件推進(jìn)聯(lián)盟《2021中國開源發(fā)展藍(lán)皮書》指出,全球范圍內(nèi)開源商業(yè)模式正在逐漸成熟。在一些特色領(lǐng)域,開源軟件的商業(yè)價(jià)值甚至超過閉源軟件,開源相關(guān)風(fēng)險(xiǎn)投資交易總量與金額急劇增長,并涌現(xiàn)出一大批上市公司,國際高度分工的數(shù)萬億美元開源核心技術(shù)生態(tài)體系已經(jīng)形成。
姜春宇表示,隱私計(jì)算開源具有重要意義。對(duì)于隱私計(jì)算領(lǐng)域的開發(fā)者來說,開源是企業(yè)社會(huì)責(zé)任的體現(xiàn),有助于提升企業(yè)影響力,在商業(yè)上則有助于構(gòu)建更廣泛的上下游生態(tài)圈,布局更完善的商業(yè)模式。對(duì)于使用者來說,開源令用戶可以方便地下載和使用源代碼,從而降低開發(fā)門檻,縮短開發(fā)時(shí)間,開發(fā)成本進(jìn)一步降低,選擇更加豐富自由。對(duì)整個(gè)隱私計(jì)算行業(yè)來說,開源可以促進(jìn)不同用戶群體間的交流,豐富行業(yè)應(yīng)用、易于發(fā)現(xiàn)問題、激發(fā)技術(shù)創(chuàng)新。
張霖濤認(rèn)為,伴隨技術(shù)發(fā)展,越來越多的行業(yè)玩家都已具備相當(dāng)技術(shù)實(shí)力,想要進(jìn)一步拉開競爭差距,就必須對(duì)行業(yè)有更深入的洞察,而不再是純技術(shù)問題。人工智能等新科技領(lǐng)域的開源歷史已經(jīng)給隱私計(jì)算提供了借鑒參考,當(dāng)有更多人都能訓(xùn)練出優(yōu)秀的人工智能模型,獲得絕對(duì)技術(shù)優(yōu)勢也就變的變得更難。TensorFlow、PyTorch等開源框架的出現(xiàn),就在技術(shù)競爭之上轉(zhuǎn)向吸引更多人進(jìn)入AI賽道,推動(dòng)AI的整體發(fā)展。
他希望隱私計(jì)算也會(huì)遵循相似路徑,從發(fā)展初期大家爭相比拼技術(shù),到通過開源降低行業(yè)門檻,讓更多用戶和行業(yè)使用隱私計(jì)算并發(fā)掘數(shù)據(jù)價(jià)值,共同把整個(gè)隱私計(jì)算行業(yè)做大做強(qiáng)。
當(dāng)然,要讓開源真正實(shí)現(xiàn)初心愿景并非易事,往往意味著大量技術(shù)與運(yùn)營資源投入,許多國際上成功的開源項(xiàng)目或基于開源信念由眾多個(gè)體參與者自發(fā)投入,或由實(shí)力雄厚的互聯(lián)網(wǎng)巨頭投入主導(dǎo)。相比之下,以創(chuàng)業(yè)公司的姿態(tài)投身開源,就意味著對(duì)開源這件事有更客觀和清晰的地認(rèn)識(shí),翼方健數(shù)已然做好準(zhǔn)備了。
張霖濤坦言,翼方健數(shù)在技術(shù)上并未選擇一開始就采用“重”投入策略,翼數(shù)開源兩大框架以輕量化為特色正是基于這樣的考量,開源初期搭建起靈活的框架,吸引更多社區(qū)力量做出貢獻(xiàn)。
然而不可忽視的是,開源在給隱私計(jì)算用戶帶去“福利”的同時(shí),也對(duì)技術(shù)服務(wù)商提出了更高要求,帶來挑戰(zhàn)甚至是風(fēng)險(xiǎn)。
姜春宇就指出,開源雖然有很多好處,但也伴隨風(fēng)險(xiǎn),需要長期關(guān)注,其中主要是合規(guī)風(fēng)險(xiǎn)和代碼安全漏洞風(fēng)險(xiǎn),如泄露自身商業(yè)秘密,未遵守或識(shí)別知識(shí)產(chǎn)權(quán)問題導(dǎo)致違法等。另外,開源的“靈魂”或價(jià)值核心——開源社區(qū)也會(huì)帶來不少艱辛與挑戰(zhàn),如吸引和留存用戶,社區(qū)治理等。
事實(shí)上,開源的一大“副作用”就在于,把長期的技術(shù)積累公開示人相當(dāng)于把競爭優(yōu)勢拱手相讓,同行或?qū)κ植粌H能獲取相關(guān)技術(shù),甚至能以此為基礎(chǔ)一舉超越代碼原創(chuàng)者。
對(duì)此張霖濤坦言,風(fēng)險(xiǎn)確實(shí)存在,但應(yīng)該正面看待。相比風(fēng)險(xiǎn),開源更大的價(jià)值是提升商業(yè)格局。翼方健數(shù)面對(duì)市場競爭方面并不擔(dān)憂,而是相信能通過開源做大市場,這樣所有參與者都將成為受益者。
對(duì)于安全漏洞與攻擊,張霖濤指出,這些風(fēng)險(xiǎn)本質(zhì)上并非直接源于開源,即使在閉源模式下也可能發(fā)生,開源反而能讓更多人幫助技術(shù)服務(wù)商發(fā)現(xiàn)bug,盡早修補(bǔ)。而在社區(qū)建設(shè)方面,翼方健數(shù)自身也是這兩大框架的積極用戶,會(huì)投入足夠技術(shù)資源持續(xù)開發(fā)和改良。
盡管需要投入,也必然有挑戰(zhàn)和風(fēng)險(xiǎn),但事實(shí)已經(jīng)證明,成功的開源項(xiàng)目可以形成價(jià)值巨大的商業(yè)體系,如MongoDB市值近200億美元、微軟以75億美元收購 GitHub、IBM花費(fèi)340億美元收購Red Hat等,許多國內(nèi)外新興開源項(xiàng)目也吸引了大量資本涌入。
可以預(yù)見,隱私計(jì)算領(lǐng)域的開源也將帶來商業(yè)模式的一場變革。張霖濤并不諱言,開源除了在技術(shù)上有助于自證清白,證明團(tuán)隊(duì)技術(shù)實(shí)力外,還激發(fā)了翼方健數(shù)對(duì)商業(yè)模式創(chuàng)新的思考。
他希望,開源能為公司獲得更多市場認(rèn)可,吸引更多客戶。隱私計(jì)算技術(shù)服務(wù)商的盈利模式并不在于單項(xiàng)技術(shù)或?yàn)榭蛻敉瓿身?xiàng)目,而應(yīng)該始終緊抓數(shù)據(jù)價(jià)值,從構(gòu)建全棧技術(shù)打通數(shù)據(jù)鏈路、促進(jìn)數(shù)據(jù)流通等方面入手,最終實(shí)現(xiàn)以發(fā)掘數(shù)據(jù)價(jià)值為盈利模式。在這樣的思路下,數(shù)據(jù)網(wǎng)絡(luò)的擴(kuò)展和用戶社區(qū)的擴(kuò)大都將有望給公司帶來更大經(jīng)濟(jì)效益。
《2021中國開源發(fā)展藍(lán)皮書》指出,未來10年中國將迎來世界級(jí)優(yōu)秀開源公司,一個(gè)商業(yè)化開源公司的成功需要方方面面,它需要整個(gè)團(tuán)隊(duì)往前推,不僅僅是技術(shù)團(tuán)隊(duì)在往前走,而是所有人同心協(xié)力往前走。要保證團(tuán)隊(duì)具備技術(shù)之外的壁壘,要補(bǔ)足團(tuán)隊(duì)的短板,比如開發(fā)者關(guān)系、市場契合度、設(shè)計(jì)團(tuán)隊(duì)甚至樹立公司的品牌形象,都需要去做。
隱私計(jì)算領(lǐng)域是否能誕生現(xiàn)象級(jí)的開源商業(yè)標(biāo)桿,翼方健數(shù)已在開拓前行,正如張霖濤所說:“開源推動(dòng)技術(shù)發(fā)展,開源時(shí)代已來,翼方健數(shù)赴約而來”。
一場勝負(fù)在于是否有全局觀,數(shù)據(jù)價(jià)值鏈路的挑戰(zhàn)遠(yuǎn)不止于此。但敢于亮出數(shù)據(jù)流通的底牌,至少說明這是一張實(shí)力過硬的王牌。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )