火熱的隱私計算發(fā)展至今已經完成了從0到1的突破,卻似乎對從1到N有些犯難。
隱私計算以技術實現(xiàn)數據可用不可見并實現(xiàn)商業(yè)落地,可以說是從0到1。很多人或許認為這樣的創(chuàng)造和創(chuàng)新最難,但其后從1到N卻不是簡單復制長大的過程。
對于一家隱私計算技術服務商來說,現(xiàn)實中的數據往往會根據不同場景、不同客戶需求,被不同的應用反復調用計算,不但增加了計算成本,還降低了數據利用效率。
對于不同企業(yè)開發(fā)的各類隱私計算平臺更是如此。單個隱私計算平臺可能解決了一部分數據的共享與流通,但N個隱私計算平臺各自為政卻又形成了新的孤島,反而降低了大數據整體流通的效率。
于是越來越多隱私計算業(yè)界的參與者都開始從更宏觀的層面思考一種更高層級、更大范圍的數據互聯(lián)互通模式。翼方健數CEO羅震就是這方面的先行者之一,他認為實現(xiàn)數據和算法的互聯(lián)互通將會經歷三個步驟,最終將走向一個廣范的數據和計算互聯(lián)網(IoDC)。
首先在單個機構中建立基于隱私安全計算的獨立的數據生態(tài),解耦數據提供方和數據處理方,打通數據供需鏈條,使數據安全有序流通;其次通過平臺聯(lián)邦鏈接多個單體平臺,通過協(xié)議實現(xiàn)平臺聯(lián)盟,聯(lián)盟平臺之間可以實現(xiàn)高效的數據探查、跨平臺數據授權使用和通過隱私計算方式的數據共享;最終通過公開協(xié)議形成更加廣泛的數據和計算的互聯(lián)網(IoDC),實現(xiàn)數據和數據互聯(lián),數據和算法互聯(lián),打破人工智能在數據領域的瓶頸。
在羅震的帶領下,翼方健數開發(fā)了貫穿這些步驟的技術和產品,其中最核心的是公司自主研發(fā)的隱私安全計算平臺翼數坊XDP,以及為實現(xiàn)IoDC第二個關鍵節(jié)點推出的“XDP聯(lián)盟”——通過鏈接眾多翼數坊XDP平臺形成數據和計算網絡。
目前“XDP聯(lián)盟”已完成落地應用,從數據匯集、治理到智能應用輸出,形成價值輸出閉環(huán)。
比如“宜昌市多點觸發(fā)疾控平臺”案例通過政企數據融合及各部委數據協(xié)作實現(xiàn)傳染病多點觸發(fā)預警機制,是典型的數據驅動的智能傳染病防控案例。“中國科學院上海營養(yǎng)與健康研究所NODE-智數坊平臺”案例建立了健康醫(yī)療、生物信息跨區(qū)域數據合作共享模式,基于該平臺發(fā)起的“長三角生物醫(yī)學產業(yè)大數據聯(lián)盟”構建了全新的數據協(xié)作共享生態(tài)。
羅震表示,IoDC的理念已經得到越來越多客戶的認可,因為大家都理解了建立數據計算網絡的必要性,也愿意一起建立區(qū)域的或行業(yè)的IoDC網絡。
建設IoDC可謂愿景宏大,或許也是隱私計算技術服務商更多關注的話題,而真正在實操場景中更普遍的問題,還是如何讓各行業(yè)用戶認識到數據帶來的價值。羅震反復強調,翼方健數不滿足于只給客戶提供技術工具,而是希望讓客戶能夠通過隱私計算這個工具獲得可量化的數據的價值。
這里的可量化正是指用數字說話。比如在瑞金醫(yī)院的案例中,翼方健數打造隱私計算平臺,讓醫(yī)院數據同時服務于臨床應用和醫(yī)學研究。其中在內分泌科,住院病歷輔助書寫從過去耗時20分鐘縮短至5分鐘,上線3個月,就有47%的醫(yī)生在日常工作中使用這一工具,并且這一使用率在不斷攀升。此外,相關數據還幫助腫瘤科制定質子腫瘤大數據治理標準化流程并完成多篇論文發(fā)表。
在智能時代浪潮中,羅震希望與翼方健數共同肩負其IoDC編織者應有的使命感,同時也是在具體場景中為客戶創(chuàng)造真實數據價值的“實踐派”。正如他去年在寄語高考學子時所說:“星光不負趕路人,時光不負有心人”,用技術解鎖數據價值的愿景正在變成現(xiàn)實,IoDC的數據計算網絡也終將筑起。
打造IoDC多維度互聯(lián)互通
算力智庫:作為一家商業(yè)公司是否有足夠能力去實現(xiàn)打造IoDC的宏大愿景,國家和政府需要扮演怎樣的角色?翼方健數在2022年有怎樣的規(guī)劃或節(jié)點目標?
羅震:我們的能力和角色取決于不同場景,我認為先要區(qū)分數據源的類型,如果是連通政府的公共數據,我們就積極參與其中,如果是連通商業(yè)數據,我們就發(fā)揮更大的主導性。
對于政府的公共數據,我們可以扮演三種角色。第一是提供IoDC基礎建設的工具,即隱私計算平臺。第二是對接需求,也就是對接那些對公共數據有需求的商業(yè)公司,因為我們對數據的價值非常了解。第三是做數據加工,因為我們有原始數據加工的能力,把數據加工成數據產品,以便需求方能更好地使用這些數據價值。
另外在商業(yè)領域,我們可以主導做好數據平臺搭建等基礎建設以及數據價值流通。比如為生物醫(yī)藥行業(yè)部署隱私計算平臺,讓商業(yè)機構之間能夠通過平臺實現(xiàn)數據協(xié)作和數據價值共享,這類完全商業(yè)化的數據連通是我們這樣的商業(yè)公司可以承接的。
2022年我們會繼續(xù)推動上述兩個方向的業(yè)務進展,因為我們看到公共數據的利用已經成為各地政府非常關注的話題,同時我們也會持續(xù)推動生物醫(yī)藥等產業(yè)的數據共享。
算力智庫:互聯(lián)網世界中,真實的地理概念是弱化的;而在數據世界中,不同行業(yè)的數據卻涇渭分明。那么在IoDC中,不同行業(yè)數據互聯(lián)互通的價值和難度是否遠大于打破地理界限?在地理連通和行業(yè)連通兩個維度上,IoDC各有怎樣的挑戰(zhàn)?
羅震:從我們的案例來看,比如宜昌傳染病多點觸發(fā)監(jiān)測和智慧化預警平臺,以及“長三角生物醫(yī)學產業(yè)大數據聯(lián)盟”這兩個例子,就分別代表了地域和行業(yè)的互聯(lián)互通,它們在不同維度上都發(fā)揮了很大價值,很難說哪一種模式的價值更大。
我們也可以借用聯(lián)邦學習來做類比,橫向聯(lián)邦學習就好比是行業(yè)維度,縱向聯(lián)邦學習則可以看作地域維度,兩種方式都很重要。因此至少到現(xiàn)在為止,我們還不能把地域互通和行業(yè)互通簡單比較而得出高低結論。
當然無論地域連通還是行業(yè)連通都會有一定挑戰(zhàn)。地域連通的場景更多是在政府的公共數據,這類數據的地理特性更強,挑戰(zhàn)在于只有地方政府才有能力去協(xié)調不同部委之間的數據連通。
而行業(yè)連通是一個行業(yè)數據生態(tài)中的機構、企業(yè)都對數據共享和協(xié)作有意愿,通過數據和計算的網絡把大家串聯(lián)起來,解決單體數據提供者數據量不夠以及數據所有者自身數據處理能力不夠的問題,通過互聯(lián)互通充分發(fā)揮數據價值。所以行業(yè)連通的挑戰(zhàn)就在于不同行業(yè)從業(yè)者對數據協(xié)作和數據共享的認識,認知程度越高,數據共享的門檻和壁壘就越小。
人人都從數據價值中獲益
算力智庫:在業(yè)務實踐中,您可以看出相關終端行業(yè)對隱私計算的認知和應用有哪些共性特點和趨勢?
羅震:過去一年我們客戶數量增長主要源自兩類客戶,一類是政府機構,另一類是企業(yè),企業(yè)還可以再分出不同行業(yè),比如醫(yī)療、金融、營銷等,行業(yè)類型廣泛。
在和各行業(yè)客戶的接觸中,我們直觀感受到各行各業(yè)對數據的認識有了極大提升,其中包括對數據本身重要性的認識,對數據流通必要性的認同,以及對隱私計算技術的認知。過去不少企業(yè)還分不清信息與數據,但今天幾乎所有行業(yè)的企業(yè)都深刻理解了數據的價值,我想這既是數字化轉型時代大潮的推動,也與國家把數據列為生產要素息息相關。
算力智庫:科技公司往往嚴重依賴資本輸血,即使成為高估值的上市公司也仍處于長期虧損,您認為隱私計算行業(yè)距離“造血”或者實現(xiàn)業(yè)務驅動還有多遠?或者說還需要哪些關鍵因素?翼方健數也經歷了多輪融資,對于盈利有怎樣的預期?
羅震:我們一直在講隱私計算是一項非常重要的技術,是促進數據流通的一個必要條件,但還不夠充分,因為隱私計算本身不產生直接的數據價值。數據價值的體現(xiàn)一定是通過人工智能、統(tǒng)計方法等手段,最后給客戶產生最直接的,看得見摸得著的價值,也才能讓客戶有動力采用這樣一套技術解決方案。
這也是為什么翼方健數不僅僅專注于隱私計算本身,不只是給客戶一種技術工具,而是讓他們能夠體會到這個工具帶來的最終價值。從我們的角度來看,要實現(xiàn)業(yè)務驅動的一個核心點就是我們是否有這樣的能力給客戶帶來可以直接感受到,可以量化的數據價值。
我們在融資過程中經常強調的一個理念是數據已經成為生產要素并在不同領域有很多應用,現(xiàn)在也是數據要素市場蓬勃發(fā)展的階段,所以翼方健數希望能在更多領域通過隱私計算等全棧技術手解鎖數據價值。
現(xiàn)在公司的整體業(yè)務狀態(tài)應該說比較景氣,總的來說我們非??春霉鹃L遠的盈利預期。當然對于短期盈利預期,可能現(xiàn)在還不是考慮這個問題的時候,我們眼前的問題還是怎樣在更多行業(yè)、更多場景里去實踐利用技術解鎖數據價值的愿景。
算力智庫:“未來世界只有1%的人掌握算法,其他99%的人只能提供數據。”您是否認同尤瓦爾郝拉利的預言,隱私計算是否有這個潛力,讓所有人都既能對自己的數據做主,又能從中獲得收益,還能讓想要掌握算法的人有足夠的數據可以訓練算法?
羅震:每個數據所有者都期待別人應該要在自己的授權下使用自己的數據,在一些具體場景中加工并產生價值,自己還能從這些價值中獲得收益。我想這就是一種更加良性,或者說更加有序的數據流通狀態(tài)。
我們做隱私安全計算的核心目的就是要為這種更加有序的數據流通提供一套基礎設施,讓所有人都既能對自己的數據做主,同時讓大家可以放心地授權算法方加工自己的數據產生價值,實現(xiàn)數據所有者和加工者的解耦,又能從中獲得收益,這也是我們的初心和出發(fā)點。
至于說未來世界是不是只有1%的人掌握算法,其他99%的人只能提供數據,我想如果按照絕對人口數量來講或許會是這樣。但我們也要看到,算法的門檻正在變低,相比過去做算法需要很多專業(yè)知識,現(xiàn)在做算法已經容易了許多。另外隨著隱私計算的普及,越來越多的數據能夠被利用起來,支持算法訓練,也就有更多人能夠涉足算法而不只是提供數據。
為客戶對接價值
算力智庫:翼方健數成為上海數據交易所首批數商,是否能透露更多相關詳情以及在該體系中的角色?
羅震:我把數商理解為是代理人(agent),他不是數據的擁有者,也不是數據的提供方或需求方,他實際上是個對接人,幫助數據擁有者加工數據形成數據產品,繼而滿足需求方。
作為數商,我們所做的就是在供需雙方之間促成數據產品交易,利用數據源的原始數據,在授權的前提下做加工,再對接需求方。當然我們也可以為數據源直接對接需求方,由他們自行加工數據。
其實在成為上海數據交易所數商前,我們的應用平臺已經幫助多個數據提供方和需求方在數據平臺授權協(xié)作,實現(xiàn)他們對數據價值變現(xiàn)和保護的訴求。
翼方健數一直強調自己是一家“0數據”的數據智能公司,是因為在整個服務過程中,我們不持有數據,只提供工具對數據進行管理,并在獲得授權下幫助客戶加工和處理數據,獲取數據價值。
算力智庫:翼方健數過去一年里業(yè)務實現(xiàn)大幅增長,請問增長主要源于哪些業(yè)務?總結來看,目前對隱私計算技術服務商來說,怎樣的業(yè)務模式是更容易走通的?
羅震:我們的業(yè)務增長主要來自于能給客戶帶來可量化的數據價值的業(yè)務,包括基于翼方健數隱私計算平臺的智能應用,當然也有先做應用再開發(fā)隱私計算平臺的業(yè)務。
從中我們體會到的一般模式是,在開始接觸和初期服務客戶的時候,為了讓客戶對數據價值有更直觀的感受,就需要從一個具體的數據場景切入。比如我們給上海瑞金醫(yī)院做AI病歷書寫的應用,就會讓客戶產生比較強的直接感受,發(fā)現(xiàn)醫(yī)院的數據利用效率明顯提升了。
當客戶嘗到了數據價值的甜頭后,就會有意愿讓數據價值得到更大釋放,比如說未來醫(yī)院應該有怎樣的數據基礎設施才能成為更加智慧的醫(yī)院,后續(xù)我們就可以為他們搭建更多的數據流通平臺。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )