2020年10月27日,國家基因庫生命大數(shù)據(jù)平臺(CNGBdb)在第十五屆國際基因組學(xué)大會(ICG-15)上重磅發(fā)布一項(xiàng)全新功能——生命大數(shù)據(jù)可信計(jì)算平臺CODEPLOT。
CODEPLOT是一個(gè)集可信計(jì)算環(huán)境和多元化在線分析工具于一體的生命大數(shù)據(jù)分析平臺,是國內(nèi)首個(gè)將數(shù)據(jù)加密、區(qū)塊鏈、安全多方計(jì)算、基因安全容器虛擬化等最新安全策略應(yīng)用于生命大數(shù)據(jù)分析利用和合作共享的平臺。其正式發(fā)布將生命大數(shù)據(jù)的安全共享和利用轉(zhuǎn)化帶上了一個(gè)新臺階。
上圖:國家基因庫副研究員丁遠(yuǎn)彤博士現(xiàn)場介紹CODEPLOT
CODEPLOT是一個(gè)靈活、可信的計(jì)算平臺,用戶無需任何編程背景,也可使用該平臺的計(jì)算工具進(jìn)行自動化的生物信息學(xué)分析。同時(shí),它采用區(qū)塊鏈和多方安全計(jì)算等前沿技術(shù),確保用戶的數(shù)據(jù)安全。
數(shù)據(jù)孤島、數(shù)據(jù)安全、數(shù)據(jù)分析門檻……
生命大數(shù)據(jù)研究面臨新挑戰(zhàn)
大數(shù)據(jù)時(shí)代下,生命科學(xué)的研究模式已經(jīng)轉(zhuǎn)化為數(shù)據(jù)驅(qū)動的科學(xué)發(fā)現(xiàn)模式,高效利用多組學(xué)、多層次的大數(shù)據(jù)可有效促進(jìn)各領(lǐng)域的基礎(chǔ)研究及科研成果轉(zhuǎn)化。然而,以下痛點(diǎn)仍然有待解決:
當(dāng)前,生命大數(shù)據(jù)多分散在科研工作者手中或研究單位內(nèi)部,數(shù)據(jù)孤島化問題嚴(yán)重,如何打破這一局面?
數(shù)據(jù)共享有助科學(xué)發(fā)展,可是信息安全問題日益突出,如何在保障數(shù)據(jù)安全的情況下進(jìn)行數(shù)據(jù)共享?
在數(shù)據(jù)驅(qū)動的科學(xué)發(fā)現(xiàn)模式中,數(shù)據(jù)分析必不可少,但需要交叉學(xué)科背景,非專業(yè)人員如何突破高門檻?
……
為了解決生命大數(shù)據(jù)研究中的上述新挑戰(zhàn),CNGBdb打造了集可信計(jì)算環(huán)境和多元化在線分析工具于一體的生命大數(shù)據(jù)分析平臺CODEPLOT。
打破孤島/門檻的數(shù)據(jù)安全共享新模式
可信計(jì)算平臺CODEPLOT
CNGBdb可信計(jì)算平臺CODEPLOT基于區(qū)塊鏈和安全多方計(jì)算等技術(shù),以數(shù)據(jù)匯交模塊存儲的海量數(shù)據(jù)為支撐,以靈活工作空間管理模式為核心,同時(shí)提供多元化分析工具,全面打通各科研機(jī)構(gòu)之間的數(shù)據(jù)孤島,突破數(shù)據(jù)分析門檻,提升數(shù)據(jù)利用率,促進(jìn)重大科研項(xiàng)目合作共享及成果轉(zhuǎn)化。
上圖:生命大數(shù)據(jù)可信計(jì)算平臺CODEPLOT
CODEPLOT為用戶提供:
一、可信計(jì)算環(huán)境
基于多級權(quán)限控制,利用數(shù)據(jù)存儲加密、傳輸加密和安全多方計(jì)算等技術(shù),使得用戶能夠在不公布己方數(shù)據(jù)的前提下,完成自有數(shù)據(jù)分析;以“雖彼此不可見,但可共享使用”(即“可用不可見”)的方式,完成協(xié)同分析。同時(shí)結(jié)合區(qū)塊鏈技術(shù),保證所有數(shù)據(jù)和計(jì)算過程均可回溯且不可篡改,為平臺用戶提供可信的計(jì)算環(huán)境。
二、多元化工具集
提供常用的生物信息分析流程,包括單細(xì)胞聚類scanpy分析、轉(zhuǎn)錄組差異分析edgeR分析、HMMER基因家族分析、新冠病毒數(shù)據(jù)BLAST檢索等16種分析流程。同時(shí),支持用戶使用流程管理工具WDL搭建自定義的分析流程。
三、個(gè)性化工作空間
采用工作空間構(gòu)建計(jì)算沙箱,用戶可在自己的工作空間內(nèi)選擇分析工具、數(shù)據(jù)集和計(jì)算模式。采用單方計(jì)算模式時(shí),用戶可單獨(dú)針對自有數(shù)據(jù)進(jìn)行分析,或者與平臺現(xiàn)有的公開數(shù)據(jù)合并分析;采用多方計(jì)算模式時(shí),用戶通過共享空間方式與不同地域研究者/研究團(tuán)隊(duì)進(jìn)行協(xié)作分析。
四、開放式數(shù)據(jù)資源
用戶可以利用三種不同的數(shù)據(jù)集進(jìn)行分析:1.公開數(shù)據(jù)集,即平臺基于CNGBdb及其他公共數(shù)據(jù)庫(如NCBI、Pfam等)的數(shù)據(jù)資源建成的公共數(shù)據(jù)集,涵蓋植物、動物、微生物、疾病等多個(gè)研究領(lǐng)域。2.私有數(shù)據(jù)集,即用戶自行上傳的自有數(shù)據(jù)集。3.授權(quán)數(shù)據(jù)集。合作伙伴可以授權(quán)對方使用自己的私有數(shù)據(jù)集,以進(jìn)行聯(lián)合分析。
不論你是否有生信背景,即使你與合作伙伴相隔千里,CODEPLOT都可以幫你完成數(shù)據(jù)分析并實(shí)現(xiàn)安全共享!
注:CODEPLOT由CNGBdb團(tuán)隊(duì)設(shè)計(jì)開發(fā),由華大磐石提供安全相關(guān)的技術(shù)支持。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )