精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>
  • <span id="ixlwe"></span>

  • <abbr id="ixlwe"></abbr>

    突破存儲墻用容量換效率!瑞金醫(yī)院煉就沖擊IO-500頂尖大數(shù)據平臺

    親,你聽過轉化醫(yī)學么?

    所謂轉化醫(yī)學(Translational Medicine),顧名思義,核心就在于“轉化”。它不是單一的學科或技術,而是突出一種多學科、多技術融合和轉化的狀態(tài),即從實驗室到臨床(bench to bedside)、從臨床到實驗室(bedside to bench)的應用拓展。轉化醫(yī)學運用現(xiàn)代分子生物學等技術將實驗室研究成果轉化為臨床應用的產品與技術,同時通過臨床觀察與分析幫助實驗室更好地認識人體與疾病,并通過優(yōu)化實驗設計來促進基礎研究。目前,像新藥研發(fā)、醫(yī)療器械、醫(yī)療APP、分子診斷等都屬于轉化醫(yī)學的范疇。

    轉化醫(yī)學也是當下最熱門的醫(yī)療方向之一。畢竟在大眾的認知中,能看好病的醫(yī)生才是好醫(yī)生,而轉化醫(yī)學就是將科研實驗室中的研究成果轉換為實際的臨床成績——比如由上海瑞金醫(yī)院陳竺、陳賽娟院士研究推動的采用全反式維甲酸+三氧化二砷誘導療法治療M3型急性白血病,就是轉化醫(yī)學的經典成功案例。

    為了把這些成功案例復刻、普及,以及創(chuàng)造更多經典案例,轉化醫(yī)學中心的日常工作,就是圍繞基因組測序、轉錄組測序、藥物篩選等各種先進組學等研究形成多維度的數(shù)據流,之后再對這些數(shù)據流進行綜合分析和挖掘,提供與疾病診斷和治療相關的遺傳和臨床信息,待形成特征數(shù)據后再通過機器學習、深度學習和人工智能等方法整合特征數(shù)據與臨床診療方案,成就真正意義上的精準分析、輔助診斷和個性化醫(yī)療。

    這是一項步驟繁瑣、流程漫長、體量龐大的數(shù)據網絡,其中僅單個人類全基因組測序分析涉及的數(shù)據就可能高達870 GB,所以對于這些數(shù)據的快速處理并最終快速形成結論,就顯得至關重要。因此,轉化醫(yī)學對于高性能計算平臺性能的需求較以往或者其他學科更高、也更嚴苛。

    與病魔賽跑,轉化醫(yī)學更看重時效性

    談到轉化醫(yī)學在中國的具體落地和實踐,就不得不提到轉化醫(yī)學國家重大科技基礎設施(上海)(以下簡稱“國家轉化醫(yī)學中心”),它是中國首個也是目前國內唯一建成的國家級綜合性轉化醫(yī)學中心,其重點研究方向聚焦腫瘤(包括白血?。⒋x性疾病和心腦血管疾病等領域。作為一家現(xiàn)代化、數(shù)字化特色顯著的醫(yī)療科研單位,該中心瑞金基地設有300張病床,這些病床可通過智能設備及信息化技術組成多功能智慧臨床研究集群,每個床單元都具備自動感知以及臨床研究數(shù)據自主集采功能。每天,這些病床采集的數(shù)據都通過后端的高性能計算平臺得到分析,以便相關團隊有針對性地制定治療方案,而這也正是轉化醫(yī)學的主要應用方式。

    由此看來,轉化醫(yī)學可謂一種新型、數(shù)字化醫(yī)療方式,它不同于傳統(tǒng)醫(yī)學的望聞問切和常規(guī)的影像檢測手段,而更強調智能化以及算力的價值。同時,由于醫(yī)療行業(yè)的特殊性,許多疾病的治療過程都可謂是“與病魔賽跑”,所以提前一天、一小時甚至一分鐘,都有可能增加患者存活和治愈的概率。在這種情況下,轉化醫(yī)學所用的計算平臺自然需要更快更強,無論是在數(shù)據的處理,還是數(shù)據的存儲和應用等方面,都對性能有著嚴苛的要求。

    “因為每個患者的情況不一樣,相應地,臨床研究及手術治療的手段也不一樣。國家轉化醫(yī)學中心的建立就是希望能夠在一個整體的地方,讓數(shù)據和信息得到快速流轉和共享。比如臨床數(shù)據進來后馬上可以在我們的超算平臺上進行計算,這些計算結果又會及時反饋給醫(yī)生,為其制定診療方案提供有用信息”,在談到利用IT與時間賽跑的重要性時,ASTRA高性能計算平臺共同負責人呂綱如是說。他所負責的ASTRA高性能計算平臺就是整個國家轉化醫(yī)學中心的“大腦”,負責分析和處理所有的臨床數(shù)據,因此容不得半點遲緩。該平臺為此在通用計算上選配了英特爾至強可擴展處理器,并導入了GPGPU來為特定應用加速,這種異構的平臺設計,可以更好地保障充足算力的輸出。

    但打造這樣一套快速響應的IT系統(tǒng)可并非易事。要滿足轉化醫(yī)學科研團隊和臨床醫(yī)生團隊對海量數(shù)據進行高速頻繁讀寫和分析的需求,ASTRA不僅需要具備強勁的算力,還要擁有優(yōu)異的I/O和吞吐能力。在算法和算力突飛猛進的今天,存儲架構很容易成為高性能計算平臺拉胯的主要因素。目前流行的無論是SAN還是NAS存儲,大多沿用的還是之前的架構,尤其是機械硬盤的大量使用對于高帶寬的支持并不友好;雖然目前業(yè)內也有不少閃存甚至全閃存產品,但即便是在互聯(lián)網領域大行其道的Ceph存儲,也難以滿足這樣的要求,同時考慮到未來的持續(xù)升級和快速擴容,Ceph架構也并非理想選擇。存儲難題就這樣,像一堵墻一樣攔在了平臺構建的道路上,難道就真的沒有更合理的破解之道了嗎?

    DAOS借力傲騰持久內存,為“破墻”提供新思路

    開源分布式異步對象存儲(Distributed Asynchronous Object Storage, DAOS)的出現(xiàn),就是產業(yè)界對用戶上述焦慮與困境的回應,它能為業(yè)界打破高性能計算的存儲瓶頸或存儲墻提供全新思路。這是一種由英特爾開發(fā)和開源的軟件定義的橫向擴展對象存儲,與主要針對旋轉介質設計的傳統(tǒng)存儲堆棧不同,DAOS圍繞英特爾主流非易失性存儲器(NVM)技術(包括英特爾傲騰持久內存和英特爾傲騰固態(tài)盤)的使用進行了充分的優(yōu)化(詳見下圖)。

    DAOS 架構與傳統(tǒng)存儲系統(tǒng)的對比

    那么DAOS的實戰(zhàn)性能到底如何呢?剛剛結束的德國ISC22世界超算大會公布了新一期的IO-500榜單。在這份榜單的前十名中,有一半都采用了DAOS存儲架構,這足以證明DAOS在高性能、低時延存儲應用中的出色表現(xiàn)。

    是什么讓DAOS架構能夠得到這么多頂尖HPC系統(tǒng)的青睞,并能幫助它們躋身榜單前列呢?這就需要從它的設計理念說起。

    首先,相較其他分布式存儲系統(tǒng)多使用高時延的點對點通信的設計,DAOS采用的是能夠繞過操作系統(tǒng)的低時延、高消息速率用戶空間通信。而且當下大多數(shù)存儲系統(tǒng)都是針對塊I/O設計的,這種情況下所有I/O操作都需要通過塊接口在Linux內核中進行,從而會產生大量的開銷。DAOS則優(yōu)化了對傲騰持久內存及固態(tài)盤的訪問來規(guī)避了這些不必要的開銷。更具體一點說,DAOS會使用持久內存開發(fā)套件(PMDK)提供對于持久內存的事務訪問,并使用存儲性能開發(fā)套件(SPDK)為NVMe設備提供I/O。

    其次,就架構設計理念來說,DAOS是專為大規(guī)模分布式非易失性內存而設計,并以包括傲騰持久內存在內的SCM(存儲級內存)和NVMe存儲為核心介質,可提供細粒度數(shù)據原生支持的I/O模型,這也是當下以及未來熱數(shù)據應用的先進技術。DAOS還是獨立的高性能容錯存儲層,無需依賴其它層便可進行元數(shù)據及數(shù)據恢復能力管理;而在實際的應用中,元數(shù)據可以保存在傲騰持久內存,更多的批量數(shù)據則會存儲在NVMe固態(tài)盤中。

    看到這里你應該明白了,英特爾NVM技術或者更確切地說英特爾傲騰持久內存可以說是DAOS的骨骼或基石。DAOS的架構設計可充分發(fā)揮這款持久內存自身,以及它與至強可擴展處理器組合后的優(yōu)勢,特別是憑借接近DRAM的性能和數(shù)倍于DRAM的容量,從而將更多數(shù)據存放在距算力、距處理器更近的地方,也就是讓更多數(shù)據的讀寫和處理處于高速、大帶寬和低時延的狀態(tài)下。這也解釋了為什么在IO-500排名中DAOS架構能夠一枝獨秀的原因。

    瑞金醫(yī)院國家轉化醫(yī)學中心借DAOS打破存儲瓶頸,加速轉化醫(yī)學實踐

    鑒于DAOS諸多優(yōu)勢,瑞金醫(yī)院轉化醫(yī)學中心將其引入了ASTRA平臺來攻克存儲瓶頸。用呂綱的話說:“英特爾傲騰持久內存的低時延、高帶寬、大容量、長壽命、非易失等特性,再搭配專為高性能存儲硬件設計的DAOS開源并行文件系統(tǒng),是我們成功構建適用于轉化醫(yī)學應用場景的高性能生信數(shù)據挖掘平臺ASTRA的關鍵,讓我們在實現(xiàn)更優(yōu)存儲和計算能效的同時,推進我們在轉化醫(yī)學領域的探索和實踐?!?/p>

    值得一提的是ASTRA于2021年11月打入了全球IO-500榜單,位列10節(jié)點榜單第8名、總榜單第14名;而在今年最新一期的IO-500榜單上,ASTRA位列10節(jié)點榜單第12名、總榜單第19名。排名的小小變化足以證明高性能計算產業(yè)界在沖擊存儲性能方面的熱衷,但也證明了該平臺的領先地位——憑借讀寫性能達到102.35GiB/s和97.88GiB/s,極端場景下讀寫性能達到81.57GiB/s和71.71GiB/s的成績,它不但遠遠超過了傳統(tǒng)存儲架構的表現(xiàn),也是中國乃至全球范圍內生信領域中存儲性能的佼佼者。

    在實際業(yè)務中,該平臺自投入以來,也使國家轉化醫(yī)學中心數(shù)據處理效率得到了顯著提升。以基因組測序為例,以往做面對超高深度腫瘤的全基因組測序這種超大數(shù)據的處理時,可能需要7天左右,但現(xiàn)在已被壓縮到了8小時以內,是以往效率的21倍?!坝嬎愫臅r大幅縮短,讓醫(yī)生可以更早得到檢測信息、分析結果,從而更早提供更有針對性的診療方案和挽救更多生命,這就是我們?yōu)閷崿F(xiàn)個性化醫(yī)療及精準醫(yī)學而做出的努力”,呂綱表示。

    隨著科技的發(fā)展,越來越多的醫(yī)學診斷都需要高性能計算的支持,需要對于數(shù)據的密集處理和高效分析,由此也引發(fā)了跨界融合的數(shù)字化醫(yī)療應用新趨勢。對于國家轉化醫(yī)學中心來說,急需將強勁算力、海量數(shù)據與自身專業(yè)醫(yī)療經驗相結合,更好地服務于患者。

    就像呂綱說的:“英特爾的技術實力和我們生信領域專家的專業(yè)能力可以比較好地整合在一起,使我們這個平臺成為生信領域第一個能夠在存儲上有所突破的平臺?!?/p>

    免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

    極客網企業(yè)會員

    免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

    2022-08-01
    突破存儲墻用容量換效率!瑞金醫(yī)院煉就沖擊IO-500頂尖大數(shù)據平臺
    DAOS的架構設計可充分發(fā)揮這款持久內存自身,以及它與至強可擴展處理器組合后的優(yōu)勢,特別是憑借接近DRAM的性能和數(shù)倍于DRAM的容量,從而將更多數(shù)據存放在距算力、距處理器更近的地方,也就是讓更多數(shù)據

    長按掃碼 閱讀全文