唯物論有句經(jīng)典名言:世界是物質(zhì)的,物質(zhì)是運動的,運動是有規(guī)律的。這不僅是在描述人類所生活其中的宏觀世界,也道出了微觀世界的本質(zhì)。得益于理論發(fā)展、實驗和計算技術(shù)的飛躍,人們對種種宏觀自然科學現(xiàn)象的解釋已經(jīng)越來越向微觀粒子世界探求。
比如我們已經(jīng)普遍認識到,當物質(zhì)從固態(tài)向液態(tài)和氣態(tài)轉(zhuǎn)變,是分子運動速度加快、分子間相互作用力減弱的過程;藥物進入人體后帶來疾病的治愈,是藥物分子與蛋白質(zhì)等生物大分子之間發(fā)生相互作用的結(jié)果。這種觀察方式在生命科學相關(guān)領(lǐng)域尤其深入人心,生命的維持有賴于分子運動,要揭示各種生物分子的功能,就必須捕捉到它們的三維構(gòu)象動態(tài)分布,而不僅僅是單一結(jié)構(gòu)的靜態(tài)描繪。
這一范式的興起和發(fā)展,離不開一種強大的、基于計算的研究工具,那就是分子動力學(Molecular Dynamics,MD)。
如何在計算機上看見動起來的粒子
分子動力學誕生于上世紀50年代末,由兩位計算物理學家Berni Alder和Tom Wainwright提出。
它是一種基于經(jīng)典牛頓力學的分子模擬方法,能夠計算出分子體系隨時間的演化性質(zhì),利用這種方法,可以基于當前分子體系的位置、速度和動能等信息輸入,來預測一定時間后該體系的位置、速度和動能,獲取分子體系中各種粒子(如分子、原子、離子等)的運動軌跡,從而得到體系的統(tǒng)計性質(zhì),比如可能的構(gòu)型、熱力學參數(shù)、分子在溶液中的擴散行為、平衡態(tài)性質(zhì)等。
顯然,利用分子動力學模擬能夠獲取的信息量,直接上升了一個維度,所以它的出現(xiàn)很快就在許多科學領(lǐng)域帶來了變革性的進展。研究人員可以使用MD來模擬計算藥物與靶標蛋白的作用機制,為藥物設計和新藥的發(fā)現(xiàn)提供寶貴的線索;在材料科學中,MD被用于分析材料的結(jié)構(gòu)、相變過程、生長和界面現(xiàn)象,為預測材料性能和優(yōu)化材料設計提供科學依據(jù),尤其在電子元件、催化劑等的研發(fā)中發(fā)揮著重要作用。同時,凝聚態(tài)物理領(lǐng)域的超導體、磁性材料等凝聚態(tài)系統(tǒng)的結(jié)構(gòu)、相變和動力學,也需要借助MD來研究。
可以說,分子動力學方法的核心價值,就是為這些領(lǐng)域的微觀粒子研究提供了一個三維且動態(tài)的觀察窗口,與靜態(tài)的平面結(jié)構(gòu)相比,一段動起來的“蛋白質(zhì)影片”給人呈現(xiàn)的信息無疑更加直觀、清晰且豐富。
這也是最近備受矚目的Alphafold 3不能完全代替分子動力學的原因。
今年5月,谷歌子公司DeepMind推出的AlphaFold 3模型登上Nature頭版,在生物學和AI界引起了極大關(guān)注,它能夠以前所未有的原子精度預測出幾乎生物分子的結(jié)構(gòu)和相互作用,被認為是計算結(jié)構(gòu)生物學發(fā)展的一大里程碑,將加速生物醫(yī)學上的突破。
AlphaFold 3對感冒病毒Spike蛋白(藍色)的靜態(tài)結(jié)構(gòu)預測,灰色部分為預測結(jié)果。
但顯而易見,Alphafold也有它無法完成的任務,正如AlphaFold 3的作者所承認,它只能做生物分子3D結(jié)構(gòu)的靜態(tài)預測,而不能刻畫對溶液中生物分子系統(tǒng)的動力學行為,對復雜的「蛋白質(zhì)-蛋白質(zhì)」或「蛋白質(zhì)-小分子」相互作用的捕捉能力很有限,此外,它還有深度學習模型所固有的黑盒性質(zhì),可能會產(chǎn)生一定幻覺,導致其預測準確性降低。
許多應用Alphafold做分子結(jié)構(gòu)預測的研究都表明,分子動力學模擬始終發(fā)揮著不可替代的作用。比如2023年發(fā)表在《Journal of Chemical Information and Modeling》期刊上的一項研究,使用Alphafold 2對嗅覺受體的結(jié)構(gòu)進行的預測只能得到單一結(jié)構(gòu),并不能捕捉該受體可能的多種構(gòu)象狀態(tài),而且仍必須依賴分子動力學模擬對模型預測做精細的調(diào)整和驗證。
作者在論文中強調(diào),MD模擬是檢驗模型預測結(jié)構(gòu)的穩(wěn)定性的關(guān)鍵。
分子動力學的“動態(tài)3D特效”
MD捕捉分子動態(tài)性的能力帶給自然科學的價值之大,其實可以類比電腦生成圖像技術(shù)(Computer-generated imagery,CGI)出現(xiàn)后,為電影、游戲、虛擬現(xiàn)實等領(lǐng)域帶去的革命性影響。
同樣是基于計算機,MD模擬微觀粒子的運動,CGI則以3D建模的方式復刻宏觀世界的事物,以及進一步創(chuàng)造出不存在的虛擬物,給人以假亂真的視覺效果。
在CGI技術(shù)出現(xiàn)以前,電影的制作只能完全基于物理現(xiàn)實去安排人物角色和場景,難以將無限的創(chuàng)意變?yōu)楝F(xiàn)實,電影的造夢特質(zhì)大打折扣。此外,傳統(tǒng)影視拍攝中的許多復雜場景,都不得不通過物理裝置和實景建造來呈現(xiàn),所以投入成本高,制作周期長。
而CGI的出現(xiàn)帶來了一場電影行業(yè)的革命。一方面,電影和視頻游戲可以打破物理現(xiàn)實的限制創(chuàng)造虛擬的角色和場景。比如《指環(huán)王》中的獸人士兵,這些靈動的角色和復雜的虛擬場景都是出自CGI的“魔法”。另一方面,CGI也使電影行業(yè)更加工業(yè)化,大大降低了制作成本。比如說要完成一個成千上萬人的人群全景的拍攝,使用CGI要劃算得多;對于動畫影片的制作,基于計算機的CGI也有著比傳統(tǒng)人工畫紙更高的生產(chǎn)效率。
電影《阿凡達》
MD方法對于自然科學研究有著相似的影響力:降本增效,同時提供更有信息量的“觀看”體驗。
在沒有MD的時代,科學家面臨的首先是研究手段的局限。要研究物質(zhì)的微觀粒子,不外乎理論計算和實驗兩種方式。但從理論到實驗其實存在一定的鴻溝,往往要反復多次試驗,才能獲得可靠的結(jié)論,而且過程中的不可控性較強。拿材料研發(fā)來說,很長一段時間都依賴“原始”的試錯法,人力物力的消耗大,研發(fā)周期很長,失敗風險也不小。
而分子動力學所基于的計算模擬,如今已經(jīng)成為理論和實驗之外的第三大研究工具,對許多科學研究的效率提升和成本降低做出了很大貢獻。
MD讓我們能夠先在計算機上模擬粒子的化學和物理過程,獲取微觀層面的動力學信息,從而提供理論支持,而且還能嚴格控制變量,避免實驗中的潛在不確定因素,指導更好的實驗設計。比如通過模擬材料分子的動力學行為,可以預測材料的宏觀性能,以及合理推測實驗數(shù)據(jù)走勢,實驗的成本就可以節(jié)省許多。此外,MD還大大突破了傳統(tǒng)實驗的環(huán)境限制,在超高壓、超高溫和強電場這些嚴酷條件下,MD模擬就派上用場了。
其次,在不做分子動力學模擬的情況下,人們對分子和原子的觀察只能局限于靜態(tài)影像,信息量有限。比如在做藥物設計時,研究人員就很難看清蛋白質(zhì)的動態(tài)結(jié)構(gòu),以及藥物分子接近其目標受體時是如何運動的。
MD就好比電影中的CGI技術(shù),為蛋白質(zhì)分子結(jié)構(gòu)加上了“動態(tài)3D效果”。無論是冷凍電鏡拍攝的蛋白質(zhì)分子結(jié)構(gòu)“高清照片”,還是AI模型預測的蛋白質(zhì)三維靜態(tài)結(jié)構(gòu),都無法取代分子動力學拍攝出來的蛋白質(zhì)分子結(jié)構(gòu)運動“電影”。畢竟,蛋白質(zhì)一次折疊的信息,就需要至少十億張“照片”才能描述。
計算加速引擎:算得更快,看得更多
在發(fā)展歷程上,分子動力學與CGI還有另外一個不得不提的相似之處,那就是二者都曾經(jīng)歷硬件算力方面的制約。
1990年代中期,人們對于使用計算機來制作整部數(shù)字電影的能力仍抱有懷疑,直到全3D動畫電影《玩具總動員》的出現(xiàn)給了人們信心,但受到當時電腦的計算能力限制,這部影片的每一幀都需要花費4到13個小時。
尤其是其中的渲染技術(shù),對計算資源的要求極高,這事實上推動了后來GPU的誕生。
GPU的全稱是“圖形處理器”(Graphics Processing Unit)”,由英偉達于1999年發(fā)布,它最初的設計目的就是為了加速3D圖形的渲染。CGI技術(shù)發(fā)端于計算機圖形學(Computer Graphics,CG),研究如何在計算機中表示、計算和處理圖形,尤其是要對三維事件的點陣通過矩陣變化投影到二維平面(即光柵化),這需要大量的矩陣計算,而GPU就提供了并行計算的能力,比CPU更快。如今,GPU已經(jīng)從最開始應用于3D渲染、視頻游戲、藝術(shù)設計,到成為人工智能大模型高度依賴的算力引擎。
分子動力學在經(jīng)歷數(shù)十年的計算資源瓶頸后,也終于在2007年迎來了它的超強算力引擎——安騰超級計算機(Anton)。
美國D. E. Shaw研究所設計安騰的目的,就是專門為了加速分子動力學模擬計算。
很長一段時間內(nèi),MD模擬都難以對體系做較長時間尺度的計算,舉個例子,為了“拍攝”到包含百萬個原子的蛋白質(zhì)分子運動“電影”,計算機必須進行以飛秒為時間尺度的連續(xù)運算,每一次計算的對象是100萬原子間的相互作用力,以預測每個原子在下一飛秒的位置、速度和能量狀態(tài)。僅僅1微秒長的“電影”,就需完成高達4億至8億次計算。如此龐大的計算量,即便是全球頂尖的超級計算集群,每天也只能做納秒級別的模擬計算,極大地限制了科研進程。
安騰的橫空出世,革命性地破解了MD模擬的計算難題。為了提升計算效率,安騰在軟硬件方面做了全面的定制化,它采用ASIC(Application Specific Integrated Circuit)專用芯片架構(gòu),盡可能減少了數(shù)據(jù)的傳輸,在芯片上分區(qū)域、分精度計算不同任務,同時還開發(fā)了匹配的動力學模擬軟件Desmond。
最新的第三代安騰計算分子動力學模擬任務的速度,已經(jīng)比現(xiàn)有通用型超級計算機快了100倍以上,可以在10個小時內(nèi)完成過去一整年才能算完的任務。
RLY-4008 與 抑制劑 FGFR2 的復合晶體結(jié)構(gòu)
更振奮人心的是,安騰超算在藥物研發(fā)領(lǐng)域?qū)崿F(xiàn)了震驚世界的落地應用,美國的Relay公司就是在安騰的計算支持下,在2016年成功確認了一款治療膽管癌的FGFR2抑制RLY-4008的結(jié)構(gòu),一舉成為制藥行業(yè)的領(lǐng)頭羊。
這里也順便一提,正如英偉達的頂級圖形顯卡在今天一卡難求,安騰超算也成了一個卡脖子的存在,全球僅有的幾臺機器位于美國D. E. Shaw 研究所和匹茲堡超算中心,其他機構(gòu)都需要研究提案才能申請使用,在分子動力學模擬專用超算的自主研發(fā)上,我們?nèi)沃氐肋h,而且不容懈怠。
因為可以預見的是,分子動力學在基礎(chǔ)科學研究中的價值,及其在產(chǎn)業(yè)應用方面的潛力,還大有探索空間。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )