危樓高百尺,手可摘星辰。
不敢高聲語,恐驚天上人。
李白的這首《夜宿山寺》道出了自古人們對太空探索的渴望。借本次國家天文臺與阿里云天文大數(shù)據(jù)聯(lián)合研究中心共同舉辦“天文數(shù)據(jù)挖掘”天池大賽的機會,我們拜訪了國家天文臺懷柔太陽觀測站。在這個“手可摘星辰”的地方,深入了解一下,如何借助阿里云的大數(shù)據(jù)挖掘能力,去深入探索宇宙的秘密。
“天眼”尋天 數(shù)據(jù)挑戰(zhàn)
國家重大科技基礎設施 500米口徑球面射電望遠鏡(FAST),位于貴州省黔南布依族自治州州平塘縣克度鎮(zhèn)金科村的“大窩凼”洼地
在本次活動中,中國科學院國家天文臺研究員、信息與計算中心主任崔辰州博導向我們介紹了在天文觀測中遇到的數(shù)據(jù)挑戰(zhàn):
被譽為“中國天眼”的FAST是世界最大單口徑、最靈敏的射電望遠鏡。理論上說,F(xiàn)AST能接收到137億光年以外的電磁信號,這個距離接近于宇宙的邊緣。FAST這將是一個100億光年的數(shù)字宇宙。
在FAST早期科技的時候,將會采用漂移掃描的觀測模式,這種觀測模式會采用19波束的接收機,它的帶寬是400兆赫茲,通過1G的頻率進行采料,原始數(shù)據(jù)的產(chǎn)生率是38個GB每秒,壓縮后會小大概是原來的1/5到1/6,也就是6GB每秒。進入正式科學觀測后,每天將產(chǎn)生50TB(1TB=1000GB)的數(shù)據(jù)。這樣計算下來,每年會有數(shù)百PB(1PB=1000TB)的數(shù)據(jù)資料產(chǎn)生。國內除了FAST,我們還有像郭守敬望遠鏡、悟空天眼衛(wèi)星,以及在南極的天文臺等等很多的項目。這些國內外的項目,其實帶給我們的就是大數(shù)據(jù)。這些數(shù)據(jù)是天文學家做科學研究、探索宇宙奧秘的精神食糧。
現(xiàn)在一塊3.5英寸的存儲硬盤容量在8-12TB之間,以10TB來計算,數(shù)百PB的數(shù)據(jù)量,就至少需要數(shù)萬塊硬盤來進行支持??梢哉f,“天文數(shù)字”一詞直觀體現(xiàn)了天文學面臨的首要挑戰(zhàn):海量數(shù)據(jù)存儲和超大規(guī)模計算。根據(jù)預測,到2025年,天文觀測相關的數(shù)據(jù)采集量將達到每年250億TB。在一般的數(shù)據(jù)中心中,即便是將這些數(shù)據(jù)存儲下來,可能都是一件無能為力的事情。更何況還需要對這些海量的天文數(shù)據(jù)進行分析處理,從中挖掘出對我們有用的天文信息。
用云存儲 天文數(shù)據(jù)
云計算可以通過統(tǒng)一計算的方式提供出強大分析計算能力,還可以利用分布式存儲提供海量數(shù)據(jù)的存儲。這些天文數(shù)字的天文數(shù)據(jù),是不是也可以通過云存儲技術來進行存儲呢?可是在國內又哪家云計算廠商可以提供如此巨大規(guī)模的云計算系統(tǒng)呢?
阿里云直面了這個挑戰(zhàn)。阿里云自主研發(fā)的飛天超大規(guī)模通用計算操作系統(tǒng),能夠將百萬級的服務器連成一臺超級計算機,提供強大的計算能力。2016年10月云棲大會·杭州峰會上,中科院國家天文臺與阿里云宣布結為戰(zhàn)略合作伙伴,雙方將共同開展跨領域的前沿科學研究和應用合作。成立“國家天文臺-阿里云天文大數(shù)據(jù)聯(lián)合研究中心”;共同完成中國虛擬天文臺上云項目,打造全生命周期的天文大數(shù)據(jù)管理與開放共享平臺;開發(fā)云上天文應用軟件與服務;推進數(shù)據(jù)驅動的天文科普教育,通過互聯(lián)網(wǎng)與大眾共享數(shù)字宇宙;針對光學天文、射電天文、數(shù)值模擬和數(shù)據(jù)挖掘等領域的大數(shù)據(jù)技術與應用開展深度合作等。雙方將以中國虛擬天文臺為抓手,逐步實現(xiàn)國家天文臺科技資源“上云”。
阿里云總裁胡曉明表示:“中國射電望遠鏡的能力,加上中國的計算能力,將通過互聯(lián)網(wǎng)分享給全世界的天文科研工作者及愛好者。這正是我們所追求的普惠科技和無法計算的價值。
在阿里云國家天文臺的合作中,中國天文臺主節(jié)點已成功上云,涉及10億個天體的數(shù)據(jù)通過云端的虛擬天文臺向全球開放,包括LAMOST郭守敬望遠鏡。未來“中國天眼”FAST數(shù)據(jù)也將傳輸?shù)桨⒗镌粕?。上云后,虛擬天文臺生成數(shù)據(jù)產(chǎn)品的周期將由原來的180天縮短到20天;數(shù)據(jù)的處理效率提升了20多倍(由一周縮減為8小時)。
天池助力 探索宇宙
天文數(shù)據(jù)不只需要在云上進行存儲,同時還需要對這些數(shù)據(jù)進行分析,從而獲得對宇宙的新發(fā)現(xiàn)。這就需要借助非常精準的大數(shù)據(jù)分析算法來對這些海量的天文數(shù)據(jù)進行深度的挖掘。然而對天文數(shù)據(jù)的分析,無論在中國還是在全球,都可以算得上是一個創(chuàng)舉,也都是處于摸索之中。如何為天文數(shù)據(jù)找到理想的數(shù)據(jù)分析算法,也是一個全新的天文科學探索課題。
天池大數(shù)據(jù)競賽是阿里云為深度挖掘大數(shù)據(jù)分析潛力而推出的一項競賽活動,讓參賽選手用算法解決社會或業(yè)務問題。在2018年1月19日,在國家天文臺-阿里云天文大數(shù)據(jù)聯(lián)合研究中心共同宣布啟動“天文數(shù)據(jù)挖掘”天池大賽,面向公眾開放天文科學探索課題,為選手提供云計算、人工智能技術,分析望遠鏡收集的真實天文數(shù)據(jù),大賽吸引了近千人報名。
我們在這里也希望,通過這項賽事,可以為宇宙的探索尋找到適用的算法,讓“手可摘星辰”的夢想可以早日實現(xiàn)。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- Commvault持續(xù)業(yè)務策略:應對現(xiàn)代數(shù)據(jù)保護挑戰(zhàn)的新范式
- 2025年網(wǎng)絡安全主要趨勢
- 2025年值得關注的數(shù)據(jù)中心可持續(xù)發(fā)展趨勢
- 量子計算火熱,投資者又在大舉尋找“量子概念股”
- 從量子威脅到人工智能防御:2025年網(wǎng)絡安全將如何發(fā)展
- 后人工智能時代:2025年,在紛擾中重塑數(shù)據(jù)、洞察和行動
- 2025年展望:人工智能推動IT整合
- 量子計算:商業(yè)世界的新前沿與設計思維的融合
- IDC:三季度全球以太網(wǎng)交換機收入同比下降7.9%、環(huán)比增長6.6%
- Fortinet李宏凱:2025年在中國大陸啟動SASE PoP節(jié)點部署 助力企業(yè)出海
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。