精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

<dfn id="9zxt7"><td id="9zxt7"></td></dfn>

<strike id="9zxt7"></strike>

直播
榜單
7x24h快訊

極客網(wǎng) > 7x24h快訊 > 極客快訊 >

AI復原古文字登Nature封面？國內(nèi)這家“AI老兵”合合信息也在做

人閱讀
2022-03-11 15:06:45
來源：西盟科技資訊
相關(guān)關(guān)鍵詞
- 合合信息

3月10日，DeepMind的“AI+科學”研究，再登國際學術(shù)頂刊Nature的封面。DeepMind的深度神經(jīng)網(wǎng)絡(luò)Ithaca，能從受損文物中破譯古希臘文字，準確率達到62%，在識別其原始位置方面的準確率達到71%，還能將古文字年代鎖定在其真實日期范圍的30年內(nèi)。

據(jù)悉，這是第一個能夠恢復受損銘文的缺失文字、識別其原始位置并幫助確定其書寫日期的深度神經(jīng)網(wǎng)絡(luò)。研究結(jié)果表明，AI能幫助歷史學家更好地解讀銘文，以助力對古代歷史的論證與理解。當前，歷史學家已經(jīng)使用這個工具，來重新評估希臘歷史上的重要時期。

為了讓研究人員、教育工作者、博物館工作人員和其他人能夠廣泛使用其研究，DeepMind與谷歌云和谷歌Arts & Culture合作，推出了Ithaca的免費互動版本，并開放了其代碼、預訓練的模型和一個交互式的協(xié)作實驗室筆記本。

AI復原古文字登Nature封面？國內(nèi)這家“AI老兵”合合信息也在做

古文字遭破壞？AI能修復這個bug

文字的誕生標志著歷史的開端，對人類理解過去的文明和今天生活的世界至關(guān)重要。例如，2500多年前，希臘人開始在石頭、陶器和金屬上書寫，記錄從租約、法律到日歷和預言的一切，讓人們對地中海地區(qū)有了詳細的了解。不幸的是，這是一個不完整的記錄。

許多幸存下來的銘文在幾個世紀的時間里遭到了破壞，或者從原來的位置被移走了。此外，現(xiàn)代年代測定技術(shù)，如放射性碳年代測定法，無法在這些材料上使用，這使得解讀銘文既困難又費時。

AI復原古文字登Nature封面？國內(nèi)這家“AI老兵”合合信息也在做

為此，DeepMind與威尼斯Ca’Foscari大學人文系、牛津大學古典系、雅典經(jīng)濟與商業(yè)大學信息學系合作，一起探索如何用AI幫助歷史學家更好地解讀這些銘文。

深度神經(jīng)網(wǎng)絡(luò)Ithaca即是他們的最新成果，它以荷馬史詩《奧德賽》中的希臘島嶼命名，在DeepMind此前專注于文本修復的系統(tǒng)Pythia基礎(chǔ)上擴展而成。從實驗結(jié)果來看，這個新算法展示了AI方法能克服現(xiàn)有恢復銘文方法的約束，輔助古語言研究，并幫助對古代歷史有更豐富的理解。

大幅提升修復受損古文字的準確率

Ithaca采用了古希臘語言和整個古代地中海世界的銘文進行訓練，訓練數(shù)據(jù)來自帕卡德人文學院提供的最大的希臘銘文數(shù)字數(shù)據(jù)集。

這一選擇有兩個主要原因。首先，希臘銘文記錄的內(nèi)容和背景的變異性使其成為語言處理的巨大挑戰(zhàn);其次是因為古希臘語數(shù)字化語料庫的可用性，這是訓練機器學習模型的基本資源。

自然語言處理(NLP)模型通常用單詞(word)進行訓練，因為它們在句子中出現(xiàn)的順序和它們之間的關(guān)系提供了額外的上下文和含義。然而，許多歷史學家有興趣讓Ithaca進行分析的銘文都已損壞，而且經(jīng)常缺失文本塊。

DeepMind使用單詞和單個字符作為輸入來訓練模型，以確保Ithaca用這類文本時能正常工作。模型核心的稀疏自我注意機制并行地評估這兩個輸入，允許Ithaca根據(jù)需要評估銘文。

實驗結(jié)果表明，Ithaca的設(shè)計決策和可視化輔助使研究人員更容易解釋結(jié)果。單獨工作時，Ithaca在修復受損文字方面達到了62%的準確率;與DeepMind合作的歷史學家在單獨修復古代文獻時，準確率為25%;而當歷史學家與Ithaca合作時，修復受損文字的準確率提高至72%。

Ithaca還可以確定銘文書寫的原始地理位置，準確率達到71%，并能將銘文的書寫年代縮小至與歷史學家提出的日期相差30年以內(nèi)。研究人員認為，AI和歷史學家之間的這種合作，可能有助于改變對古代世界的研究，比如幫助推進歷史解釋，建立歷史事件的相對日期，乃至為當前的方法論爭鳴做貢獻。

例如，目前歷史學家對雅典頒布的一系列重要法令的日期存在分歧，這些法令是在蘇格拉底和伯里克利等著名人物在世的時期頒布的。這些法令一直被認為是在公元前446/445年之前寫的，盡管有新的證據(jù)表明日期是公元前420年。雖然看起來差別不大，但這些法令對于理解古典雅典的政治史至關(guān)重要。

DeepMind采用的訓練數(shù)據(jù)集包含公元前446/445年的早期圖像。為了測試Ithaca的預測，研究人員在一個不包含日期銘文的數(shù)據(jù)集上對它進行了重新訓練，然后提交這些沒被包含在數(shù)據(jù)集中的文字進行分析。結(jié)果，Ithaca對這些法令的平均預測日期是公元前421年，這與新證據(jù)推測的日期一致。

由此可見，機器學習能幫助圍繞希臘歷史上最重要時刻之一的辯論提供支撐。

提供可視化輔助工具，直觀呈現(xiàn)AI分析的結(jié)果

為了將Ithaca作為研究工具的價值最大化，研究團隊還創(chuàng)造了一些可視化輔助工具，來確保歷史學家能夠輕松地解釋Ithaca輸出的結(jié)果。

(1)修復假設(shè)：Ithaca為文本修復任務生成了幾個預測假設(shè)，供歷史學家利用專業(yè)知識進行選擇。

(2)地理屬性：Ithaca向歷史學家展示了它的不確定性，它給出了所有可能預測的概率分布，而不是單一的輸出。它提供了84個不同古代地區(qū)的概率，代表其確定性水平，并將這些結(jié)果可視化顯示在地圖上，以闡明古代世界潛在的地理聯(lián)系。

(3)時間歸屬：當確定文本的創(chuàng)作日期時，Ithaca會產(chǎn)生一個從公元前800年到公元800年所有幾十年的預測日期分布。歷史學家能看到模型對特定日期范圍的可信度，這可能提供有價值的歷史見解。

(4)顯著性圖：為了將結(jié)果傳達給歷史學家，Ithaca使用了計算機視覺中常用的一種技術(shù)，它可以識別哪些輸入序列對預測的貢獻最大。該輸出對影響Ithaca關(guān)于缺失文本、位置和日期預測的單詞用不同的顏色加以突出。

AI復原古文字登Nature封面？國內(nèi)這家“AI老兵”合合信息也在做

(由顏色標注突出顯示了Ithaca聚焦的詞)

AI與人文學科的合作，正釋放出更大潛力

DeepMind研究團隊相信，這只是像Ithaca這樣的AI工具的開始。古希臘只是全球文明圖景的一部分，DeepMind還在研究由其他古代語言訓練的Ithaca版本，歷史學家已經(jīng)可以在當前的建筑中使用他們的數(shù)據(jù)集來研究阿卡德語、希伯來語、瑪雅語等古代文字體系。

我國的研究團隊也早已開展了用AI識別古文字的研究。在2021年世界人工智能大會上，國內(nèi)智能文字識別領(lǐng)域頭部企業(yè)合合信息就曾展示一種將古代象形文字甲骨文識別并翻譯成現(xiàn)代漢字的AI技術(shù)，這不僅有助于實現(xiàn)甲骨文研究資料電子化、數(shù)據(jù)化，也為破解甲骨文謎題提供了新的數(shù)字化手段。

AI復原古文字登Nature封面？國內(nèi)這家“AI老兵”合合信息也在做

(合合信息用AI識別翻譯甲骨文)

我們期待看到更多諸如此類的研究，可以釋放AI和人文學科之間的合作潛力，改變歷史學家研究和確定人類歷史重要時期的方式，幫助我們獲得對古代文明更豐富的認知。

（免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）

極客觀察

贊助商

簡版
原版
投稿
回頂部

<div id="dwaqq"></div>

<dfn id="dwaqq"></dfn>

<strike id="dwaqq"></strike>