精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>
  • <span id="ixlwe"></span>

  • <abbr id="ixlwe"></abbr>

    卡內基梅隆大學開發(fā)AI屆的“歐·亨利”,能斬獲普利策獎嗎?

    高級的自然語言處理系統,比如OpenAI的GPT-2,可以寫出人性化的語言,這一點令人印象深刻。然而,這樣的人工智能的語言往往缺乏說服力和連貫性。其最顯著的特點就是他們難以寫出令人信服的作品——人工智能生成的故事往往是通用的,缺乏上下文。

    為解決這一問題,卡內基梅隆大學計算機科學學院的科學家們設計出一種方法,即為一個給定的故事創(chuàng)造更多“多樣化”的結尾。他們表示,研究的關鍵是訓練人工模型把注意力集中在故事的重要短語上,促進非通用詞的生成。

    “故事情境由連接人物和事件的一系列句子構成。這項任務具有挑戰(zhàn)性,因為它需要對上下文中的角色,事件和對象進行建模,然后根據它們生成連貫且合理的結尾。概括事件和實體的語義以及它們在不同故事中的關系是一項非常重要的任務,”合著者寫道,“我們的研究表明,兩者的結合會帶來更多樣、更有趣的結局?!?/p>

    團隊利用seq2seq模型(一種長短期記憶遞歸神經網絡架構,能夠學習依賴關系),并創(chuàng)建符合目標故事情境的文字的數學表示,學習這些文字之間的關系,將他們轉化為人類可讀的文本。為了整合故事上下文中的關鍵短語,研究人員使用了一種名為RAKE的算法,該算法根據單詞的出現頻率和共現度為短語分配分數,然后根據相應的分數對短語進行手動排序,并將低于一定閾值的短語丟棄。

    為了使模型能夠生成更豐富的結尾,科學家們通過ROCStories數據集升級了他們的模型,該數據集包含超過50,000個五句話的故事。為了評估該模型,他們使用DIST算法計算得出不重復的一元模型(來自給定文本或語音樣本的n個項目的連續(xù)序列)、二元模型(一對連續(xù)寫單位如字母、音節(jié),或文字)和三元模型(三個連續(xù)寫單位)的數量,并將它們與一元、二元和三元模型的總數量相除。

    在另一項測試中,他們訓練谷歌的BERT完成開源故事填空任務,讓BERT在給定兩個選項的情況下選擇正確的故事結尾,從而將模型與基線進行比較。

    那么人工智能的表現如何呢?顯然想拿到普利策獎是不可能了。雖然它在DIST測試中名列前茅,且故事完形填空的正確率達到了72%,但它偶爾也會給出一些荒謬的結尾,比如“凱蒂被自己搞得崩潰了,甩了男友”,或者不正確的代詞(“凱蒂”、“他自己”)。

    研究人員承認,需要進一步的研究來確保輸出“語義和象征層面上的上下文”,并且它們在邏輯上是合理和一致的。盡管如此,他們聲稱他們已經“定量地”和“定性地”表明他們的模型能夠超越基線,實現“有意義的”改進。

    AD:還在為資金緊張煩惱嗎?獵云銀企貸,全面覆蓋京津冀地區(qū)主流銀行及信托、擔保公司,幫您細致梳理企業(yè)融資問題,統籌規(guī)劃融資思路,合理撬動更大杠桿。填寫只需兩分鐘,剩下交給我們! (來源:獵云網)

    極客網企業(yè)會員

    免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

    2019-07-24
    卡內基梅隆大學開發(fā)AI屆的“歐·亨利”,能斬獲普利策獎嗎?
    又一波失業(yè)焦慮?

    長按掃碼 閱讀全文