精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>
  • <span id="ixlwe"></span>

  • <abbr id="ixlwe"></abbr>

    證監(jiān)會攜手庖丁科技 賦能資本市場前線監(jiān)管

    近日,庖丁科技中標證券期貨業(yè)金融科技研究發(fā)展中心(深圳)(以下簡稱“深交所”)——“證券文本信息抽取技術研究”項目,以證券市場文本信息為對象,研究利用自然語言處理技術,從披露公告中抽取指定的文本信息,并且滿足具有一定技術性能指標要求的課題。

    證監(jiān)會攜手庖丁科撫???AIOi1i+iDvei1hOacrOW4guWcuuWJjee6v+ebkeeuoQ=="/>

    資本市場上,信息披露作為法規(guī),通常要求信息披露義務人“應當真實、準確、完整、及時地披露信息”。我國上市公司信息披露的內容大體可分為三類:證券發(fā)行文件、定期報告和臨時報告。

    上市公司的公告信息披露必須在指定信息披露網(wǎng)站發(fā)布,主要為PDF格式。以深市上市公司為例,2016年全年共披露265985篇公告,2017年共披露291607篇,隨著上市公司數(shù)量日益增多,這一數(shù)字也會逐年增加,不但為深交所的合規(guī)檢查帶來壓力,也給投資者帶來極大的信息負載。如何將海量公告更有效、更高效地讓閱讀人“讀薄”?其中通過自然語言處理、深度學習等技術將公告信息結構化提取成為關鍵所在。

    庖丁科技透露,現(xiàn)正在持續(xù)而堅定地推進該項工作:首先通過卷積神經網(wǎng)絡對公告中的段落表格等信息進行分割抽取。為了適應樣本數(shù)量稀少的問題,他們還提出了一種輕量級的機器學習方法。該方法能夠高效地將不同類別公告的關鍵語句抽取出來,并使之具有在線學習的能力,抽取過程僅需公告制作業(yè)務專家對少量公告進行標注,即可達到可用效果。關鍵語句抽取后,再通過LSTM神經網(wǎng)絡進行細粒度提取,從而將公告結構化。目前,庖丁科技對并購重組公告的結構化抽取的工作已取得較為理想的結果,提升了深交所監(jiān)管工作的效率。這項工作的探索不僅為擴展更多公告類型奠定基礎,也為其他類型文本處理帶來了寶貴經驗。

    “利用非結構化信息抽取技術,我們能夠把隱藏在海量公開公告中企業(yè)與企業(yè)、企業(yè)與個人關系進行深度挖掘,并且透視、洞察企業(yè)的價值及風險。作為國內擁有世界領先的金融文本信息抽取技術、有能力利用深度學習和金融知識庫進行高精度的結構化信息提取的先進團體。”庖丁科技表示,未來將繼續(xù)全力服務金融行業(yè),助力金融機構進一步提升服務實體經濟的能力。

    極客網(wǎng)企業(yè)會員

    免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

    2018-11-16
    證監(jiān)會攜手庖丁科技 賦能資本市場前線監(jiān)管
    近日,庖丁科技中標證券期貨業(yè)金融科技研究發(fā)展中心(深圳)(以下簡稱“深交所”)——“證券文本信息抽取

    長按掃碼 閱讀全文