「經(jīng)常有人問我,AI 的未來是什么?你對未來有著怎樣的展望?我通常會(huì)說,那些金融科技公司所處的生態(tài)領(lǐng)域內(nèi)的發(fā)展,將是未來AI最有意思的地方。」機(jī)器學(xué)習(xí)領(lǐng)域的泰斗級學(xué)者、螞蟻金服科學(xué)智囊團(tuán)主席、加州大學(xué)伯克利分校教授 Michael I. Jordan 說。
確實(shí)如此,這些公司所面臨的是真正意義上的行業(yè)難題,而它們就是 AI 應(yīng)用最為有效的地方。「我們開始發(fā)現(xiàn),AI 不再是簡單的想要模仿人類的智能,而是成為了一種新的能力。它像水一樣滲透在社會(huì)經(jīng)濟(jì)的每一個(gè)角落,散發(fā)智能、解決問題。」螞蟻金服 CTO 程立解釋道,
「基于這樣的 AI 所釋放出來的能力,不僅可以幫助人們更加深刻地洞察社會(huì),在金融領(lǐng)域更好地發(fā)現(xiàn)和控制風(fēng)險(xiǎn),也能夠?yàn)槊恳粋€(gè)普通人打造一個(gè)貼心的生活助理和財(cái)富顧問,讓每一個(gè)小微企業(yè)擁有最智慧的經(jīng)營助手和最優(yōu)秀的 CFO?!?/p>
4 月 25 日,ATEC 螞蟻開發(fā)者大賽人工智能大賽啟動(dòng),主辦方螞蟻金服發(fā)起初衷就是要把業(yè)務(wù)體系中最又價(jià)值的問題提煉出來,并提供自主可控的 AI 平臺(tái),分享給開發(fā)者用創(chuàng)新技術(shù)方案去解決。
「事實(shí)上,AI 是一個(gè)工程學(xué)科,有時(shí)候大家覺得 AI 是神奇魔幻的工具,把它引入公司就會(huì)帶來奇跡,其實(shí)這是不對的?!筂ichael I. Jordan 說道,「AI 是由工程師的大腦打造出來的一種解決問題的手段,是一種思考解決問題手段的方法。今天我們舉行的大賽就是一個(gè)非常好的例子,大家可以去思考怎么樣用工程師的頭腦解決問題,而不是用魔術(shù)的手段帶來奇跡?!?/p>
某種程度上,對這些參賽選手而言,與其說是參與一次比賽,更像是在一家科技金融公司完成一個(gè)個(gè)真實(shí)項(xiàng)目。我們在現(xiàn)場深度了解了圍繞具體金融業(yè)務(wù)場景的賽題,并從專家們的介紹中找到了一些解題方向。
一、支付風(fēng)險(xiǎn)識(shí)別
第一道賽題是一個(gè)有關(guān)支付風(fēng)險(xiǎn)識(shí)別的問題。
基于移動(dòng)互聯(lián)網(wǎng)的新金融業(yè)務(wù)在蓬勃發(fā)展的同時(shí),黑產(chǎn)攻擊的能力也在不斷升級。信息泄露是導(dǎo)致帳戶安全最為嚴(yán)重的問題之一。國際上多起用戶信息泄露的事件,過億的敏感數(shù)據(jù)被盜用、利用,給用戶和銀行帶來了巨大的經(jīng)濟(jì)損失。
保護(hù)消費(fèi)者和風(fēng)險(xiǎn)識(shí)別,也越來越成為金融行業(yè)和學(xué)術(shù)界關(guān)注的焦點(diǎn)。以這個(gè)研究點(diǎn)出發(fā),螞蟻金服以高度模擬真實(shí)業(yè)務(wù)的數(shù)據(jù)和場景,希望行業(yè)大咖一起對風(fēng)險(xiǎn)模式、無標(biāo)簽數(shù)據(jù)的學(xué)習(xí)這兩個(gè)技術(shù)難題做出深入的研究和突破,為金融風(fēng)控行業(yè)帶來價(jià)值的同時(shí)推動(dòng)人工智能下一步的發(fā)展。
「過去四十年,這一直都是很大的問題,而且現(xiàn)在還沒有解決。 90 年代,有一些銀行開始用機(jī)器學(xué)習(xí)做檢測,而且結(jié)果不錯(cuò)。亞馬遜在線上使用之后,我們可以看到虛假支付的比例升高,他們用機(jī)器學(xué)習(xí)手段把虛假支付率降低了很多?!筂ichael I. Jordan說道。
在活動(dòng)現(xiàn)場,螞蟻金服副總裁、大安全負(fù)責(zé)人芮雄文介紹了這道賽題的背景——
支付寶是螞蟻金服的起源,而移動(dòng)支付之所以在中國普及的根本原因在于,相較于信用卡,基于二維碼的移動(dòng)支付上根本降低了消費(fèi)者和商戶的支付門檻,而且與 POS 機(jī)比起來,成本更低。
在便捷、低成本的基礎(chǔ)上,安全就成為了螞蟻金服要面臨的首要問題,這也是所有金融服務(wù)的基石。
在安全科技方面,螞蟻金服擁有三大核心能力,分別為確保線上線下環(huán)境中操作者即賬戶擁有者本人的數(shù)字身份;運(yùn)用大數(shù)據(jù)、機(jī)器學(xué)習(xí)和人工智能實(shí)現(xiàn)精準(zhǔn)識(shí)別和防控風(fēng)險(xiǎn)的智能風(fēng)控大腦;以及免于內(nèi)外遭受攻擊的數(shù)據(jù)保護(hù)及隱私。
芮雄文還特別提到了螞蟻金服在智能風(fēng)控方面的最新探索——AlphaRisk 風(fēng)控引擎。
這套引擎擁有四個(gè)核心系統(tǒng),包括風(fēng)險(xiǎn)感知(感知風(fēng)險(xiǎn)形勢和情境)、風(fēng)險(xiǎn)識(shí)別(毫米級精準(zhǔn)識(shí)別所有風(fēng)險(xiǎn))、自動(dòng)駕駛(基于風(fēng)險(xiǎn)場景和用戶狀態(tài)完成個(gè)性化智能推薦的管理措施)、以及自我學(xué)習(xí)能力(在黑產(chǎn)不停變化的同時(shí)保證整個(gè)風(fēng)控系統(tǒng)能夠自動(dòng)學(xué)習(xí)、更新)。
在這套風(fēng)控引擎的支持下,目前螞蟻金服的資損率已經(jīng)小于百萬分之一,每秒可以在峰值時(shí)處理超過 50 萬筆的風(fēng)險(xiǎn)交易,還可以在 1 秒內(nèi)更換整個(gè)策略體系。
不過,智能風(fēng)控領(lǐng)域仍然存在一些難以攻克的挑戰(zhàn)。芮雄文舉了兩個(gè)例子,一是黑產(chǎn)作案手段不斷變化,傳統(tǒng)的攻防模型過幾天效果就會(huì)下降;二是缺乏黑樣本的情況下讓模型精準(zhǔn)識(shí)別。
對此,東華大學(xué)校長、原同濟(jì)大學(xué)副校長蔣昌俊也分享了他的觀點(diǎn):
「早期使用的規(guī)則系統(tǒng)產(chǎn)品性、針對性強(qiáng),但適應(yīng)性、演化性弱。但騙子不可能拿著一招騙術(shù)一勞永逸下去,肯定會(huì)更新,這個(gè)時(shí)候規(guī)則系統(tǒng)難以適應(yīng),所以需要模型和算法來解決這個(gè)問題?!?/p>
然而,模型和算法是抽取出來一個(gè)數(shù)學(xué)處理方式,其場景性已經(jīng)沒有那么強(qiáng)。在這個(gè)過程中,如何把規(guī)則的、場景性的特征針對性地融合到模型和算法中,讓模型和算法適應(yīng)整個(gè)場景,才會(huì)提高系統(tǒng)的時(shí)效性和穩(wěn)定性。
「這是需要賽手們發(fā)揮智慧的地方?!故Y昌俊說道,
「另外就是黑樣本和正常樣本數(shù)量嚴(yán)重不對稱的問題。一般來說,兩個(gè)樣本在差不多情況下建立的模型會(huì)比較好,而在嚴(yán)重不對稱的情況下,怎么還能夠達(dá)到這個(gè)效果?這就是這個(gè)風(fēng)控問題的第二個(gè)難點(diǎn),做好了也是這個(gè)問題的亮點(diǎn)。我覺得這是關(guān)于智能風(fēng)控的問題上需要大家去創(chuàng)新、去創(chuàng)造的地方?!?/p>
二、智能金融客服
第二道賽題則與智能客服相關(guān)。普惠金融的重要目標(biāo)就是給廣大用戶提供高效和個(gè)性化的客戶服務(wù)體驗(yàn),以人工智能技術(shù)為核心的智能客服在提升用戶體驗(yàn)方面扮演了重要角色。
而智能客服的本質(zhì),就是充分理解用戶的意圖,在知識(shí)庫中精準(zhǔn)地找到與之相匹配的知識(shí)點(diǎn),從而回答用戶問題或提供解決方案。整個(gè)智能客服都是圍繞著用戶問題而構(gòu)建,問題相似度計(jì)算則是貫穿智能客服知識(shí)庫建設(shè)、在線問題匹配,全鏈路數(shù)據(jù)化運(yùn)營等幾乎所有環(huán)節(jié)最核心的技術(shù),這項(xiàng)技術(shù)的發(fā)展及其相關(guān)數(shù)據(jù)的建設(shè),勢必會(huì)促進(jìn)整個(gè)客服行業(yè)的進(jìn)步。
「在金融領(lǐng)域,挑戰(zhàn)本身是非常廣泛的,來自很多方面?!刮浵伣鸱笨偛?、首席數(shù)據(jù)科學(xué)家漆遠(yuǎn)說道,「為了解決這些問題,我們開發(fā)了一系列人工智能算法。」
而在開發(fā)算法的核心,也就是打造人工智能引擎的過程中,螞蟻金服也遇到了很多挑戰(zhàn),例如使機(jī)器學(xué)習(xí)引擎能夠快速的再判斷、如何面對非常小的樣本實(shí)現(xiàn)學(xué)習(xí)和預(yù)測等。
「我們在這里做的第一個(gè)工作就是在智能客服上面,希望通過多輪對話的能力使支付寶更加智能,可以理解對話背后的意義?!蛊徇h(yuǎn)補(bǔ)充道。
螞蟻金服資深算法專家張家興進(jìn)行賽題闡述時(shí)說,「這個(gè)賽題說起來它的定義非常簡單,就是給你兩句話,讓你判斷這兩句話說的語義是不是一致的。比如一句話是『花唄怎么還款』,另外一句話是『花唄如何還錢』。這兩個(gè)句子有很多字不一樣,但是有相同的意思。」
這在智能客服中的意義是非常重大,但背后并不簡單。
首先,客服最重要的一點(diǎn)就是理解用戶的意圖,然后在知識(shí)庫中匹配相關(guān)的知識(shí)點(diǎn)。目前工業(yè)界最主流的匹配做法就是把用戶的問題與知識(shí)庫中所有的問題逐一進(jìn)行相似度計(jì)算,把相似度最高的問題作為用戶的意圖,再把它的答案返還給用戶。
除此之外,相似度計(jì)算對整個(gè)客服的各個(gè)方面也都具有意義。例如,知識(shí)庫其實(shí)是用是基于文本的自動(dòng)挖掘而來,這個(gè)文本的自動(dòng)挖掘算法也要基于計(jì)算任意兩個(gè)文本之間的相似度,或者高維空間二者之間的距離。
在數(shù)據(jù)化運(yùn)營的各個(gè)環(huán)節(jié),還有包括搜索推薦、對話等其他領(lǐng)域,相似度計(jì)算也都是非常核心、基礎(chǔ)的問題。
而眼下,NLP 相似度計(jì)算所面臨最大挑戰(zhàn)和問題恰恰是在于,智能客服里面存在大量的非常多樣性的問題,包括各地的方言、口語以及各種表達(dá)方式等方面的不同,對問題的匹配提出相當(dāng)高的要求。但 NLP 的進(jìn)展主要集中體現(xiàn)在情感分析和翻譯方面,在這些場景下,大多情況下是在一個(gè)比較固定的數(shù)據(jù)集,可以在比較簡單干凈的數(shù)據(jù)集上得到很好的結(jié)果。
「這里的挑戰(zhàn)其實(shí)也很簡單,就是因?yàn)槿说脑谒磉_(dá)相同意思的時(shí)候,可能性太多了,有各種各樣不同的說法?!箯埣遗d還給出了自己的解題想法:
一是關(guān)注問題的表達(dá)以及不同層次的表達(dá)。人們所看到的自然語言本身也是一種表達(dá)形式,在這個(gè)基礎(chǔ)上可以做很多事情。例如,基于深度學(xué)習(xí)模型把句子變成一個(gè)向量,計(jì)算向量之間的距離;也可以通過依存分析,把句子建立一個(gè)語法樹,在樹的層次上建立模型匹配;或者可以把句子真正理解到語義層次,這樣一來,把任何兩個(gè)句子的語義做一個(gè)匹配可能會(huì)達(dá)到更好的效果。這都是實(shí)踐中的嘗試,希望大家也可以嘗試出更多的道路。
第二點(diǎn)在于,機(jī)器學(xué)習(xí)依賴大數(shù)據(jù),這道賽題給的是客服領(lǐng)域的數(shù)據(jù),希望大家可以探索更多領(lǐng)域的數(shù)據(jù),用一些機(jī)器學(xué)習(xí)方法把其他領(lǐng)域?qū)W到的東西結(jié)合客服領(lǐng)域的數(shù)據(jù)上來,最終達(dá)到更好的效果。
事實(shí)上,無論是黑產(chǎn)的變化多端導(dǎo)致的樣本信息不對稱,還是因?yàn)榭头?shù)據(jù)多樣性造成的模型弱適應(yīng)性,這些問題都要解決“小數(shù)據(jù)”問題。我們理論上常說如果有了大數(shù)據(jù)就能怎樣怎樣,但實(shí)際工程化過程中都很難達(dá)到如此理想的環(huán)境。無論是遷移學(xué)習(xí),還是無監(jiān)督學(xué)習(xí),如何用較少的樣本來達(dá)到更高的精度,更快速的識(shí)別率,提升機(jī)器學(xué)習(xí)泛化能力,都是下一階段極具挑戰(zhàn)性的課題。
這一系列命題,部分構(gòu)成了新金融領(lǐng)域當(dāng)下最需要解決的難題。
微信端:*點(diǎn)擊閱讀原文,立刻登錄大賽官網(wǎng)進(jìn)行報(bào)名參賽,百萬獎(jiǎng)金等你來戰(zhàn)。
其他渠道:*立刻登錄大賽官網(wǎng),進(jìn)行報(bào)名參賽,百萬獎(jiǎng)金等你來戰(zhàn)。
- 為什么年輕人不愛換手機(jī)了
- 柔宇科技未履行金額近億元被曝已6個(gè)月發(fā)不出工資
- 柔宇科技被曝已6個(gè)月發(fā)不出工資 公司回應(yīng)欠薪有補(bǔ)償方案
- 第六座“綠動(dòng)未來”環(huán)保公益圖書館落地貴州山區(qū)小學(xué)
- 窺見“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機(jī)打造全新一代屏幕壓感
- 清潔家電新老玩家市場定位清晰,攜手共進(jìn),核心技術(shù)決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達(dá)成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。