原標(biāo)題:理工男的逆襲:做AI,不做聊天殺手
理工男是這個(gè)星球上的一個(gè)神奇物種,他們經(jīng)常會(huì)被貼上低情商、木訥、耿直等標(biāo)簽。比如浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院的學(xué)生焦云皓,就在打游戲是的時(shí)候無(wú)情地對(duì)同學(xué)說(shuō)了一句“你這樣的水平如果是其他人,我才不帶他玩呢”,然后順利被同窗了16年的同學(xué)拉黑了……
但是理工男的腦洞一旦開(kāi)起來(lái)也是無(wú)人可擋。比如被拉黑的焦云皓百思不得解,最終痛定思痛,下決心對(duì)“聊天殺手”這樣的現(xiàn)象進(jìn)行研究。接著,神奇的事情出現(xiàn)了:他開(kāi)發(fā)出了一套基于AI技術(shù)的智能對(duì)話分析系統(tǒng)ConverNet。這個(gè)系統(tǒng)的功能定位也非常簡(jiǎn)單粗暴:
拒做聊天殺手,友誼天長(zhǎng)地久。
拒絕做聊天殺手:理工男是怎么操作的?
ConverNet建立在深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)之上,通過(guò)對(duì)大量文字聊天數(shù)據(jù)進(jìn)行分析,試圖從其中找到對(duì)話終結(jié)、聊不下去的原因。為了能夠給ConverNet找到足夠的學(xué)習(xí)數(shù)據(jù),焦云皓在導(dǎo)師的幫助下找到了兩個(gè)公開(kāi)的海量數(shù)據(jù)庫(kù):Reddit-Treads和Movie Dialogs。這兩個(gè)數(shù)據(jù)庫(kù)分別以討論組式的群聊內(nèi)容和對(duì)白式的一對(duì)一聊天內(nèi)容為主。在這些內(nèi)容中,ConverNet著重針對(duì)兩種聊天終止場(chǎng)景進(jìn)行分析。一種是單聊中的聊著聊著沒(méi)有話說(shuō),另一種則是群聊中某人發(fā)言之后出現(xiàn)冷場(chǎng)。
ConverNet的運(yùn)行原理是對(duì)大量對(duì)話數(shù)據(jù)進(jìn)行編碼,尋找到聊天中斷的“斷點(diǎn)”,再利用LSTM神經(jīng)網(wǎng)絡(luò)單元對(duì)這些對(duì)話數(shù)據(jù)進(jìn)行理解和特征提取,為那些被中斷的尬聊對(duì)話提取共同特征。最終實(shí)現(xiàn)對(duì)對(duì)話是否會(huì)因尬聊而中斷的概率預(yù)測(cè)。
在學(xué)習(xí)了一共接近20萬(wàn)組對(duì)話之后,ConverNet已經(jīng)基本掌握了一些“聊天殺手”的特征,在測(cè)試中實(shí)現(xiàn)了80%的預(yù)測(cè)準(zhǔn)確率。通過(guò)ConverNet人們還把握了一些尬聊規(guī)律,比如在單聊場(chǎng)合中,大段發(fā)送長(zhǎng)文字可能會(huì)終結(jié)聊天,但在群體討論時(shí)長(zhǎng)文字反而會(huì)刺激群聊的積極性。
這套系統(tǒng)的首位受益人是焦云皓的老爸。經(jīng)過(guò)分析,他的老爸總是大段大段地發(fā)送消息,與其他人顯得格格不入;后來(lái)改發(fā)發(fā)表情包和短句子,結(jié)果聊天冷場(chǎng)的情況就少多了。
多場(chǎng)景應(yīng)用:不止于讓聊天繼續(xù)
這個(gè)創(chuàng)意如果只停留在實(shí)驗(yàn)室里,充其量只能被看做是一場(chǎng)關(guān)于AI的人機(jī)交互的一種獵奇。我們需要看重的,更應(yīng)該是它在現(xiàn)實(shí)應(yīng)用場(chǎng)景中落地的可能。
既然是聊天系統(tǒng),那么其首要落地場(chǎng)景應(yīng)該集中在社交軟件當(dāng)中,如陌陌、探探等主打陌生社交的產(chǎn)品,用戶的主要訴求基本都是通過(guò)溝通拉近彼此的關(guān)系。
在這類產(chǎn)品中光把兩位用戶匹配到對(duì)話場(chǎng)景中僅僅是個(gè)開(kāi)始,幫助用戶好好聊天才能更深入的滿足用戶訴求。在這時(shí) ConverNet就可以發(fā)揮作用,在軟件中植入對(duì)話實(shí)時(shí)指導(dǎo)功能。當(dāng)用戶編輯好要發(fā)送的內(nèi)容的時(shí)候,系統(tǒng)可以自動(dòng)根據(jù)聊天的場(chǎng)景給出具體的指導(dǎo)意見(jiàn)。
比如,當(dāng)你輸入“發(fā)個(gè)自拍看看”這種典型尬聊語(yǔ)句的時(shí)候,軟件就會(huì)彈出“有百分之××的用戶在發(fā)送該句的時(shí)候?qū)υ捊K止,確定要發(fā)送嗎”的提示,然后給出獲取照片的可能性方式。在這個(gè)過(guò)程中,ConverNet既能在很大程度上保證聊天的繼續(xù),也在一定程度上培養(yǎng)用戶自身的語(yǔ)言表達(dá)習(xí)慣。
此外,將ConverNet落地于PUA(Pick up Artist)群體也是一個(gè)不錯(cuò)的選擇。既然有那么多人愿意掏錢學(xué)習(xí)如何與異性交流,何不如利用ConverNet這類分析系統(tǒng)對(duì)聊天內(nèi)容的正反案例進(jìn)行分析,尋找搭訕過(guò)程中成功與失敗的原因。甚至可以摸索出男女之間在不同的交往階段的語(yǔ)言使用風(fēng)格,掌握不同性格的個(gè)體在各個(gè)階段的語(yǔ)言親密度。比如什么時(shí)候可以說(shuō)一些有吸引力的話,什么時(shí)候又需要保持一定的距離。在AI的幫助下,有的放矢地進(jìn)行交流。到故事的最后,ConverNet在手,妹子我有。
不光是PUA,一切需要溝通藝術(shù)的地方都可以讓AI發(fā)揮功效:銷售、公關(guān)、客服……對(duì)于一切不會(huì)說(shuō)話、說(shuō)話磕巴、說(shuō)話招人煩的人類,都可以對(duì)其整體對(duì)話數(shù)據(jù)進(jìn)行分析,再作具體的針對(duì)性補(bǔ)短。
當(dāng)然,想做到這一地步,需要涉及復(fù)雜的人類情感,AI必須要學(xué)習(xí)更多的數(shù)據(jù)、掌握強(qiáng)力的算法才有可能實(shí)現(xiàn)。
如果這些能夠?qū)崿F(xiàn),便可以將ConverNet系統(tǒng)的運(yùn)行邏輯遷移到智能家居場(chǎng)景當(dāng)中,或許我們可以尋找到優(yōu)化人機(jī)交互的新路徑。
利用智能音箱作為接口,對(duì)家用電器進(jìn)行喚醒是當(dāng)下智能家居領(lǐng)域的一個(gè)基本操作。但在更多層面上,這種交互是一種單向的命令式交互,家居產(chǎn)品智能被動(dòng)性接受指令,無(wú)法實(shí)現(xiàn)反向的主動(dòng)參與。在這種情況下,用戶跟智能家居就很難產(chǎn)生持續(xù)的交流意愿。
智能音箱可以通過(guò)不斷地對(duì)用戶語(yǔ)料的抓取分析,將語(yǔ)言字?jǐn)?shù)與情緒、語(yǔ)言速度與情緒、語(yǔ)調(diào)高低與情緒進(jìn)行結(jié)合,著重搜集任務(wù)未完成時(shí)的對(duì)話中斷。然后,根據(jù)以上幾個(gè)方面進(jìn)行特征分析提取,再進(jìn)行自我改進(jìn),以取得更優(yōu)質(zhì)的人機(jī)交互體驗(yàn)效果。
從夢(mèng)想到現(xiàn)實(shí):技術(shù)仍是亟待突破的壁壘
美好的東西總是令人向往,但前提是,這套ConverNet系統(tǒng)要解決以下幾個(gè)問(wèn)題。
首先是學(xué)習(xí)樣本的數(shù)量不足。目前,ConverNet的數(shù)據(jù)學(xué)習(xí)數(shù)量只有二十萬(wàn)條左右,而在社交平臺(tái)上,每天會(huì)有億萬(wàn)組的對(duì)話產(chǎn)出。與之相比,二十萬(wàn)條的數(shù)據(jù)學(xué)習(xí)量只是九牛一毛。這樣小范圍數(shù)據(jù)上的準(zhǔn)確率是否真的有應(yīng)用價(jià)值,其實(shí)是存有爭(zhēng)議的。
其次是對(duì)文本數(shù)據(jù)學(xué)習(xí)本身的局限。對(duì)于ConverNet來(lái)說(shuō),目前的模型完全是基于英語(yǔ)文字的學(xué)習(xí)??稍趯?shí)際應(yīng)用場(chǎng)景中,往往是文字+語(yǔ)音+表情包的綜合打法,漢語(yǔ)中還會(huì)出現(xiàn)同音字替代、顏文字等復(fù)雜的情況。這些細(xì)節(jié)的變化很有可能會(huì)造成模型整體訓(xùn)練難度的增加。
最后還有隱私問(wèn)題,想實(shí)現(xiàn)所謂的對(duì)用戶對(duì)話是否會(huì)造成聊天終結(jié)的預(yù)測(cè),一個(gè)必備前提就是對(duì)用戶聊天內(nèi)容進(jìn)行分析。即使利用上端側(cè)AI計(jì)算和內(nèi)容脫敏,也難免會(huì)讓用戶有種隱私被AI“視奸”的毛骨悚然之感。
實(shí)際上,要達(dá)到讓Convernet在日常中發(fā)揮實(shí)際作用的目的,除了解決以上幾個(gè)方面的問(wèn)題,還要考慮到語(yǔ)言發(fā)生的環(huán)境、語(yǔ)氣問(wèn)題等,并且通過(guò)多種算法的綜合運(yùn)用來(lái)協(xié)調(diào)處理一句話里包含的種種要素。從某種程度上來(lái)說(shuō),以前人類用AI是彌補(bǔ)智商,而現(xiàn)在更多的是彌補(bǔ)情商。這個(gè)技術(shù)難點(diǎn),無(wú)疑需要較長(zhǎng)的時(shí)間來(lái)克服。
而夢(mèng)想到現(xiàn)實(shí)的距離,就是不斷克服技術(shù)壁壘的過(guò)程。人機(jī)交互的實(shí)質(zhì)性飛越,或許可以從好好聊天開(kāi)始。讓聊天繼續(xù),也就存在了讓夢(mèng)想繼續(xù)的可能 。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過(guò)熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無(wú)人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開(kāi)展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。