伴隨著人工智能的發(fā)展和普及,人機(jī)交互在我們的生活中也扮演著越來越重要的作用。人們總是覺得機(jī)器冷冰冰的,不食人間煙火,而情緒情感識(shí)別則真正為人們搭建起了與他人溝通的橋梁。如果機(jī)器能識(shí)別面對(duì)對(duì)象當(dāng)下的情緒,就能更好地做出反應(yīng)。情緒識(shí)別也是人工智能領(lǐng)域里的熱門研究課題。
想必大家對(duì)假笑男孩的表情包都不陌生,那怎么樣才能識(shí)別出圖片中的小男孩的真實(shí)表情呢?相較于較為常見的圖片分類模型,我們今天來聊一聊一種基于AU(人臉運(yùn)動(dòng)單元)的情緒識(shí)別方法。
我們一般將常見的表情分為7種,即平靜、驚訝、憤怒、悲傷、開心、恐懼、厭惡(惡心)。在美國(guó)心理學(xué)家Paul Ekman提出的面部行為編碼系統(tǒng)中,又將人們的各種情緒與許多的人臉運(yùn)動(dòng)單元(AU)進(jìn)行關(guān)聯(lián)。
這里介紹的方法選擇了其中幾組關(guān)聯(lián)度較高的AU(0~5),作為情緒評(píng)判的標(biāo)注。其中,AU0表示抬起上嘴唇和人中區(qū)域的肌肉,AU1表示頷部下降,AU2表示嘴角拉伸,AU3表示眉毛壓低并聚攏,AU4表示嘴角拉動(dòng)向下傾斜,AU5表示抬起眉毛外角。
上圖可以看到,這個(gè)男生不同的情緒,對(duì)應(yīng)各個(gè)AU的數(shù)值也各不相同。而本方法也是利用這6種AU的數(shù)值作為輸入,對(duì)最終情緒做一個(gè)準(zhǔn)確的判斷。具體模型如下圖所見:
如圖中所示,輸入的6種AU的數(shù)值經(jīng)過一層隱含層,再經(jīng)過一層全鏈接,最后利用softmax作為輸出,選擇一種情緒標(biāo)簽作為最終的結(jié)果。當(dāng)然,各個(gè)AU數(shù)值的計(jì)算其實(shí)也是一個(gè)較為前沿的研究課題,當(dāng)前也有許多的深度學(xué)習(xí)模型,比如DRML、EAC-Net,可以再后續(xù)與大家分享。
最后,我想,男孩的假笑應(yīng)該會(huì)被歸于disgust吧,你們覺得呢?
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )