近日,一款音頻社交APP突然爆紅網(wǎng)絡(luò),強(qiáng)勢(shì)吸引大批iOS用戶下載注冊(cè)并引起微博等社交媒體平臺(tái)的大量討論,這款A(yù)PP就是——Clubhouse。
圖片來源:Neil Patel
Clubhouse在中文網(wǎng)絡(luò)世界的爆火可以追溯到2021年的1月,Elon Musk在社交媒體發(fā)文稱將在北京時(shí)間2月1號(hào)在Clubhouse上創(chuàng)建聊天室,這一消息迅速引爆國內(nèi)外的社交媒體。Elon Musk的大名可謂無人不知不人不曉,電動(dòng)車、火箭、腦機(jī)接口等一系列關(guān)鍵詞讓坐擁Tesla、SpaceX的他不僅是成功的企業(yè)家,同時(shí)也是這個(gè)時(shí)代最具夢(mèng)幻意義的創(chuàng)新領(lǐng)袖、科技偶像和巨量網(wǎng)紅,更不必提近期他還一度登上世界首富寶座。那么,如果有一個(gè)機(jī)會(huì)能聽到Musk和其他一些世界上最頂級(jí)的頭腦們聊天,想必有大批人不愿錯(cuò)過。
自此,被Musk引流至服務(wù)器一度崩潰的Clubhouse成功進(jìn)入大眾視野。但Clubhouse能持續(xù)成功的原因,不僅僅在這一次現(xiàn)象級(jí)的社會(huì)性事件。
從“club+house”這個(gè)直白的名字組成上不難看出,Clubhouse提供的主要服務(wù)形式是多人語音在線聊天,為人們?cè)诰€上“club”談天說地提供“house”。在疫情尚不明朗、居家隔離仍被提倡的國際大環(huán)境下,在美區(qū)APP store會(huì)誕生這樣一款呼應(yīng)居家人群語音社交需求的APP也并不令人意外。同時(shí),Clubhouse的處處“克制”的設(shè)計(jì)又將其打造成一款與眾不同的語音社交軟件。
Clubhouse采用了克制的邀請(qǐng)注冊(cè)機(jī)制,普通用戶可先行搶注自己的ID,但仍需要邀請(qǐng)碼來完成完整注冊(cè)過程以正常使用。這樣保證了初期用戶對(duì)交互形式的興趣程度、接受程度以及熟人社交關(guān)系網(wǎng),同時(shí)也在某種意義上進(jìn)行了用戶過濾,保證了優(yōu)質(zhì)程度。
其次在推薦機(jī)制上,Clubhouse采取“熟人關(guān)系+興趣探索”的模式,可以讓用戶迅速發(fā)現(xiàn)自己好友的興趣并探索自己喜歡的房間。而最為克制、與其他IM產(chǎn)品最為不同的是Clubhouse沒有任何文本輸入框,每一個(gè)聊天室中只有純粹的語音溝通,普通聽眾除非舉手并被主持人允許否則不能發(fā)言,而且聽眾的離開也不會(huì)告知主持人和發(fā)言嘉賓,這就保證了整個(gè)聊天室內(nèi)的討論和發(fā)言幾乎不受任何外力影響,討論氛圍與思考過程不受聽眾評(píng)論和發(fā)言的影響,保證了內(nèi)容層面的高質(zhì)量。在各大互聯(lián)網(wǎng)企業(yè)都在想盡辦法提高APP使用者參與度的今天,這樣一款重視交互和內(nèi)容、小而精的APP顯得不那么“入流”,卻又脫穎而出。
但事物往往具有兩面性,孟德斯鳩曾說:“自由不是無限制的自由。”
由于缺乏相關(guān)經(jīng)驗(yàn),作為新生產(chǎn)品的Clubhouse顯然在中國遭遇了“水土不服”。內(nèi)容監(jiān)管的缺失讓這款A(yù)PP幾度出現(xiàn)風(fēng)險(xiǎn)內(nèi)容的討論房間,幾經(jīng)周折最終被暫停服務(wù)。
自此,爆火中文社交網(wǎng)絡(luò)的Clubhouse熱度大減,不復(fù)往日繁榮。
可見,風(fēng)險(xiǎn)內(nèi)容監(jiān)管已經(jīng)逐步成為語音社交軟件存亡的生命線,語音內(nèi)容中極有可能混有涉黃、涉暴、涉恐、涉政等敏感信息,對(duì)網(wǎng)絡(luò)環(huán)境純凈造成威脅,語音內(nèi)容審核成為了社交平臺(tái)的新難題。
數(shù)美科技發(fā)現(xiàn),語音審核除了要識(shí)別音頻包含的文本內(nèi)容是否涉及敏感信息,同時(shí)還存在語音語調(diào)上的擬聲詞、感嘆詞和語氣詞的審核難度,例如涉及色情信息的嬌喘、呻吟等。這為語音審核提出了更高的挑戰(zhàn)。目前普遍采用的人工審核方式雖然能夠提供較好的審核能力,但需要對(duì)音頻文件進(jìn)行整段察驗(yàn),對(duì)音頻流進(jìn)行實(shí)時(shí)監(jiān)控,造成了較高的時(shí)間成本和人力投入。
對(duì)此,數(shù)美科技旗下的全棧式智能內(nèi)容識(shí)別產(chǎn)品“天凈”,能夠通過智能音頻過濾技術(shù)提供強(qiáng)有力的音頻內(nèi)容識(shí)別支持。智能音頻過濾技術(shù)采用基于ffmpeg的音頻信息動(dòng)態(tài)轉(zhuǎn)碼技術(shù)、基于深度學(xué)習(xí)的語音識(shí)別技術(shù)和智能特色語義分析技術(shù),能夠?qū)^大部分音頻格式進(jìn)行多場景、多維度地檢測(cè)與識(shí)別。其中包括涉政、涉黃、廣告導(dǎo)流等諸多類型。智能音頻過濾產(chǎn)品識(shí)別準(zhǔn)確率高,處理速度快,檢測(cè)場景廣泛,支持中英雙語種,能夠極大降低人工審核成本,提升音頻內(nèi)容質(zhì)量。
音頻內(nèi)容識(shí)別組成
在語音內(nèi)容獲取上,數(shù)美科技的智能音頻過濾技術(shù)支持OGG、MP3、ASF、WMA、WAV、MP3PRO、RM、REAL、APE、MODULE、MIDI、VQF等多種音頻格式和音頻流,能夠應(yīng)對(duì)不同語音內(nèi)容提供平臺(tái)使用的常用音頻格式,同時(shí)支持語音直播實(shí)時(shí)監(jiān)控、語音點(diǎn)播、語音消息和各種音頻文件的檢測(cè)。
在獲取到待檢測(cè)的音頻文件和音頻流后,主要從四個(gè)方面進(jìn)行內(nèi)容的檢測(cè)識(shí)別:
1.涉政違規(guī)利用語音轉(zhuǎn)文本技術(shù)將語音信息轉(zhuǎn)為文本信息,再通過成熟的文本內(nèi)容檢測(cè),對(duì)音頻中出現(xiàn)的多種類型政治違規(guī)內(nèi)容進(jìn)行檢測(cè)。
2.涉黃違規(guī)利用大規(guī)模GPU集群的計(jì)算能力和深度學(xué)習(xí)技術(shù),準(zhǔn)確快速穩(wěn)定地識(shí)別音頻中出現(xiàn)的色情,低俗或性感部分,在管理后臺(tái)對(duì)其進(jìn)行標(biāo)注和反饋,從而大規(guī)模提升人工審核團(tuán)隊(duì)效率,增強(qiáng)用戶瀏覽體驗(yàn)。
3.特殊聲音識(shí)別同樣利用大規(guī)模GPU集群的強(qiáng)大計(jì)算能力和深度機(jī)器學(xué)習(xí)的技術(shù),除了一般的涉黃違規(guī)語言內(nèi)容,還能準(zhǔn)確識(shí)別出呻吟等非文本類的特殊聲音。
4.導(dǎo)流廣告通過語音轉(zhuǎn)文本技術(shù)將語音信息轉(zhuǎn)為文本信息,對(duì)文本內(nèi)容進(jìn)行關(guān)鍵詞檢測(cè),識(shí)別出潛在的添加微信號(hào)、QQ號(hào)、QQ群以及虛假信息等導(dǎo)流廣告音頻內(nèi)容。
經(jīng)過測(cè)試,智能音頻過濾技術(shù)對(duì)問題音頻判斷的正確率以及反饋問題音頻的正確率均高于90%。在提供高正確率的音頻過濾結(jié)果的同時(shí),此套解決方案還提供了非常高的處理效率,智能音頻過濾API的最大響應(yīng)時(shí)間為1s,超時(shí)率低于0.01%,實(shí)時(shí)率可達(dá)到30%。而智能音頻過濾API也具有深厚的處理容量,最大支持并發(fā)100路處理任務(wù),還可根據(jù)需求水平擴(kuò)展。
數(shù)美科技音頻內(nèi)容風(fēng)控方案
同時(shí),數(shù)美科技為“天凈”賦予了豐富多樣的標(biāo)簽體系,對(duì)涉黃、涉暴、涉恐、涉政、廣告導(dǎo)流等不同敏感信息進(jìn)行詳細(xì)分類,以滿足不同程度、不同種類、不同特點(diǎn)的識(shí)別需求。而數(shù)美強(qiáng)大標(biāo)簽體系亦成功成為了多家社交平臺(tái)進(jìn)行風(fēng)險(xiǎn)內(nèi)容審核的尺度參考,為新生產(chǎn)品提供了可靠強(qiáng)力的內(nèi)容風(fēng)控基礎(chǔ)。
智能音頻識(shí)別還整合了業(yè)界一流的語音識(shí)別技術(shù)、大規(guī)模GPU計(jì)算的深度學(xué)習(xí)、基于敏感詞庫的名單服務(wù)、特殊聲音識(shí)別模型、基于深度學(xué)習(xí)的NLP模型以及實(shí)時(shí)分布式規(guī)則引擎等。其中深度學(xué)習(xí)模型能夠讓系統(tǒng)從多個(gè)維度檢測(cè)語義環(huán)境,準(zhǔn)確識(shí)別說話意圖。而智能音頻識(shí)別技術(shù)根據(jù)不同場景和行業(yè)采用了專門化的判斷策略,結(jié)合強(qiáng)大的標(biāo)簽體系能夠?yàn)椴煌愋蜕缃黄脚_(tái)提供定制化的過濾服務(wù)。
高效準(zhǔn)確的識(shí)別算法、廣泛多樣的格式支持、細(xì)致強(qiáng)大的判定能力以及不同用戶的精細(xì)化方案,數(shù)美科技持續(xù)為音頻內(nèi)容平臺(tái)客戶提供高效準(zhǔn)確的音頻內(nèi)容風(fēng)控方案。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )