文|曾響鈴
來(lái)源|科技向令說(shuō)(xiangling0815)
AI浪潮下,語(yǔ)音輸入的便捷性大大提升了用戶的體驗(yàn),也成為輸入法產(chǎn)品競(jìng)相追逐的領(lǐng)域。
不過(guò),最近接連發(fā)布的三個(gè)關(guān)于語(yǔ)音輸入法市場(chǎng)競(jìng)爭(zhēng)態(tài)勢(shì)的報(bào)告,原本應(yīng)當(dāng)成為我們觀察行業(yè)的重要參考,但它們相互之間卻出現(xiàn)了諸多矛盾,讓人費(fèi)解。
“權(quán)威”的央視市場(chǎng)研究機(jī)構(gòu)CTR發(fā)布的《2019年手機(jī)輸入法語(yǔ)音輸入功能市場(chǎng)研究報(bào)告》(以下簡(jiǎn)稱CTR報(bào)告)顯示,搜狗、訊飛和百度為首的三大輸入法占據(jù)了近95%的市場(chǎng)份額,其中搜狗市場(chǎng)份額76.9%獨(dú)占3/4,日均語(yǔ)音請(qǐng)求5.84億次, 超過(guò)了百度與訊飛兩家頻次之和;
而全球知名的新經(jīng)濟(jì)產(chǎn)業(yè)第三方數(shù)據(jù)挖掘和分析機(jī)構(gòu)艾媒咨詢(iiMedia Research)發(fā)布的《2019上半年中國(guó)第三方手機(jī)輸入法專題研究報(bào)告》(以下簡(jiǎn)稱艾媒報(bào)告)則稱,今年上半年,搜狗輸入法和百度輸入法用戶份額排名前二,占比分別達(dá)45.5%和41.0%,百度輸入法月活增長(zhǎng)速度最快,語(yǔ)音輸入用戶規(guī)模達(dá)2.71億穩(wěn)居行業(yè)第一,日人均語(yǔ)音輸入次數(shù)最多,已成國(guó)內(nèi)最強(qiáng)的語(yǔ)音輸入法;
另一家“權(quán)威市場(chǎng)分析機(jī)構(gòu)”賽諾市場(chǎng)研究也發(fā)布了《2019年語(yǔ)音輸入法簡(jiǎn)析》(以下簡(jiǎn)稱賽諾報(bào)告),稱訊飛保持語(yǔ)音輸入法的領(lǐng)軍地位,語(yǔ)音輸入的認(rèn)知度高達(dá)90.35%,遙遙領(lǐng)先于搜狗、百度等其他輸入法。
在所有報(bào)告中,大家都認(rèn)可搜狗、百度、訊飛三足鼎立的市場(chǎng)格局,但在市場(chǎng)占有率尤其是語(yǔ)音輸入這件事上,這些報(bào)告各自有各自的“第一”法。
毫無(wú)疑問(wèn),總有人在說(shuō)謊,至少是刻意混淆視聽。每一個(gè)數(shù)字的由來(lái)無(wú)法證偽,報(bào)告的機(jī)構(gòu)們各自都會(huì)有自己的說(shuō)辭,但是,從報(bào)告自身的邏輯,以及與外部獨(dú)立機(jī)構(gòu)數(shù)據(jù)對(duì)比等等角度,過(guò)于夸張的論斷總能現(xiàn)出原形。
什么樣的報(bào)告統(tǒng)計(jì)方式最為科學(xué)?
做一份市場(chǎng)研究報(bào)告,用最簡(jiǎn)單的話說(shuō)無(wú)非分為三個(gè)步驟:用一種方式選出統(tǒng)計(jì)學(xué)樣本,然后按照某種方式統(tǒng)計(jì)出數(shù)據(jù),最后再加一些機(jī)構(gòu)的評(píng)價(jià)。
三份報(bào)告中,看起來(lái),CTR報(bào)告調(diào)研了更多的人,結(jié)果似乎更為可靠。
不過(guò),僅從統(tǒng)計(jì)學(xué)的角度看,當(dāng)n≥30或者至少n≥3(k+1)時(shí)(k為解釋變量的數(shù)目,即報(bào)告需要描述的指標(biāo)數(shù)量),樣本量就已經(jīng)足夠充分,三大報(bào)告最低樣本量都已經(jīng)到2000左右,相互之間數(shù)量差異給結(jié)果帶來(lái)的影響已經(jīng)可以忽略不計(jì)。
此時(shí),影響統(tǒng)計(jì)結(jié)果的,就是樣本是如何選擇得來(lái)的、如何計(jì)算,以及樣本是否匹配統(tǒng)計(jì)區(qū)間的問(wèn)題。
1、樣本是如何抽樣和計(jì)算來(lái)的?
CTR報(bào)告在其首頁(yè)最下方標(biāo)注了調(diào)研以中國(guó)互聯(lián)網(wǎng)信息中心發(fā)布的我國(guó)網(wǎng)民結(jié)構(gòu)為樣本配額設(shè)置,這是明顯的單一來(lái)源隨機(jī)抽取的做法,且沒(méi)有寫明計(jì)算模型:
而艾媒報(bào)告則在首頁(yè)稱數(shù)據(jù)來(lái)自艾媒資訊商業(yè)情報(bào)數(shù)據(jù)庫(kù)、北極星互聯(lián)網(wǎng)產(chǎn)品分析系統(tǒng)、草莓派數(shù)據(jù)調(diào)查與計(jì)算系統(tǒng)(Strawberry Pie)等多個(gè)來(lái)源,在計(jì)算模型上采用了市場(chǎng)調(diào)查、行業(yè)深度訪談、桌面研究等方法,并使用了艾媒資訊旗下各大數(shù)據(jù)計(jì)算系統(tǒng)和相關(guān)計(jì)算模型:
而賽諾報(bào)告自稱為“簡(jiǎn)析”,所以這方面并未有任何提及。
統(tǒng)計(jì)學(xué)中有個(gè)很簡(jiǎn)單的道理,樣本量低的時(shí)候,增加樣本量就是增加準(zhǔn)確度;而到樣本量增加到一定程度,樣本的選擇方式、計(jì)算模型對(duì)結(jié)果準(zhǔn)確度的影響越來(lái)越大,直至成為決定因素。
在樣本量超過(guò)閾值時(shí),足夠科學(xué)計(jì)算模型的支撐下樣本才能最大化還原市場(chǎng)的數(shù)據(jù)結(jié)論,從這個(gè)意義上看,CTR報(bào)告空有4000樣本量卻在數(shù)據(jù)來(lái)源上單一以及對(duì)計(jì)算模型的“含糊”,都使得報(bào)告的可信度大打折扣。
2、樣本和統(tǒng)計(jì)結(jié)論的時(shí)間區(qū)間如何劃定?
你不能拿A時(shí)間的樣本,去得出B時(shí)間的結(jié)論,這是基本的常識(shí),甚至不需要統(tǒng)計(jì)學(xué)思維。
僅從標(biāo)題上看,CTR的報(bào)告就有些“怪異”,這才2019年9月,報(bào)告就寫了是“2019年”全年的報(bào)告,而艾媒報(bào)告則“聰明”一些,指明了僅適用于2019年“上半年”。
怪就怪在,CTR去年的報(bào)告是給2018年寫的,發(fā)布時(shí)間是2018年年底的幾天,合乎情理,為什么到今年就要在9月急匆匆總結(jié)全年,其公信度再次打了折扣:
與之對(duì)應(yīng)的是,賽諾報(bào)告則只是2019年的簡(jiǎn)析,看起來(lái)飄然世外只是在2019年期間說(shuō)2019年的事,倒也不算提前搶跑。
外部對(duì)比,數(shù)字足夠科學(xué)&符合正常認(rèn)知嗎?
一份報(bào)告固然可以給出某些驚世駭俗的結(jié)論來(lái)彰顯其價(jià)值,但與外部獨(dú)立權(quán)威第三方的數(shù)據(jù)差別過(guò)大,或者明顯背離大眾普遍認(rèn)知,顯然也不具備可信度。
CTR報(bào)告稱,搜狗、百度、訊飛三家占到95%的市場(chǎng)份額,但在具體分配上,搜狗高出百度近10倍,高出訊飛近8倍:
然而,按照互聯(lián)網(wǎng)廣受認(rèn)可的專業(yè)市場(chǎng)調(diào)研公司艾瑞網(wǎng)數(shù)據(jù),搜狗、百度、訊飛三家的最新的月裝機(jī)量數(shù)據(jù)卻與此出入甚大:
一二三名的排位上,搜狗的確領(lǐng)先訊飛百度,但很明顯在數(shù)據(jù)上遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到8倍、10倍的地步,且百度輸入法是以較大比例超過(guò)訊飛輸入法的??v然艾瑞網(wǎng)的數(shù)據(jù)未必一定準(zhǔn)確,但CTR的報(bào)告也未免顯得過(guò)分夸張和讓人無(wú)法信服。
與之對(duì)比的是,艾媒報(bào)告則與艾瑞網(wǎng)數(shù)據(jù)(這二者有競(jìng)爭(zhēng)關(guān)系,按道理不會(huì)相互勾連)則更為接近,第一名仍然是搜狗,但與二三名的差距在較小范圍內(nèi):
數(shù)據(jù)沒(méi)有完全對(duì)應(yīng)上,未必準(zhǔn)確,但大面上艾媒報(bào)告顯得更加理性一些,CTR的報(bào)告顯得過(guò)分夸張了,有些急不可耐突出搜狗“第一”地位的感覺(jué)——然而,誰(shuí)也沒(méi)有否認(rèn)搜狗市場(chǎng)占有率第一的地位。
在這三份報(bào)告中,賽諾報(bào)告對(duì)訊飛的市場(chǎng)占有率情況避而不談,總體而言,訊飛第三的位置也是公認(rèn)的,與搜狗、百度有一定的差距。
除了市場(chǎng)占有率數(shù)據(jù),搜狗自稱語(yǔ)音輸入日均語(yǔ)音請(qǐng)求5.84億次, 超過(guò)了百度與訊飛兩家頻次之和,這方面沒(méi)有艾瑞網(wǎng)類似的外部機(jī)構(gòu)做參照,但搜狗輸入法在語(yǔ)音上對(duì)百度、訊飛的領(lǐng)先,也明顯有違行業(yè)和大眾的普遍認(rèn)知。在CTR發(fā)布報(bào)告后,一些網(wǎng)友發(fā)出質(zhì)疑(截圖來(lái)源:科技時(shí)代報(bào)):
雖然網(wǎng)友們的言論有些地方過(guò)分偏激,不值得全部采信,但至少,這些集中的大眾認(rèn)知展現(xiàn),表達(dá)出CTR報(bào)告與大眾普遍認(rèn)知的背離,也同時(shí)表達(dá)了百度、訊飛輸入法在語(yǔ)音方面受到的認(rèn)可程度。
邏輯自恰,都做到了嗎?
一個(gè)市場(chǎng)研究報(bào)告,每個(gè)數(shù)據(jù)剖根究底很難,但報(bào)告本身至少得邏輯自恰,如果自己前邊說(shuō)的和后邊說(shuō)的存在矛盾,那公信力也就蕩然無(wú)存了。
也即,即便我們拋開各種數(shù)據(jù)的真實(shí)性不討論,分析一個(gè)報(bào)告是否可信,至少可以從報(bào)告是否做到了前后一致來(lái)著手。
例如,艾媒報(bào)告中,百度在語(yǔ)音輸入上領(lǐng)先行業(yè),既有用戶規(guī)模,也有每日語(yǔ)音輸入次數(shù):
這些數(shù)字無(wú)從考究可信度有多高,但至少,柱狀圖與同一個(gè)報(bào)告前文中搜狗、百度、訊飛的用戶份額情況沒(méi)有太大出入,只是百度語(yǔ)音輸入在其用戶比例和使用中略高了一些,乘以一個(gè)合理的倍數(shù)到這里排到了第一。至少,報(bào)告本身前后邏輯的一致性沒(méi)有明顯的問(wèn)題。
而反觀CTR的報(bào)告,如果報(bào)告前半部分提到的搜狗市場(chǎng)份額高出百度近10倍,高出訊飛近8倍,到了后半部分談?wù)Z音的時(shí)候,語(yǔ)音輸入日均請(qǐng)求頻次,為何搜狗又僅僅高出訊飛、百度1倍多一點(diǎn):
順著CTR報(bào)告的邏輯,唯一合理的解釋就是訊飛、百度的用戶語(yǔ)音使用情況遠(yuǎn)遠(yuǎn)好于搜狗,所以才會(huì)在市場(chǎng)占有率遠(yuǎn)低于搜狗的情況下,語(yǔ)音使用實(shí)現(xiàn)了“追趕”。然而,同樣是CTR的報(bào)告中,又提到搜狗用戶每天使用語(yǔ)音輸入法功能的時(shí)長(zhǎng)最長(zhǎng):
問(wèn)題來(lái)了,市場(chǎng)占有率遙遙領(lǐng)先,用戶的語(yǔ)音使用情況又最好,按道理日均請(qǐng)求上應(yīng)該再拉大差距,從8倍、10倍到9倍、11倍等等才對(duì),為何差距反而大大縮小,只在一兩倍之間了?
最后再來(lái)看賽諾的報(bào)告,通篇只談?dòng)脩舻恼Z(yǔ)音輸入比例,訊飛的語(yǔ)音用戶比例最高,對(duì)應(yīng)報(bào)告后半部分用戶語(yǔ)音認(rèn)知率也最高,這二個(gè)指標(biāo)本來(lái)就是內(nèi)在一致的,有認(rèn)知才會(huì)有使用比例,至少報(bào)告自己沒(méi)有出現(xiàn)邏輯對(duì)不上的情況。
輸入要顛覆自己,領(lǐng)頭羊先要摒棄陳舊的競(jìng)爭(zhēng)思維
一份行業(yè)研究報(bào)告,不僅有數(shù)據(jù),更應(yīng)該洞察未來(lái)。
對(duì)語(yǔ)音輸入來(lái)說(shuō),技術(shù)才是決定未來(lái)的東西,只是羅列眼前的數(shù)據(jù)(還不一定對(duì))不如去探討未來(lái)的技術(shù)潛力。
技術(shù)比拼,看的是潛力而不是眼前的功利,技術(shù)不說(shuō)謊,好用的最終才能最終贏得用戶。
百度與訊飛是AI賽道上的競(jìng)爭(zhēng)對(duì)手,與此對(duì)應(yīng)的是,艾媒報(bào)告和賽諾報(bào)告也各自強(qiáng)調(diào)了輸入法三巨頭的語(yǔ)音技術(shù)能力情況,艾媒報(bào)告如下:
賽諾報(bào)告如下:
而反觀CTR報(bào)告,卻對(duì)具體的語(yǔ)音能力行業(yè)對(duì)比情況避而不談,只是在不斷強(qiáng)調(diào)數(shù)據(jù)、比例、市場(chǎng)占有。
這原本沒(méi)有錯(cuò),但正如CTR報(bào)告自己所說(shuō),語(yǔ)音輸入已經(jīng)滲透到工作生活的各個(gè)場(chǎng)景之中,用戶的需求也日趨多元化。輸入法作為“遠(yuǎn)古”互聯(lián)網(wǎng)產(chǎn)品,在這個(gè)浪潮下正面臨極好的重塑認(rèn)知機(jī)會(huì),改變過(guò)去單純的工具產(chǎn)品定位,帶來(lái)更多商業(yè)模式空間。
艾媒報(bào)告中,給到了AI介入輸入后帶來(lái)的輸入法應(yīng)用革新:
其中,類似凌空手寫、智能聊天助手已經(jīng)可以脫離手機(jī)、PC的范疇,為輸入法打開更廣闊的智能終端應(yīng)用空間。
無(wú)論如何,輸入法的新故事與新希望,是顛覆自己創(chuàng)造全新的產(chǎn)品形態(tài),這就需要領(lǐng)頭羊們拋棄過(guò)去陳舊的競(jìng)爭(zhēng)思維,不再糾結(jié)市場(chǎng)占有率,而更大程度去創(chuàng)新。輸入法的競(jìng)爭(zhēng),很可能要新開辟一條賽道,而不是在原有賽道上爭(zhēng)個(gè)高下,這或也是市場(chǎng)占有率排名二三位的百度、訊飛積極投入語(yǔ)音輸入的原因所在。
而CTR報(bào)告對(duì)原本已經(jīng)處于市場(chǎng)占有率榜首的搜狗輸入法過(guò)分地夸贊,在9月份就推出一個(gè)2019全年的市場(chǎng)報(bào)告,且中間或還存在著種種邏輯不匹配之處,某種程度上可能反應(yīng)出了搜狗的整體焦慮。
8月初,搜狗公布2019年Q2財(cái)報(bào),總營(yíng)收為3.036億美元,歸屬于搜狗的凈利潤(rùn)為2130萬(wàn)美元,而去年同期為3820萬(wàn)美元,一方面絕對(duì)值低,另一方面同比也出現(xiàn)了大幅下降。財(cái)報(bào)發(fā)布當(dāng)日,本來(lái)就不太景氣的搜狗股價(jià)又應(yīng)聲下跌11.6%。
搜狗或正陷入增長(zhǎng)停滯的泥潭,這個(gè)時(shí)候不論對(duì)內(nèi)、對(duì)外、對(duì)投資者都需要“穩(wěn)定軍心”的素材,CTR的報(bào)告在9月出爐或許是最好的安慰劑,這也無(wú)口厚非。只是,輸入法與AI融合后,走向未來(lái)需要更多領(lǐng)頭羊產(chǎn)品做出擔(dān)當(dāng),切不可把安慰劑當(dāng)麻醉劑使用,蒙蔽了自己追逐技術(shù)、追逐未來(lái)的初心。
*此內(nèi)容為【科技向令說(shuō)】原創(chuàng),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。
【完】
曾響鈴
1鈦媒體、品途、人人都是產(chǎn)品經(jīng)理等多家創(chuàng)投、科技網(wǎng)站年度十大作者;
2虎嘯獎(jiǎng)高級(jí)評(píng)委;
3作家:【移動(dòng)互聯(lián)網(wǎng)+ 新常態(tài)下的商業(yè)機(jī)會(huì)】等暢銷書作者;
4《商界》《商界評(píng)論》《銷售與市場(chǎng)》等近十家雜志撰稿人;
5鈦媒體、界面、虎嗅等近80家專欄作者;
6“腦藝人”(腦力手藝人)概念提出者,現(xiàn)演變?yōu)椤白悦襟w”,成為一個(gè)行業(yè)。
7現(xiàn)為“今日頭條問(wèn)答簽約作者”、多家科技智能公司傳播顧問(wèn)。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過(guò)熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無(wú)人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。