原標(biāo)題:一家道系AI公司的非典型邏輯
AI創(chuàng)業(yè)到底怎么啟動(dòng)?這是個(gè)有趣的問題。
隨著基于AI而崛起的創(chuàng)業(yè)公司越來越多。大家都開始有這樣一個(gè)疑問:AI公司,是不是只能有一個(gè)模型?
一般來說,我們知道的AI公司,基本公式就是在語音、圖像、芯片三者中選一條路、開發(fā)算法、打國(guó)際比賽獲得名次、得到大量B端訂單、成為獨(dú)角獸。似乎蕓蕓AI莫不如此。
是否有可能,AI公司可以換一個(gè)發(fā)展邏輯?一點(diǎn)點(diǎn)織成不一樣的發(fā)展軌跡呢?不久前,我在杭州探訪了一家名為Rokid的AI公司。它在剛剛所說的“AI創(chuàng)業(yè)公式”面前,可謂一家絕對(duì)的另類。
不少朋友知道這家以“若琪”音箱而聞名的公司,而且往往是因?yàn)槠洚a(chǎn)品的設(shè)計(jì)感非常出色??墒侨绻氐紸I層面,我們卻能發(fā)現(xiàn)這家公司在幾個(gè)基本層面是“反常識(shí)”的。
比如說:
1、在音箱產(chǎn)品恨不得免費(fèi)的時(shí)候,他們的音箱卻并不便宜。
2、很少聽說過一家AI創(chuàng)業(yè)公司,不僅做產(chǎn)品,做B端解決方案,甚至連芯片和OS都一起做的。
3、在AR眼鏡一片蕭條下,似乎以音箱為主的Rokid卻做了AR眼鏡。
究竟是這家公司故意搞噱頭,還是確實(shí)有某種邏輯支撐起了這些“非典型”舉動(dòng)?在探訪Rokid之后,我的感受是在大家都在熱絡(luò)討論“佛系公司”的時(shí)候,Rokid的思考方式卻是道系的。它在AI變局中立足的核心要義,是《莊子》所說的“外化而內(nèi)不化”。
為什么這么說?我們需要從Rokid的誕生開始說起。
輕擁AI,于深度學(xué)習(xí)的晨曦
2014年,AI在中國(guó)還只是媒體偶爾會(huì)討論的概念,在社交網(wǎng)絡(luò)上出現(xiàn),基本都來自科幻電影。
然而如果回溯整個(gè)AI發(fā)展史,卻會(huì)發(fā)現(xiàn)這個(gè)時(shí)間節(jié)點(diǎn),是深度學(xué)習(xí)技術(shù)真正爆發(fā)出力量的那個(gè)剎那。當(dāng)時(shí)剛剛走出阿里,想要再次創(chuàng)業(yè)的Misa祝銘明,帶領(lǐng)伙伴在杭州成立了Rokid。從創(chuàng)業(yè)伊始,Rokid的目標(biāo)就定位于要做人機(jī)交互。
為什么確立這條賽道?同Misa一起創(chuàng)業(yè)、現(xiàn)任Rokid副總裁的向文杰回憶說,當(dāng)時(shí)最主要的動(dòng)力,是看到了深度學(xué)習(xí)的廣闊想象力。
對(duì)于技術(shù)從業(yè)者來說,AI在當(dāng)時(shí)雖然還是個(gè)冷門行業(yè),但并不是一個(gè)全新議題。但在深度學(xué)習(xí)出現(xiàn)前,AI在理論到現(xiàn)實(shí)中的轉(zhuǎn)化能力始終不盡如人意。然而隨著深度學(xué)習(xí)技術(shù)體系的確認(rèn),并且在機(jī)器翻譯、語音識(shí)別、語義理解等幾個(gè)領(lǐng)域超乎預(yù)料的好用,Rokid的創(chuàng)始班底開始看到,AI這東西真的有明天。
然而以深度學(xué)習(xí)為代表的新一輪AI技術(shù),最能改變的是什么呢?在Misa等人看來,無論是語言還是視覺,最根本被改變的必然是人機(jī)交互形態(tài)。這是AI的終局,也是Rokid的無限目標(biāo)。
隨后,Rokid嘗試從語音交互為起點(diǎn),逐步探索人機(jī)交互入口的硬件產(chǎn)品形態(tài)?;仡^看5年前,AI在當(dāng)時(shí)的狀態(tài)并不被市場(chǎng)看好。但是真正懂得的人,卻會(huì)發(fā)現(xiàn)其終點(diǎn)是那么和光同塵。這大概就是道家所說“守?zé)o明”的狀態(tài),每一家長(zhǎng)線發(fā)展的公司,都會(huì)有這樣一段旅程。
音箱的錘煉與匠致
接下來,以人機(jī)交互為目標(biāo)的Rokid在外界看來產(chǎn)品形態(tài)同樣是做音箱。然而在推出第一款產(chǎn)品到今天的幾年間,Rokid與大多數(shù)AI音箱公司,實(shí)質(zhì)上已經(jīng)走向了基礎(chǔ)理念影響下的岔路。
雖然成立于2014年,但直到2016年他們才推出了第一款產(chǎn)品智能家居機(jī)器人Rokid Alien。這款能投屏、能攝像、能語音交互的機(jī)器人,雖然售價(jià)達(dá)到5000+,但在今天看來也依舊是非常新銳的產(chǎn)品方案。而后2017年,Rokid又推出了高端音箱Rokid Pebble,這款產(chǎn)品斬獲了智能硬件和工業(yè)設(shè)計(jì)類的許多大獎(jiǎng),也是眾多用戶認(rèn)識(shí) Rokid的起點(diǎn)。
2018年,Rokid終于迎來了新品的“爆發(fā)期”,推出了Rokid Panda、Rokid Me、Rokid Mini三款語音交互產(chǎn)品。
(Rokid第一代智能音箱Alien)
然而即使是這一年的三款產(chǎn)品,數(shù)量也遠(yuǎn)低于其他AI音箱公司的發(fā)布頻率。并且在AI音箱已經(jīng)恨不得免費(fèi)的時(shí)候,Rokid的新一代產(chǎn)品“Rokid Me”依舊售價(jià)達(dá)到了799元。而且與同行努力刷新品的戰(zhàn)略不同,Rokid令人“大跌眼鏡”地先后發(fā)布了AR眼鏡、語音芯片和OS系統(tǒng)。
回到音箱的差異化上,Rokid的基礎(chǔ)面貌是貴和少,這與業(yè)內(nèi)同行的成本戰(zhàn)、補(bǔ)貼戰(zhàn)、新品數(shù)量戰(zhàn)截然不同。這或許就是戰(zhàn)略目標(biāo)推演下來的行動(dòng)分化——既然Rokid的目標(biāo)是做人機(jī)交互,那么這一階段他們的目標(biāo)就不是最快速占領(lǐng)市場(chǎng),而是要把語言交互做精致、做完整,讓產(chǎn)品成為真正用戶購(gòu)買后時(shí)時(shí)想要觸發(fā)的AI入口,而不是一個(gè)嘗鮮期的擺設(shè)。
于是,Rokid做了完整的喚醒、交互與語義理解解決方案,首創(chuàng)了雙音節(jié)喚醒詞。并且在工業(yè)設(shè)計(jì)和產(chǎn)品工程能力上,與業(yè)界平均水準(zhǔn)拉開了清晰的分界線——這是讓音箱自證AI人機(jī)交互存在價(jià)值的階段。
與此同時(shí),精雕細(xì)琢的音箱產(chǎn)品,還為Rokid鍛造了三個(gè)它證:
1、不斷提升的機(jī)械設(shè)計(jì)和工程能力,為品牌輸出B端解決方案建立了差異化優(yōu)勢(shì)。
2、語音交互體驗(yàn)的完整性和部署能力,讓Rokid可以適配廣闊的音箱解決方案需求。
3、在不同目標(biāo)客戶群中建立了市場(chǎng)口碑,為下一階段開啟人機(jī)交互升級(jí)與融合提供了基礎(chǔ)。
至此,我們可以嘗試回答第一個(gè)問題,雖然Rokid的硬件產(chǎn)品看起來是小眾的,但是如果它走補(bǔ)貼和廉價(jià)路線,這三個(gè)根本能力也就蕩然無存。
不急不徐地積累了產(chǎn)品,雖然挺慢但是沒有浪費(fèi)產(chǎn)業(yè)資源,并且逐漸完善了人才與技術(shù)生態(tài)。在高速變化的AI產(chǎn)業(yè)中,足夠的積累,是能談?wù)撓乱徊降牡着啤?/p>
而下一步的高速發(fā)展窗口,對(duì)于Rokid來說,其實(shí)出現(xiàn)于B端市場(chǎng)。
B端市場(chǎng)的風(fēng)與海
在語音硬件發(fā)展的歷史上看,2018年可以看作一個(gè)關(guān)鍵節(jié)點(diǎn)。
對(duì)行業(yè)來說,經(jīng)歷了瘋狂的“智障音箱”淘洗之后,市場(chǎng)還是轉(zhuǎn)向接受高品質(zhì)、高可用性的音箱產(chǎn)品。與此同時(shí),隨著AIoT概念的打開,不少?gòu)S商都意識(shí)到音箱產(chǎn)品作為家庭AI場(chǎng)景中樞、音頻內(nèi)容輸出口,以及生活服務(wù)接駁點(diǎn)的價(jià)值。
所以雖然低成本音箱肆虐于2017,但到2018以后,音箱產(chǎn)品整體卻未冷反熱,良幣開始呈現(xiàn)出更高的市場(chǎng)接受度。
借助這個(gè)節(jié)點(diǎn),在自有硬件市場(chǎng)建立了基礎(chǔ)的Rokid,開始建立和驗(yàn)證了一個(gè)2C2B的邏輯。這個(gè)邏輯的要點(diǎn),用道家的理論說,叫做“難易相形”。由于Rokid已經(jīng)在C端硬件領(lǐng)域建立起了足夠“難”的技術(shù)與工程壁壘,此時(shí)打開B端解決方案市場(chǎng)就會(huì)順勢(shì)而為,從容停當(dāng)。
于是我們看到,大量廠商開始選擇Rokid作為自身音箱產(chǎn)品的合作伙伴,使用其解決方案來構(gòu)筑自己的音箱產(chǎn)品。
比如說,在今年3月,360推出了自己的音箱產(chǎn)品。其背后從前期方案設(shè)計(jì)、定制開發(fā),到量產(chǎn)期間的品質(zhì)把控,Rokid都提供了全程的技術(shù)支持。Rokid不僅為其提供了雙喚醒詞的定制化功能,還為其定制了聲紋識(shí)別功能,讓家人擁有“聲音密碼”。
(Rokid成為360語音戰(zhàn)略合作伙伴)
據(jù)了解,僅僅在2019 第一季度,Rokid 的語音技術(shù)已先后服務(wù)于涂鴉、榮事達(dá)、哈曼卡頓和 360 等多個(gè)廠商的音箱新品,TCL、創(chuàng)維小湃的電視和兒童故事機(jī)產(chǎn)品,其合作品牌已達(dá)到100家以上。
而在在音箱之戰(zhàn)的下半場(chǎng),另一個(gè)價(jià)值獨(dú)特的B端市場(chǎng)來自三大運(yùn)營(yíng)商。由于運(yùn)營(yíng)商擁有流量、用戶基數(shù)、內(nèi)容等多種優(yōu)勢(shì),并且家庭AI已經(jīng)成為了運(yùn)營(yíng)商目前注意的進(jìn)攻方向,因此其推出AI音箱的市場(chǎng)愿望也就在今天逐步清晰。
然而客觀上來說,運(yùn)營(yíng)商在技術(shù)能力和AI人才儲(chǔ)備上顯然是較AI企業(yè)相對(duì)落后的。這種情況下,運(yùn)營(yíng)商的AI音箱需求,也就成為了AI語音交互供應(yīng)商新的藍(lán)海。
這也是Rokid抓住的一縷風(fēng)。今年4月,Rokid 與聯(lián)通沃音樂達(dá)成戰(zhàn)略合作。聯(lián)通沃音樂還發(fā)布了由 Rokid 提供全鏈路語音方案的新款智能音箱 A2。而此前中國(guó)移動(dòng)已經(jīng)推出了由Rokid提供語音解決方案的音箱產(chǎn)品“和家小荷”;去年,四川電信也與Rokid達(dá)成了深度合作。至此,三大運(yùn)營(yíng)商都選擇了Rokid作為音箱產(chǎn)品解決方案提供商,這可是絕對(duì)的罕見。
究其原因,Rokid進(jìn)入這一市場(chǎng),所依賴的核心優(yōu)勢(shì)叫做“完整”。
(Rokid與聯(lián)通沃音樂戰(zhàn)略合作簽約儀式)
這包括從軟件到硬件層的布局完整,也包括從芯片到OS再到算法層的全棧部署完整性,還包括整個(gè)Home場(chǎng)景的完整性。就企業(yè)用戶而言,Rokid一方面提供了最大的解決方案可選擇性,另一方面也讓用戶可以最大限度解除AI門檻。從核心算法,到工程化能力,第三方接入體驗(yàn),以及內(nèi)容、技能、IoT接入的能力,Rokid提供了一個(gè)非常完整且高性價(jià)比的方案,企業(yè)用戶不需要太多修改就打造更好的AI語音硬件。
非常復(fù)雜的企業(yè)市場(chǎng),Rokid能夠最大程度進(jìn)行兼容的核心優(yōu)勢(shì)在哪里?其根本原因或許就在于其“慢”的C端技術(shù)能力積累,變成了“快”的B端能力升級(jí)。
這不僅是關(guān)于技術(shù)和能力的積累,也包括組織架構(gòu)對(duì)B端市場(chǎng)的準(zhǔn)備和適應(yīng)。Rokid就進(jìn)行了技術(shù)中臺(tái)化,打造中重中臺(tái)、小前端的架構(gòu)。如此可以靈活適應(yīng)B端市場(chǎng)的高定制化需求。從開始進(jìn)入B端市場(chǎng)到現(xiàn)在,Rokid已經(jīng)將產(chǎn)品整合周期從6個(gè)月縮短了3個(gè)月。
在B端市場(chǎng)進(jìn)一步打開的情況下,Rokid也同時(shí)迎來了新的變化。芯片、OS、AR眼鏡,這些絕對(duì)不像一家AI語音公司應(yīng)該具備的產(chǎn)品,接二連三“生長(zhǎng)”了出來。
從芯片到OS,順勢(shì)而為的創(chuàng)造與突破
B端市場(chǎng)的旺盛生長(zhǎng),以及Rokid站立其中的邏輯,也可以反過來回答另一個(gè)問題:為什么Rokid要做芯片這么重的東西?
原三星半導(dǎo)體(中國(guó))研究所長(zhǎng)、在2018年4月入職Rokid、出任副總裁負(fù)責(zé)基礎(chǔ)平臺(tái)相關(guān)業(yè)務(wù)的周軍博士給我的答案,是在需要的時(shí)候,自然而然就選擇去做了這些。
以Rokid推出的語音芯片KAMINO 18為例。在音箱產(chǎn)品中,國(guó)內(nèi)高端音箱產(chǎn)品一般是使用通用CPU進(jìn)行計(jì)算。但問題是CPU并不適應(yīng)針對(duì)性的語音計(jì)算,容易造成大量算力浪費(fèi)和高昂成本。而一些物聯(lián)網(wǎng)芯片,卻無法支撐復(fù)雜的語音交互,尤其是音箱+通話的需求。這種情況下,Rokid看到了需求和機(jī)會(huì),于是在自身芯片人才團(tuán)隊(duì)的積累下,基于產(chǎn)業(yè)合作打造了自己的AI 芯片 KAMINO18。而其對(duì)B端市場(chǎng)的直接影響在于,給客戶提供了更低功耗、低成本的芯片解決方案,完善了全棧能力。
(Rokid自研AI專用芯片KAMINO 18)
而YodaOS也是如此,由于AI語音軟件在硬件上部署缺乏平臺(tái)化接口,企業(yè)用戶和開發(fā)者想要定義自己的語音交互解決方案十分不便。這個(gè)痛點(diǎn)的存在,讓Rokid開發(fā)了YodaOS。這樣B端合作者將可以更自由靈活定義自身的產(chǎn)品形態(tài),而Rokid也收獲了自己的開發(fā)生態(tài)基礎(chǔ)。
做好人才與平臺(tái)準(zhǔn)備,隨時(shí)發(fā)現(xiàn)需求與變化,積極進(jìn)行回應(yīng),是Rokid做出這么多看似奇特產(chǎn)品的基本邏輯。而這樣是思考方式也影響了其接下來的產(chǎn)品走向——視覺。
去年的發(fā)布會(huì)上,Rokid拿出了研發(fā)和投入已久的 AR眼鏡產(chǎn)品Rokid Glass,這在今天的行業(yè)狀況來說是很奇怪的。然而出于對(duì)人機(jī)交互的探索來思考,那么AR眼鏡就處在接下來“自然而然”的產(chǎn)品地位。另一方面,雖然AR眼鏡今天依舊處在初級(jí)階段,然而其需要路徑卻是清晰的,當(dāng)風(fēng)口真正打開時(shí),已經(jīng)具備產(chǎn)品能力和技術(shù)優(yōu)勢(shì)的Rokid希望自己處在更有利的位置。
追尋基本常識(shí),是我們看到Rokid拿出全棧產(chǎn)品的邏輯支撐。這個(gè)邏輯也挺“道家”的,所謂自然而然,應(yīng)有則有。
道系A(chǔ)I公司的邏輯
向文杰認(rèn)為,Rokid作為一家AI創(chuàng)業(yè)公司,最大的體會(huì)是要“站在終局,保持變化”。
站在終局的不動(dòng),與保持變化的隨時(shí)動(dòng),這看似矛盾的概念,正好構(gòu)成了Rokid很有道系味道的產(chǎn)業(yè)邏輯。
在他們看來,是AI將要改變?nèi)祟惖慕换シ绞剑渲刑N(yùn)藏著巨大的機(jī)會(huì),這是需要內(nèi)不化的東西。而外部隨時(shí)出現(xiàn)的技術(shù)變化、產(chǎn)業(yè)變化,則是一個(gè)如流水般的環(huán)境結(jié)構(gòu),必須實(shí)時(shí)外化。比如說運(yùn)營(yíng)商的音箱產(chǎn)品解決方案需求,這就是一個(gè)其實(shí)并不小但卻是在激蕩的產(chǎn)業(yè)效率里被突然擠壓出來的市場(chǎng)機(jī)遇。
而只有內(nèi)固外化,才能保持始終的方向和對(duì)產(chǎn)業(yè)需求的實(shí)時(shí)捕捉, 不斷夯實(shí)看到的東西,見縫插針組織自己的技術(shù)壁壘和產(chǎn)業(yè)生態(tài)。
(Rokid Glass)
Rokid與AI獨(dú)角獸和大公司的區(qū)別也在于此。大公司的團(tuán)隊(duì)龐大,捕捉一線實(shí)時(shí)機(jī)遇的效率某種程度上來說不如小公司,同時(shí)面臨營(yíng)收和市場(chǎng)的巨大壓力,大公司和獨(dú)角獸也很難保持對(duì)一件事的專注不動(dòng)搖。
從Rokid背后,我們可以看到一個(gè)關(guān)于AI創(chuàng)業(yè)方案的辯論:一般意義上我們認(rèn)識(shí)中的AI創(chuàng)業(yè)公司,都希望自己變成石頭。在某一個(gè)算法、某一個(gè)行業(yè)快速完成卡位,然后不斷拓展石頭的邊緣,堵在那里動(dòng)也不動(dòng)。然而在AI產(chǎn)業(yè)升級(jí)不斷進(jìn)行戰(zhàn)略進(jìn)化的時(shí)候,清晰的某一領(lǐng)域AI壁壘是很容易被大公司舉起重資源沖破的。而Rokid則讓我們看到了,AI創(chuàng)業(yè)可以不像一塊石頭,而是像水。核心的流向不變,不斷在幾個(gè)水域里勾勒自己的渠脈,最終它的產(chǎn)業(yè)價(jià)值將是彈性與自循環(huán)的。
是之謂,道法自然。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。