TechWeb 文/卞海川
把GPT“吹”上車,真的能給用戶帶來實(shí)際價(jià)值嗎?
眾所周知,ChatGPT已經(jīng)成為全球最快用戶破億的應(yīng)用,各大科技巨頭陸續(xù)發(fā)布了“類ChatGPT”AI大模型。這其中,AI大模型在智能汽車領(lǐng)域的應(yīng)用更成為整個(gè)汽車行業(yè)集體關(guān)注的焦點(diǎn),尤其是國內(nèi)車企更是趨之若鶩。
車企盡上GPT
據(jù)不完全統(tǒng)計(jì),目前僅接入文心一言的車企就包括長安、集度、吉利、嵐圖、紅旗、長城、東風(fēng)日產(chǎn)、零跑等。除了國內(nèi)車企,奔馳、微軟宣布將在美國奔馳汽車上增加GPT功能。借助OpenAI和微軟的技術(shù),奔馳原有車載語音助手將得到升級(jí)。
與此同時(shí),國內(nèi)諸如蔚來汽車、小鵬汽車、理想汽車、奇瑞汽車均申請(qǐng)了GPT相關(guān)商標(biāo)。如蔚來汽車申請(qǐng)“NIOGPT”、小鵬汽車申請(qǐng)“XPGPT”、理想汽車申請(qǐng)“MindGPT”等。 尤其是理想,不久前已經(jīng)發(fā)布了自研Mind GPT,并將AI技術(shù)引入到車機(jī)“理想同學(xué)”中。
可以說,國內(nèi)的車圈也已經(jīng)進(jìn)入了大模型的混戰(zhàn)階段,那么問題來了,這些大模型究竟有何本領(lǐng)?與此前車企們吹捧的智能座艙和智能駕駛又有何區(qū)別呢?
GPT上車 價(jià)值在哪?
由于接入百度文心一言的車企較多,所以這里我們就以它為例,看看大模型上車到底帶來了什么?
結(jié)合媒體及官方信息,我們知道,與智能座艙結(jié)合,最直觀的體現(xiàn)就是在交互上。例如更聰明能聽懂人話,包括那些模糊的指代命令,可以和人對(duì)話;能通過搜索分析,給出更貼切的反饋;能夠提供個(gè)性化、擬人化的服務(wù);甚至在文字、語音、圖片之間的轉(zhuǎn)換等。
具體到應(yīng)用場景,包括超級(jí)閑聊、靈感畫畫、百變?nèi)嗽O(shè)、AI新車導(dǎo)購等。以超級(jí)閑聊為例,就是把車內(nèi)變成一個(gè)交流場景,通過與語音助手對(duì)話式交互,規(guī)劃行程、答疑解惑、閑聊,就像人與人交流一樣自然。
同時(shí),基于大模型本地化技術(shù),小度車載語音 SDK 支持流暢的免喚醒多路同時(shí)交互、全頁面所見所說、全域毫秒級(jí)響應(yīng),這些都讓細(xì)節(jié)的體驗(yàn)升級(jí)。特別是真多路同時(shí)對(duì)話能力,最大支持 8 路同時(shí)交互精確處理,覆蓋整個(gè)座艙內(nèi)外,可以實(shí)現(xiàn)多路同時(shí)、快速、連續(xù)對(duì)話的極限挑戰(zhàn),就算坐在駕駛位、副駕駛位和后排的一家人同時(shí)開口,語音助手也能滿足每一個(gè)人的訴求。
再看理想的Mind GPT ,聲稱和“理想同學(xué)”結(jié)合后,支持聲紋識(shí)別、內(nèi)容識(shí)別、方言識(shí)別、出行規(guī)劃,AI 繪畫、AI 計(jì)算等功能。
不知道業(yè)內(nèi)看到這些作何感想?在我們看來,除了某些應(yīng)用場景(例如超級(jí)閑聊、多路對(duì)話能力、)影響駕車安全,且并非剛需,其他所謂的場景基本上也是此前智能語音的升級(jí),至于到了用戶體驗(yàn)上能有多大的提升,還需時(shí)間的檢驗(yàn)。
其實(shí)不止是百度文心一言,目前上車的大模型在智能駕駛座艙方面(基本都是原有語音理解和交互的提升)都是大同小異,很難形成差異化的競爭力和用戶體驗(yàn)。
思必馳汽車事業(yè)部產(chǎn)品總監(jiān)葛付江對(duì)TechWeb表示,ChatGPT目前是以文本交互機(jī)器人的形式呈現(xiàn)的,適用多種文本處理任務(wù),常用于智能問答和對(duì)話、文本創(chuàng)作等領(lǐng)域;車載語音以對(duì)話交互為主,多用于進(jìn)行例如“導(dǎo)航去XXX?打開音樂”有明確指令的行動(dòng),“語音助手”用高度擬人化的語音輸出來回應(yīng)車主訴求。車載語音交互用于解放駕駛員雙手,聚焦其注意力帶來更安全、便利的駕駛體驗(yàn)。未來車內(nèi)有了ChatGPT技術(shù)的應(yīng)用,不僅是完成固定指令的任務(wù)型對(duì)話,車、人能進(jìn)行更高效、更直接、高靈活度的出行、知識(shí)和閑聊交流。
可以看到,目前GPT上車的價(jià)值主要還是局限在智能座艙的語義識(shí)別,可是目前國內(nèi)車企的智能語音助手相對(duì)成熟,GPT賦能下的智能座艙很難在帶給用戶更大提升。況且,一個(gè)新的技術(shù)或者產(chǎn)品能否最終落地得到規(guī)模的應(yīng)用,除了技術(shù)因素外,還會(huì)受到其所處產(chǎn)業(yè)或者市場的產(chǎn)業(yè)鏈、市場競爭強(qiáng)弱、市場空間等諸多因素密切相關(guān)。
具體到車載智能語音系統(tǒng),雖然ChatGPT在“智能”上表現(xiàn)出色,但其在整個(gè)產(chǎn)業(yè)鏈條中比較偏后段,需要依賴很長的前端鏈條,比如信號(hào)處理、語音識(shí)別、文字輸出之后才會(huì)用到它,前端鏈條上的因素對(duì)后端流程都會(huì)產(chǎn)生影響,例如信號(hào)處理會(huì)影響語音識(shí)別,語音識(shí)別如果出錯(cuò)就會(huì)影響NLP的判斷,鏈條上每個(gè)模塊都需要提高可靠性,才能保證最后出來的整體結(jié)果可靠。
也就是說,ChatGPT在“智能”能力的輸出上,并非完全取決于自身的能力,其產(chǎn)業(yè)鏈上任何一個(gè)環(huán)節(jié)都會(huì)對(duì)其造成正或負(fù)的影響。
綜上所述,無論是從體驗(yàn)提升還是其它因素制約來考慮,GPT在智能座艙層面“加持”有限。
除了上述智能座艙外,值得注意的是,智能駕駛是最早被提出的AI應(yīng)用場景之一,而自動(dòng)駕駛需要大量的數(shù)據(jù)處理和分析,同時(shí)自動(dòng)駕駛的應(yīng)用也需要長期仿真測試以及道路測試,而AI大模型的加速發(fā)展將縮短自動(dòng)駕駛開發(fā)進(jìn)程,進(jìn)一步推動(dòng)產(chǎn)業(yè)成熟。
業(yè)內(nèi)知道,早在2019年,特斯拉就將基于深度神經(jīng)網(wǎng)絡(luò)Transformer大模型引入到感知預(yù)測中,并在2021年8月的特斯拉AI DAY 上展示了基于Transformer的BEV(鳥瞰視角) 感知方案,這是大模型技術(shù)首次被應(yīng)用到自動(dòng)駕駛行業(yè),也是FSD實(shí)現(xiàn)“重感知,輕地圖”純視覺路線的關(guān)鍵所在。
雖然從極少數(shù)的內(nèi)測到如今面向北美所有購買用戶推送,最新駕駛里程接近2億英里,并被認(rèn)為是目前最先進(jìn)的自動(dòng)駕駛系統(tǒng)之一。但時(shí)至今日,其在實(shí)際的應(yīng)用中依然是事故頻發(fā),遠(yuǎn)未達(dá)到自動(dòng)駕駛應(yīng)有的體驗(yàn)。
領(lǐng)先的特斯拉尚且如此,何況現(xiàn)在才開始利用大模型的其他廠商。
寫在最后
車企們爭相獨(dú)立布局語言大模型技術(shù)以提升汽車智能化(例如智能座艙、智能駕駛等),的舉措無可厚非。但從目前幾乎主流車企,尤其是國內(nèi)車企扎堆推出各GPT后的應(yīng)用場景和體驗(yàn)看,依然缺乏與此前未采用大模型的差異化,而這也讓我們不禁發(fā)問,車企們?cè)诹ν普Z言大模型的時(shí)候,到底只是為“亂花迷人眼”,還是應(yīng)該本質(zhì)性地提升用戶的體驗(yàn)為先?
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )