文/ VRAR星球 R星人
2024年美國(guó)CES消費(fèi)電子展(CES2024)于北京時(shí)間1月10日至1月13日在拉斯維加斯舉行。今年CES展主題定為 “All together All on”,圍繞“AI+”強(qiáng)調(diào)全球消費(fèi)者電子產(chǎn)品的融合與協(xié)同。
在今年CES2024上發(fā)布“AI+”相關(guān)新技術(shù)的國(guó)內(nèi)外企業(yè)并不少,可見去年ChatGPT大模型的爆火的確是引領(lǐng)了整個(gè)行業(yè)的變化。但據(jù)VRAR星球前方記者的反饋,本屆CES大展除了大模型外,很多海外企業(yè)更喜歡強(qiáng)調(diào)基于大模型延伸出來的另外一項(xiàng)應(yīng)用—— AI Agent 智能體 。
AI Agent 在海外是備受關(guān)注的一個(gè)話題,畢竟比爾蓋茨都為之傾倒專門為它寫了一篇長(zhǎng)博客。
其中比爾蓋茨有幾個(gè)觀點(diǎn)大家可以細(xì)品:
?在不久的將來,任何上網(wǎng)的人都能擁有一個(gè)遠(yuǎn)超今天技術(shù)水平的人工智能助手(即AI Agent);
?AI Agent會(huì)改變每個(gè)人與計(jì)算機(jī)的交互方式,將引領(lǐng)我們從鍵入命令到點(diǎn)擊圖標(biāo)以來計(jì)算機(jī)領(lǐng)域最大的革命;
?AI Agent更加智能。它們是主動(dòng)的,能夠在你提出請(qǐng)求之前就提供建議;能夠跨應(yīng)用程序執(zhí)行任務(wù);能夠隨著時(shí)間推移而改進(jìn);
?在計(jì)算機(jī)行業(yè),Agent將是下一個(gè)支撐應(yīng)用程序與服務(wù)的平臺(tái)。
AI Agent 引起了全球各界的關(guān)注,學(xué)術(shù)界、科技巨頭和創(chuàng)業(yè)公司都紛紛開始訓(xùn)練自己的通用性或垂類行業(yè)、細(xì)分場(chǎng)景中,擁有不同交互方式和能力的 Agents 。
讓比爾蓋茨等大佬趨之若鶩的 Agent 到底是什么?最簡(jiǎn)單的描述其實(shí)就是——《鋼鐵俠》中托尼·史塔克的AI助手賈維斯。
雖然最初AI這個(gè)概念出來,一切帶“智能”兩個(gè)字的終端設(shè)備在宣傳時(shí)都會(huì)說要給用戶打造屬于自己的“賈維斯”。
不可否認(rèn)的是,賈維斯這樣的AI 助手的確滿足了人類對(duì)智能伙伴的一切想象,可靠、聰明甚至還帶一點(diǎn)幽默,同時(shí)賈維斯擁有的情感讓他更像一個(gè)人類而非單純的系統(tǒng)。但很長(zhǎng)一段時(shí)間現(xiàn)實(shí)中涌現(xiàn)的各類語音助手中,仍未出現(xiàn)那個(gè)具備超級(jí)智慧,屬于用戶自己的“賈維斯”。
而賈維斯般智能助手的宣傳說法也在后續(xù)爆火的各種技術(shù)下,被市場(chǎng)浪潮打到岸邊,直到2023年 AI Agent 的出現(xiàn)。
AI Agent 根據(jù)Open AI的定義來看,是以大語言模型作為大腦驅(qū)動(dòng),不僅擁有理解感知能力,更具有記憶、規(guī)劃、行動(dòng)和使用工具的能力,是一個(gè)能根據(jù)環(huán)境的變化作出自主決策并自動(dòng)化執(zhí)行完成復(fù)雜任務(wù)的系統(tǒng)。
目前來說,大部分的Agents 仍是通過電腦或者手機(jī)上的應(yīng)用程序和用戶聯(lián)系。但就未來而言,一切的可穿戴設(shè)備都可能成為 Agents的載體。
比如,被譽(yù)為下一代的智能終端——AR設(shè)備。雖然從2023年起,全球宣告搭載大模型的AR廠商并不少,但是目前明確提出了 AI Agent 概念并聚焦于此的AR廠商僅李未可科技一家。
在本屆CES展上,VRAR星球前方記者也遇到了參展的李未可科技,有關(guān) Agent 的話題我們和李未可科技創(chuàng)始人兼CEO茹憶在現(xiàn)場(chǎng)簡(jiǎn)單地聊了一下。
CES現(xiàn)場(chǎng)茹憶向用戶展示Meta Lens S3能力
CES海外用戶體驗(yàn)李未可科技Meta Lens S3
從技術(shù)趨勢(shì)來看,探索大模型應(yīng)用的創(chuàng)業(yè)公司,基本上都是在做 Agents,所以目前來看,搭載大模型和搭載 AI Agent 區(qū)別并不大,只是各家早期布局和切入點(diǎn)的不同,決定了后期 Agents 能力的不同。
目前市面上大部分AR廠商接入大模型主要圍繞語言和視覺,先做到讓AR眼鏡更懂用戶,聽得懂用戶的話,看得懂用戶看見的一切。Agent 還能根據(jù)用戶的歷史偏好和交互記錄進(jìn)行個(gè)性化“成長(zhǎng)”。
比如,你希望Agents幫你計(jì)劃一次旅行,它就像一個(gè)私人秘書一樣能直接根據(jù)你目前的預(yù)算和以往的偏好幫你做好行程規(guī)劃、預(yù)訂機(jī)票和酒店,到達(dá)旅游地后又將化身成為導(dǎo)游,提供當(dāng)?shù)氐慕煌ㄐ畔⒑蛯?dǎo)航,推薦當(dāng)?shù)氐木包c(diǎn)和活動(dòng)并進(jìn)行講解,甚至幫你做實(shí)時(shí)語言翻譯等等。而且Agent做好這一切規(guī)劃和服務(wù)只需要幾秒的時(shí)間。
茹憶表示,目前他們剛開通的City Walk功能,就是帶上Meta Lens S3 后,無需查詢各類攻略,只需將游玩需求告訴小柯/零下(李未可AR眼鏡中的智能助手),就能自動(dòng)生成路線,讓用戶根據(jù)AR眼鏡中規(guī)劃的的路線開啟City Walk,并提供所經(jīng)路線的一切吃喝玩樂建議。在路過景點(diǎn)時(shí)小柯/零下會(huì)自動(dòng)呈現(xiàn)出關(guān)于該地點(diǎn)背后的故事并進(jìn)行講解;在旅途中餓了困了都可通過小柯/零下查詢到用戶所處位置附近的店鋪,并導(dǎo)航到店。
李未可用戶帶上Meta Lens S3 City Walk
當(dāng)然,這也僅僅只是AI Agent基于語言和視覺大模型上在應(yīng)用的一個(gè)能力點(diǎn)而已。
在去年的采訪中,李未可的創(chuàng)始人兼CEO茹憶就說過:李未可科技將要基于多模態(tài)融合交互大模型,為用戶打造出屬于自己的“賈維斯”。
茹憶提到的多模態(tài)融合交互大模型,強(qiáng)調(diào)的是通過多方面大模型的融合和協(xié)同工作去提供更全面和豐富的交互體驗(yàn)。如,除了語言模型、計(jì)算機(jī)視覺模型之外,還可以增加音頻處理模型、情感分析模型等等。
一個(gè)簡(jiǎn)單的例子,單純的語言大模型仍難識(shí)別一些情緒化的表達(dá):
從我們?nèi)祟惖慕嵌葋砜?,因?yàn)椤啊钡拇嬖?,這其實(shí)更偏向撒嬌的語氣。如果在語言大模型上融合了情感分析模型,那這個(gè)AI 就不會(huì)給出這樣的“機(jī)器化”的回答。
如果再疊加上音頻處理模型,那Agents就能通過對(duì)方說話語氣、語調(diào)整體判斷出對(duì)方的情緒是怎樣的,并能給用戶一些交談建議。
目前國(guó)內(nèi)外,已經(jīng)有越來越多的企業(yè)加入到這場(chǎng)Agent 的建設(shè)及應(yīng)用藍(lán)海中。根據(jù)海外媒體報(bào)道,微軟、谷歌、Meta和亞馬遜等都準(zhǔn)備將AI大模型應(yīng)用在智能眼鏡等可穿戴設(shè)備上。
Meta近期也展示了自己將AI Agent 融入到 Ray-Ban Meta 智能眼鏡的效果。該智能眼鏡可以通過AI語音助手描述用戶看到哪些東西,也能通過眼鏡端的攝像頭識(shí)別后告訴用戶應(yīng)該如何搭配等新功能。
微軟的Hololens 也計(jì)劃通過讓用戶將Hololens拍下照片發(fā)送給AI Agent,讓AI Agent 直接識(shí)別物體。同時(shí),用戶還可以通過對(duì)話的方式,從AI Agent 這里獲得更多專業(yè)的信息。
亞馬遜也表示或?qū)⑼瞥鲆豢钅軌蜻\(yùn)行多模態(tài)AI的新設(shè)備??梢钥吹皆谟纱竽P拖破鸬?a href="http://worldfootballweekly.com/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD_1.html" target="_blank" class="keylink">人工智能熱潮中,大模型將成為底層基礎(chǔ)設(shè)施。但到底哪些終端設(shè)備將成為大模型的最佳載體?手機(jī)、耳機(jī)、智能眼鏡還是AR眼鏡?這里面仍有很多未知性。
在 Agent 應(yīng)用探索上,茹憶堅(jiān)持自己幾個(gè)觀點(diǎn):
1. AR設(shè)備作為下一代智能終端,AI大模型與AR眼鏡的深度融合,將極大提升后者的終端感知、認(rèn)知與交互能力,進(jìn)而創(chuàng)造全新的用戶體驗(yàn)。
2.AI Agent 將成為 AR 眼鏡的核心能力,而且不僅是交互這么簡(jiǎn)單,它可能是融合手機(jī)上所有App的能力,也有可能是一個(gè)系統(tǒng)。
3.在AI Agent的人格化上,茹憶認(rèn)為 AI Agent應(yīng)該是有具體形象而非“虛無”或是被想象成某個(gè)物品,這樣才能建立人和AI Agent的情感聯(lián)接,為用戶提供更沉浸式的服務(wù)。
從中能看出李未可科技在Agent應(yīng)用及探索方向上和國(guó)內(nèi)外其他廠商的區(qū)別:即AI Agent的人格化。
目前國(guó)內(nèi)外研究AI Agent的企業(yè),無論是Meta、微軟還是其他廠商在AI Agent的外在形象、人格打造上幾乎為0。
但李未可科技創(chuàng)業(yè)之初就針對(duì)數(shù)字人李未可AI家族進(jìn)行的偶像化包裝,打造李未可AR眼鏡的“靈魂”,塑造了個(gè)性、擁有完整背景故事的數(shù)字人IP ,并在全網(wǎng)獲得200w粉絲關(guān)注。
李未可AI家族
而 AI 大模型的融合則是讓數(shù)字人李未可AI家族“活”起來。畢竟當(dāng)AI Agent不再是一串代碼,而是擁有一些愛好、情緒和具體形象的“人”時(shí),整個(gè)溝通的體驗(yàn)感將完全不同。
現(xiàn)階段,李未可科技的重點(diǎn)是不斷訓(xùn)練自研多模態(tài)交互大模型的能力,快速迭代和增加Agent的能力,讓數(shù)字人李未可AI家族在人格化或者專業(yè)知識(shí)方面更加的豐富。至于 AI Agent 對(duì)醫(yī)療、教育等的專業(yè)知識(shí)方面的認(rèn)知,李未可科技或自研打造更多的數(shù)字人或選擇其他 Agent 來合作。
當(dāng)然,茹憶也不否認(rèn)現(xiàn)在距離大家所設(shè)想的AI Agent仍有一段距離,甚至和AR眼鏡的融合也不一定會(huì)短期內(nèi)擁有非常大的飛躍。但 Agent 的出現(xiàn)正在構(gòu)建整個(gè)行業(yè)的新可能,李未可也將持續(xù)探索 Agent 在大模型紅利下的最佳AR應(yīng)用場(chǎng)景。
有關(guān)李未可科技在AI Agent + AR的更多設(shè)想以及在CES展上的更多內(nèi)容,VRAR星球后續(xù)將發(fā)布現(xiàn)場(chǎng)對(duì)茹憶的采訪,大家可以持續(xù)關(guān)注。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 生成式AI云上創(chuàng)新,“全棧聯(lián)動(dòng)”將成關(guān)鍵詞?
- 大模型進(jìn)化論:AI產(chǎn)業(yè)落地將卷向何方?
- 2024年劇集氪金力大盤點(diǎn)
- “共創(chuàng)”、“造?!背身斄?,傳統(tǒng)品牌緣何要花式出圈?
- 人形機(jī)器人瘋狂進(jìn)廠打工!銀河通用、智元、樂聚機(jī)器人怕是都瘋了
- 因?yàn)樗投Y電商!2025微信、抖音、淘寶又撕破了臉
- 中國(guó)手機(jī)市場(chǎng)成績(jī)單:華為增長(zhǎng)最快,蘋果跌幅最大
- 原以為微軟、亞馬遜、阿里云云計(jì)算大局已定!沒想到有這四大變數(shù)
- 崖州灣之旅:看見海與智能,聯(lián)想到了未來
- 榮耀換帥,一艘AI巨輪的舵手更替會(huì)帶來什么?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。