精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

<button id="40aae"></button>

<abbr id="40aae"></abbr>

<bdo id="40aae"></bdo>

直播
榜單
7x24h快訊

極客網(wǎng) > 人工智能 >

阿里云百煉上線音視頻實時互動功能，人人都能創(chuàng)建專屬多模態(tài)應用

人閱讀
2024-12-19 16:10:08
來源：極客網(wǎng)
相關關鍵詞

近日，阿里云百煉上線了全新音視頻實時互動功能，用戶可在百煉上自由選擇文本、語音和視覺理解等200多款模型，無需代碼，數(shù)分鐘即可搭建一個能聽、能看、會說的專屬AI助手。阿里云百煉還支持以sdk的形式集成到Web、ioS和安卓應用，可應用于AI虛擬助手、虛擬陪伴和AI老師等場景。

圖片1.jpg

用戶在百煉上幾分鐘即可搭建一個能聽、能看、會說的專屬AI助手

過去一年，大模型正在從純文本模態(tài)向語音和視覺等多模態(tài)演進，極大地拓寬了大模型應用的想象空間。然而現(xiàn)有單一模型仍舊無法處理復雜的任務，為了進一步加速單一大模型構建成像人一樣自然交互的復雜AI應用，阿里云百煉提供了200多款語言模型Qwen、視覺語言模型Qwen2-VL、語音合成模型CosyVoice等全模態(tài)全尺寸大模型，同時聯(lián)合阿里云AI實時互動方案，在國內(nèi)率先為用戶提供了便捷的工作流應用和智能體編排應用，例如支持構建RAG知識庫、Prompt調(diào)優(yōu)、sdk集成等。

據(jù)介紹，在視覺理解模型方面，阿里云Qwen2-VL具備強大的視覺智能體能力，例如采用多模態(tài)旋轉(zhuǎn)位置嵌入（M-ROPE）方法，能夠同時捕捉和整合一維文本序列、二維視覺圖像以及三維視頻的位置信息，模型具備更好地理解和建模復雜的多模態(tài)數(shù)據(jù)，該模型一經(jīng)推出就成為開源社區(qū)最受歡迎的多模態(tài)大模型；在音頻方面，阿里云語音合成模型CosyVoice，通過對生成語音的情感、韻律進行細粒度的控制，情感表現(xiàn)力上得到明顯提升，阿里云AI實時互動方案還可提供化智能降噪、智能打斷、智能斷句等超擬人對話能力。

以搭建一個視覺能力的AI應用為例，用戶進入百煉應用控制臺后，僅需上傳圖片知識庫、編寫提示詞、設置音頻、調(diào)優(yōu)這四步，數(shù)分鐘內(nèi)就能創(chuàng)建一個能完成專屬視頻交互的AI應用，基于Qwen-VL強大的視覺推理能力，它不僅能識別物體的種類，還能準確描述物體的風格、特點、位置以及物體上的文字等關鍵信息。此外搭建好的應用還支持以音視頻sdk集成到用戶的Web、ioS或者安卓應用中，幫助企業(yè)快速實現(xiàn)業(yè)務創(chuàng)新。

據(jù)介紹，阿里云百煉上的通義API每百萬tokens價格已降至0.3元，一汽、金山、哈啰集團、國家天文臺等超30萬企業(yè)和機構在使用阿里云百煉。

（免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時，應及時向本網(wǎng)站提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關文章源頭核實，溝通刪除相關內(nèi)容或斷開相關鏈接。）

為您推薦

極客觀察

欄目相關

贊助商

極客網(wǎng)熱搜關鍵詞

人工智能 AI OpenAI 機器學習 ChatGPT 生成式AI AI芯片 AIGC U-Mail AI大模型世界人工智能大會 AIoT AirPods Airbnb Rushmail 人工智能AI AI人工智能 Akamai 昇騰AI 生成式人工智能 AIPC Air AI技術谷歌AI 蘋果AI GenAI 科大訊飛AI學習機百度AI CAICT 阿爾法蛋AI詞典筆T10 AI手機華為AI 松鼠AI 微軟AI AI+ AIS Airdoc WAIC 昇騰AI創(chuàng)新大賽 AITO 阿爾法蛋AI詞典筆京東AI 智譜AI AI模型 SoleusAir aigo SoleusAir舒樂氏 2019世界人工智能大會 LIFAair AI機器人移動AI時代 AI創(chuàng)企人工智能大會浙大AIF AI算力 AI醫(yī)療人工智能技術 AI應用 Zain xAI 人工智能芯片 AI人才 Airtag AI時代 AI服務器騰訊AI AI算法 BrainCo AI投資 AI框架 Gmail 人工智能計算中心聯(lián)想AI VAIO Airwallex空中云匯 AI教育 Chain 人工智能大賽 Coremail AI賦能谷歌人工智能 OPENAIGC開發(fā)者大賽人工智能名片 Airwheel 昇騰AI開發(fā)者創(chuàng)享日 AI搜索 AI眼鏡 Mirai 人工智能機器人 AI音樂阿里AI AI聊天機器人 BrainCo強腦科技阿爾法蛋AI詞典筆T20 AI計算英偉達AI芯片浪潮KaiwuDB AI助手 AIOps 人工智能+

上一篇

字節(jié)跳動自主研發(fā)AI GPU，旨在減少對英偉達依賴

下一篇

2023：AI Agent風起云涌之年，揭秘智能體技術發(fā)展全貌

簡版
原版
投稿
回頂部

2024-12-19

阿里云百煉上線音視頻實時互動功能，人人都能創(chuàng)建專屬多模態(tài)應用

近日，阿里云百煉上線了全新音視頻實時互動功能，用戶可在百煉上自由選擇文本、語音和視覺理解等200多款模型，無需代碼，數(shù)分鐘即可搭建一個能聽、能看、會說的專屬AI助手。

長按掃碼閱讀全文

<rt id="kqkck"></rt>

<kbd id="kqkck"><optgroup id="kqkck"></optgroup></kbd>

<dl id="kqkck"><tbody id="kqkck"></tbody></dl>