2月26日消息,Anthropic首款混合推理模型Claude Sonnet 3.7近日發(fā)布,并第一時(shí)間上架亞馬遜云科技,用戶通過(guò)Amazon Bedrock等即可絲滑使用。
作為Anthropic迄今為止最智能的模型,Claude 3.7 Sonnet在編碼和前端Web開發(fā)方面顯著提升,實(shí)現(xiàn)了全面領(lǐng)先。
此外,Claude 3.7 Sonnet的突出優(yōu)勢(shì)是:其是首個(gè)混合推理模型,既能快速響應(yīng)也能進(jìn)行深度思維,能通過(guò)細(xì)致、逐步的推理解決復(fù)雜問(wèn)題。通過(guò)API調(diào)用時(shí),用戶可精準(zhǔn)控制大模型思考時(shí)間,進(jìn)而準(zhǔn)確控制推理成本。一經(jīng)上線,吸引業(yè)內(nèi)廣泛關(guān)注。
亞馬遜云科技CEO Matt Garman在LinkedIn上發(fā)文表示:“Claude 3.7 Sonnet現(xiàn)已在Amazon Bedrock上線,它代表了人工智能推理技術(shù)的一項(xiàng)進(jìn)步。作為Anthropic目前最智能的模型,3.7 Sonnet引入了混合推理功能,既能快速響應(yīng),又能進(jìn)行深入分析,并且可以在這兩種模式之間切換。這意味著它具備非凡的靈活性,無(wú)論是驅(qū)動(dòng)面向客戶的人工智能智能體,還是處理復(fù)雜的工作流程,都能對(duì)速度、性能和成本進(jìn)行控制?!?/p>
首個(gè)混合推理模型Claude Sonnet 3.7,推理成本優(yōu)化能手
如Anthropic強(qiáng)調(diào),Claude 3.7 Sonnet與市面上的其他推理模型不同,它是一款混合推理模型。
“正如人類使用同一個(gè)大腦進(jìn)行快速反應(yīng)和深度思考一樣,我們認(rèn)為推理應(yīng)該是前沿模型的綜合能力,而不是完全獨(dú)立的模型。這種統(tǒng)一的方法也為用戶創(chuàng)造了更無(wú)縫的體驗(yàn)。”
因此,Claude 3.7 Sonnet同時(shí)具備深度推理(深度思維模式,一步一步思考復(fù)雜答案)與快速回復(fù)(標(biāo)準(zhǔn)模式,實(shí)時(shí)生成答案)的能力。API用戶可以對(duì)模型的思考時(shí)間進(jìn)行細(xì)粒度控制。
具體而言,Claude 3.7 Sonnet Claude 3.7 Sonnet既可以當(dāng)作大語(yǔ)言模型使用,也可以當(dāng)作深度推理模型使用:用戶可以選擇什么時(shí)候讓模型快速回答,什么時(shí)候讓它在回答之前思考更長(zhǎng)時(shí)間。
在標(biāo)準(zhǔn)模式下,Claude 3.7Sonnet代表了Claude 3.5 Sonnet的升級(jí)版。在深度思維模式下,它在回答之前進(jìn)行深度思考,這提高了Claude 3.7Sonnet在數(shù)學(xué)、物理、指令遵循、編碼和許多其他任務(wù)上的表現(xiàn)。
與Claude 3.5 Sonnet相比,Claude 3.7Sonnet模型的輸出長(zhǎng)度提升15倍以上。Claude 3.7 Sonnet支持最長(zhǎng)128K token的輸出(64K為普遍可用版本,128K為測(cè)試版)。這一增強(qiáng)能力在需要詳細(xì)內(nèi)容、多個(gè)示例或額外上下文及背景信息時(shí)尤為實(shí)用。若要生成長(zhǎng)輸出,可嘗試要求模型提供詳細(xì)大綱(針對(duì)寫作場(chǎng)景,可指定段落級(jí)大綱細(xì)節(jié)并包含目標(biāo)字?jǐn)?shù)),然后要求響應(yīng)按大綱索引段落并重申字?jǐn)?shù)。
當(dāng)通過(guò)API使用Claude 3.7 Sonnet時(shí),用戶可以精準(zhǔn)控制模型的思考時(shí)間,開發(fā)者可以通過(guò)精準(zhǔn)控制模型在處理查詢時(shí)使用的計(jì)算資源量,API用戶可以告訴Claude思考的數(shù)量不超過(guò) N 個(gè)token,N 的值可以是任何值,但輸出上限不能超過(guò) 128K個(gè)token。而模型能力的表現(xiàn),取決于允許思考的token數(shù)量,Claude 3.7 Sonnet讓開發(fā)者在速度(和成本)與答案質(zhì)量之間進(jìn)行權(quán)衡。
另外值得一提的是,Claude 3.7 Sonnet也是Anthropic最強(qiáng)大的編碼模型,在編碼和前端Web開發(fā)方面顯著提升,實(shí)現(xiàn)了全面領(lǐng)先。
根據(jù)Anthropic的數(shù)據(jù),其標(biāo)準(zhǔn)模式在SWE-bench Verified上的成績(jī)?yōu)?0.3%,達(dá)到行業(yè)領(lǐng)先水平。Claude 3.7 Sonnet在多數(shù)基準(zhǔn)測(cè)試中的表現(xiàn)也優(yōu)于Claude 3.5 Sonnet。這些增強(qiáng)能力使其成為驅(qū)動(dòng)AI智能體和復(fù)雜工作流的理想選擇。
Claude 3.7 Sonnet的增強(qiáng)能力可惠及多個(gè)行業(yè)場(chǎng)景。企業(yè)可創(chuàng)建直接與客戶交互的先進(jìn)AI助手與智能體;在醫(yī)療領(lǐng)域,它能輔助醫(yī)學(xué)影像分析與研究摘要;在金融服務(wù)領(lǐng)域,它解決復(fù)雜金融建模問(wèn)題的能力能帶來(lái)諸多益處。對(duì)于開發(fā)者而言,它可作為編碼助手,審查代碼、解釋技術(shù)概念,并針對(duì)不同語(yǔ)言提出改進(jìn)建議。
上線Amazon Bedrock,助力構(gòu)建更強(qiáng)大的生成式AI應(yīng)用
Anthropic的Claude 3.7 Sonnet基礎(chǔ)模型在發(fā)布的第一時(shí)間就已上線Amazon Bedrock。
Claude 3.7 Sonnet提供兩種模式——標(biāo)準(zhǔn)模式和深度思維模式,可在Amazon Bedrock中切換,用戶可控制思考預(yù)算,幫助用戶在速度、成本和性能之間找到最優(yōu)解。
此外,Claude 3.7 Sonnet也被加入Amazon Q Developer的模型列表中。Amazon Q基于Amazon Bedrock構(gòu)建,開發(fā)者可通過(guò)Amazon Q為特定任務(wù)選擇最合適的模型(例如Claude 3.7 Sonnet),以支持更高級(jí)的編碼工作流,從而加速整個(gè)軟件開發(fā)生命周期的構(gòu)建。
據(jù)亞馬遜云科技生成式AI副總裁Vasi Philomin介紹:"使用 Claude 3.7 Sonnet 的早期用戶反饋,在使用深度思維模式時(shí),該模型在數(shù)學(xué)、物理、競(jìng)賽編程和深入分析方面表現(xiàn)最為出色。再結(jié)合Amazon Bedrock的豐富功能,Claude 3.7 Sonnet將幫助客戶構(gòu)建更強(qiáng)大的生成式AI應(yīng)用。"
下面,附上Amazon Bedrock上使用Claude 3.7 Sonnet的方法:
在Amazon Bedrock控制臺(tái)中請(qǐng)求訪問(wèn)權(quán)限。在導(dǎo)航窗格中,選擇模型訪問(wèn)。然后,修改模型訪問(wèn)以請(qǐng)求訪問(wèn)Claude 3.7 Sonnet。
嘗試Claude 3.7 Sonnet,選擇導(dǎo)航窗格中Playgrounds下的Chat/Text。然后,選擇“選擇模型”,并在“類別”下選擇了“ Anthropic”,在“模型”下選擇“Claude 3.7 Sonnet”。為了啟用深度思維模式,在“配置”下切換“模型推理”(Model reasoning)。即可在右側(cè)文本框輸入需求問(wèn)題進(jìn)行體驗(yàn)。
Claude 3.7 Sonnet還有很強(qiáng)的圖像到文本的視覺能力,上傳了一張使用Amazon Bedrock創(chuàng)建的詳細(xì)建筑平面圖的圖像,就可以收到這份網(wǎng)站計(jì)劃的詳細(xì)分析和合理見解。
- IBM亞太區(qū)總經(jīng)理:AI的開源時(shí)刻可能是其未來(lái)的轉(zhuǎn)折點(diǎn)
- 李想:歡迎拿理想汽車在全國(guó)任何地方和特斯拉FSD一起對(duì)比,我有信心!
- DeepSeek代碼開源第三彈:DeepGEMM代碼庫(kù),V3/R1的訓(xùn)練推理動(dòng)力
- 特斯拉FSD入華“水土不服”?馬斯克:通過(guò)網(wǎng)絡(luò)視頻學(xué)習(xí)中國(guó)路況
- 美光宣布專為下一代 CPU 設(shè)計(jì)的1γ DRAM開始出貨
- 全球AI頂會(huì)AAAI 2025在美開幕 產(chǎn)學(xué)研聯(lián)手的“中國(guó)隊(duì)”表現(xiàn)亮眼
- 2025年港股首個(gè)現(xiàn)象級(jí)IPO來(lái)了
- 混合推理+最強(qiáng)編碼能力大模型Claude Sonnet 3.7上線Amazon Bedrock
- 世界第一,阿里云PolarDB云原生數(shù)據(jù)庫(kù)登頂TPC-C榜單
- 理想首款純電SUV車型i8公布側(cè)面官圖
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。