面對如火如荼的生成式AI大戰(zhàn),全球電商老大亞馬遜、云計算老大亞馬遜云科技又雙叒發(fā)力了。就在12月4日舉辦于美國拉斯維加斯、6萬人現(xiàn)場參會的2024亞馬遜云科技re:Invent全球大會上,亞馬遜CEO Andy Jassy親自出馬,發(fā)布了亞馬遜自研的新一代基礎模型Amazon Nova。
比星巴克的中杯/大杯/超大杯更進一步,Amazon Nova一出手就是“四大杯”:
Amazon Nova Micro:僅限文本對話,主打一個低價格和低延遲;Amazon Nova Lite:低成本的多模態(tài)大模型,處理圖像、視頻和文本輸入的速度極快;Amazon Nova Pro:高性能的多模態(tài)大模型,精度、速度和成本最佳“配方”,可處理廣泛的任務;Amazon Nova Premier:系列中最強多模態(tài)大模型,可處理復雜的推理任務,也可用于蒸餾客戶定制化的模型。在現(xiàn)場,Andy還曬出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等各大權威AI榜單上的分數(shù),雖然不能說是屠榜,不過確實在檢索增強生成(RAG)、函數(shù)調用和智能體應用等關鍵指標處于領先地位。
目前,Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro已全部正式可用,Amazon Nova Premier預計將在2025年第一季度可用。
你以為這就夠了嗎?緊接著,Andy Jassy又發(fā)布了兩個全新模型:用于生成高質量圖像的Amazon Nova Canvas和用于生成高質量視頻的Amazon Nova Reel。
亞馬遜云科技還計劃在2025年第一季度推出“語音到語音”(Speech to Speech)Amazon Nova模型,預計在2025年中旬推出具備“任意到任意”(Any to Any)模態(tài)能力的Amazon Nova模型。
總之,別人家有的模型,我亞馬遜云科技也都有,用Andy Jassy的話來說就是,“萬物皆可生成”。
這是否意味著,接下來亞馬遜云科技將“鼓勵”用戶們都轉用Amazon Nova?當然不是。在這次大會上,Andy Jassy還說了一句意味深長的話:“選擇決定一切!需要用模型的時候,最關鍵的是,有很多可選的自由!”
從2024亞馬遜云科技re:Invent全球大會上的表現(xiàn),老冀認為:亞馬遜給用戶提供的最大價值,恰恰就是選擇的自由。而且,這種選擇的自由不僅僅只限于模型,也不只是AI架構的中間層,而是涵蓋了基礎架構層、中間層、應用層的方方面面。
中間層:一百多個模型一站式服務
在發(fā)布Amazon Nova之后,亞馬遜云科技CEO Matt Garman表示,Amazon Nova將與AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI等多個大模型一起,全部放到Amazon Bedrock當中,供用戶選擇使用。
實際上,亞馬遜云科技自己就是大模型的深度使用者,目前公司內部使用的生成式AI應用超過1000個。亞馬遜云科技深知,用戶要的是能夠解決自己針對性問題的大模型,而不是只有通用能力的、或者只能炫技的大模型。
在這次大會上我們看到,亞馬遜云科技成為首家向用戶提供Luma AI最先進的Luma Ray 2模型(其著名視頻模型的第二代)的云服務提供商。用戶可以通過Amazon Bedrock使用Ray 2,依據文本和圖像高效生成電影級質感的高質量、逼真視頻。
亞馬遜云科技還成為首家提供poolside的malibu和point模型訪問權限的云服務提供商,這兩個模型在代碼生成、測試、文檔編制以及實時代碼補全方面表現(xiàn)出色,能夠幫助工程團隊提高生產力,更快編寫出更優(yōu)質的代碼,并加速產品開發(fā)周期。
Stability AI可謂如今最熱的文生圖大模型開發(fā)商之一。如今,Stability AI旗下最先進的文本轉圖像模型Stable Diffusion 3.5 Large也即將進駐Amazon Bedrock,為媒體、游戲、廣告以及零售領域的客戶創(chuàng)建概念藝術、視覺效果以及詳細的產品圖像。
有了如此多當紅大模型的加入,亞馬遜云科技仍然覺得不夠——雖然Amazon Bedrock中的模型能夠支持眾多任務,但是許多客戶仍希望將新興的專用模型融入到他們的應用程序中,為其獨特的用例如分析財務文檔或生成新型蛋白質等提供支持。
有鑒于此,在2024亞馬遜云科技re:Invent全球大會上,亞馬遜云科技繼續(xù)放出大招,推出Amazon Bedrock Marketplace,直接給用戶一個模型市場。
如今,用戶已經能夠從100多個模型中進行查找與選擇,這些模型可部署在亞馬遜云科技上,并能通過Amazon Bedrock中的統(tǒng)一體驗進行訪問。這100多個模型中,既有Mistral AI的Mistral NeMo Instruct 2407、Technology Innovation Institute的Falcon RW 1B以及NVIDIA NIM微服務等熱門模型,還有用于金融行業(yè)的Writer的Palmyra-Fin、用于翻譯的Upstage的Solar Pro、Camb.ai的文本轉音頻MARS6以及用于生物學的EvolutionaryScale的ESM3生成模型等眾多專業(yè)模型。無論你想要什么模型,直接到Amazon Bedrock Marketplace上面來找就對了。
實際上,一些用戶已經享受到了這種一站式服務的好處。在這次大會上,Zendesk這家全球服務軟件公司,就在Amazon Bedrock中訪問用于翻譯的Widn.AI等專用模型,通過電子郵件、聊天、電話以及社交媒體對客戶服務請求進行個性化和本地化處理,從而為客服人員提供其所需的數(shù)據,比如客戶母語表達中的情緒或意圖等,最終提升客戶服務體驗。
為了讓大家用好生成式AI,亞馬遜云科技可謂操碎了心。這次大會上,Amazon Bedrock還發(fā)布了一系列的新技術和新功能:
全新的提示詞緩存功能和Amazon Bedrock Intelligent Prompt Routing提示詞智能路由功能,幫助客戶更輕松、更經濟地擴展推理業(yè)務。Amazon Bedrock Knowledge Bases現(xiàn)已提供對結構化數(shù)據和GraphRAG的支持,進一步拓展了客戶利用自身數(shù)據提供定制化生成式AI體驗的途徑。Amazon Bedrock Data Automation功能能夠在無需編寫代碼的情況下,自動將非結構化、多模態(tài)的數(shù)據轉換為結構化數(shù)據,以幫助客戶將更多數(shù)據應用于生成式AI及分析工作中。·模型蒸餾:創(chuàng)建更快、更具成本效益的模型,經過蒸餾的模型速度最高提升500%,成本最高降低75%。Automated Reasoning checks:防止因幻覺產生的事實性錯誤,提供糾正建議。Multi-agent collaboration:構建、部署和編排多個agent,協(xié)同處理復雜的多步驟任務。亞馬遜云科技人工智能和數(shù)據部門副總裁Swami Sivasubramanian博士表示:“通過此次新發(fā)布的一系列新功能,我們將幫助客戶開發(fā)出更智能的AI應用程序,讓他們?yōu)槠渥罱K用戶創(chuàng)造更大價值?!?/p>
既提供了豐富的模型,又給了好用的功能,難怪有數(shù)以萬計的客戶通過Amazon Bedrock運行其生成式AI應用程序。僅僅在過去一年,使用Amazon Bedrock的客戶量就增長了4.7倍。如今,Adobe、Argo Labs、寶馬集團、Octus、Symbeo、Tenovos和Zendesk等公司,都已經采用了Amazon Bedrock的最新技術。
基礎設施層:三大領域一個都不能少
我們都知道,生成式AI要想獲得更廣泛的應用,基礎設施肯定少不了。從2024亞馬遜云科技re:Invent全球大會上,老冀發(fā)現(xiàn)亞馬遜云科技在這方面同樣不含糊,在全面覆蓋基礎設施的計算、存儲、數(shù)據庫三大領域,為用戶提供全家桶的產品和服務。
先說計算。在這次大會上,亞馬遜云科技發(fā)布了以自研芯片Trainium搭建的AI算力。其中,Amazon Trainium2 Server采用16顆Trainium2 芯片,F(xiàn)P8算力達20.8PFLOPS;Amazon Trainium2 UltraServer則將4個Trn2實例通過NeuronLink互連,搭載64顆Trainium2 芯片,F(xiàn)P8算力達83.2PFLOPS。
在AI算力的超級競賽中,亞馬遜云科技正在加速創(chuàng)新。在本次大會上,亞馬遜云科技還宣布將與AI大模型的“當紅炸子雞”Anthropic合作構建一個名為“Project Rainier”的新集群,它將配備數(shù)十萬個亞馬遜云科技最新的AI訓練芯片Trainium 2,建成后將比Anthropic當前最強大模型的集群大五倍,成為全球最大的AI超級計算機之一,加入“十萬卡集群”的競爭。
亞馬遜云科技在計算上的強大實力,已經吸引了很多重量級客戶的關注,蘋果公司AI和機器學習高級總監(jiān)Benoit Dupin也專程趕到2024亞馬遜云科技re:Invent全球大會站臺。他表示,蘋果與亞馬遜云科技在AI和機器學習生命周期的“幾乎所有階段”都展開了合作。如今,蘋果正在對Trainium 2芯片進行初步測試,以幫助訓練正在逐漸提供全面服務的Apple Intelligence。
此外,亞馬遜云科技還宣布將在2025年推出更先進的自研Trainium3芯片,它將采用3nm先進工藝,性能是上一代的2倍,功耗則只有上一代的40%。
有了自研的Trainium系列芯片,是不是就不再需要英偉達的GPU了?當然不是。要知道,亞馬遜云科技始終從用戶的角度來考慮這個問題。Matt Garman表示:“今天,在GPU方面真的只有一個選擇,那就是英偉達。我們認為客戶會欣賞有多個選擇。希望Trainium能夠開辟出一個良好的細分市場,我認為它將成為部分工作負載的極佳選擇,當然不是所有工作負載。”因此,在這次大會上,Matt Garman同樣發(fā)布了EC2 P6實例,它基于英偉達最先進的Blackwell架構GPU,是上一代性能的2.5倍。
用戶希望用什么架構的計算,就給它好了;至于是自研還是合作伙伴的,并不那么重要。
在存儲上,亞馬遜云科技同樣也是用戶邏輯,在這次大會上發(fā)布了Amazon S3 Tables,將Apache Iceberg表的查詢性能提升3倍,每秒事務處理量提升10倍,還發(fā)布了Amazon S3 Metadata,提供S3中管理元數(shù)據最簡單快捷的方式。
用戶更大的驚喜,則來自于數(shù)據庫。我們知道,在分布式數(shù)據庫系統(tǒng)中,存在一個“CAP魔咒”——跨區(qū)域一致(Consistency)、高可用性(Availability )、低延遲(Partition Tolerance)這三大要求,一般只能滿足兩個。
而在這次大會上發(fā)布的新型無服務器分布式數(shù)據庫Amazon Aurora DSQL卻告訴用戶:三個要求都可以有!它結合了傳統(tǒng)關系數(shù)據庫的強一致性和NoSQL數(shù)據庫的分布式擴展能力,提供了以下幾大關鍵優(yōu)勢:
跨區(qū)域強一致性和低延遲:采用了全新的架構,使其能夠在多個地理區(qū)域中同時運行,而保持強一致性。無限擴展:能夠處理數(shù)TB到數(shù)PB級的數(shù)據集,適用于任何規(guī)模的企業(yè)。超高可用性:提供99.999%的可用性,這對于許多需要高可用性和無縫運行的企業(yè)級應用至關重要。性能優(yōu)越:其跨區(qū)域的讀寫操作比Spanner快了四倍。從2024亞馬遜云科技re:Invent全球大會上,老冀看到了亞馬遜云科技對用戶的寵愛模式:說吧,你想要什么?我全都給你!
應用層:軟件開發(fā)流程一步步搞定
作為一家平臺級公司,亞馬遜云科技從來都非常重視開發(fā)者的重要作用。在2024亞馬遜云科技re:Invent全球大會上, Matt Garman深情地回顧,今年6月他就任CEO之后的第一件頭等大事,就是與亞馬遜云科技Heroes交流,聽取這些技術專家們的意見。此時,臺下傳來了一陣陣歡呼聲。
這一次,為了讓開發(fā)者們把AI更好地用起來,亞馬遜云科技針對軟件開發(fā)功能強大的生成式AI助手Amazon Q Developer繼續(xù)發(fā)力,推出一系列創(chuàng)新增強功能,包括能夠實現(xiàn)自動執(zhí)行單元測試、文檔生成和代碼審查流程的智能體,可大幅提升開發(fā)人員在整個軟件開發(fā)流程中的效率;以及能夠在極短時間內幫助用戶解決運營難題的能力。
編寫單元測試對于保障代碼按預期運行并及早發(fā)現(xiàn)潛在問題至關重要。Amazon Q Developer能夠自主識別并生成單元測試,通過全面的測試覆蓋,以更少時間幫助開發(fā)人員及早發(fā)現(xiàn)問題并顯著提升代碼的可靠性。
開發(fā)人員在代碼編寫和測試階段之后,通常需要編寫文檔來闡述代碼的功能與運行機制。如今,開發(fā)人員可以使用 Amazon Q Developer 生成和維護其所有項目文檔,確保他們始終掌握項目的最新信息;同時讓他們能夠快速上手新代碼,為團隊成員抓取關鍵的項目細節(jié),并提升舊文檔的可讀性。
代碼正式部署之前,往往需要另一位開發(fā)人員對代碼進行細致檢查,確保其符合企業(yè)要求的質量、風格與安全標準。Amazon Q Developer具備自動檢查代碼質量、查重和識別安全漏洞的能力,從而簡化代碼審查流程。它能夠迅速向開發(fā)人員提供反饋,讓開發(fā)人員在當前工作流程下,加速部署高質量的代碼。
當應用程序編寫完畢并投入生產環(huán)境后,運營團隊便肩負起監(jiān)控其運行狀況、迭代優(yōu)化及解決問題的重任,以確保應用性能達到預期標準。基于亞馬遜云科技豐富的運營經驗及對企業(yè)和組織的云資源關系的深入理解,Amazon Q Developer現(xiàn)在可以幫助不同經驗水平的用戶,以更短的時間調查并解決其在亞馬遜云科技環(huán)境中的運營問題,確保企業(yè)應用程序的正常運行。
正如亞馬遜云科技下一代開發(fā)者體驗副總裁Deepak Singh所言,亞馬遜云科技的客戶正廣泛通過Amazon Q Developer,在軟件開發(fā)生命周期各階段提升開發(fā)人員的生產力。如今,埃森哲、Boomi、BT Group、Cedar Gate Technologies、德勤、FINRA、Genesys、Netsmart、培生、SmugMug以及Tata Consultancy Services等眾多企業(yè),都正在使用Amazon Q Developer來提升開發(fā)人員的工作效率,并快速解決運營挑戰(zhàn)。
看完2024亞馬遜云科技re:Invent全球大會的直播之后,老冀突然發(fā)現(xiàn),即使是在日新月異的生成式AI領域,亞馬遜云科技仍然能夠憑借自身多年的積累,為企業(yè)客戶提供豐富多樣的全家桶產品和服務,幫助企業(yè)把AI用起來,用成功。這樣的亞馬遜云科技,必然也將成為企業(yè)客戶應用生成式AI的首選合作伙伴。
*前述特定亞馬遜云科技生成式人工智能相關的服務僅在亞馬遜云科技海外區(qū)域可用,亞馬遜云科技中國僅為幫助您發(fā)展海外業(yè)務和/或了解行業(yè)前沿技術選擇推薦該服務。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 算力荒緩解,自主化智算還有必要嗎?
- 波司登千元鵝絨褲僅3克鵝絨,警惕被“國貨品牌”割韭菜
- 中國電車進入10萬級時代,2025年決生死,但日本車先頂不住了
- 中國存儲芯片大舉圍剿美日韓芯片,外媒確認在技術上進一步突破
- 谷歌成為手機市場的殺手,國產手機或被迫擁護國產操作系統(tǒng)
- 折疊屏2024的新東西、好東西、舊東西
- 董明珠與小米的二次戰(zhàn)爭
- 芯片不賣中國,美芯無處賣了,本來不要的市場偷偷地賣,后悔莫及
- 僅售999元 月底開售 閃極打響AI眼鏡量產發(fā)令槍
- 蘿卜快跑走紅、滴滴加碼,中國Robotaxi大戰(zhàn)升級
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。