科技云報(bào)道原創(chuàng)。
生成式AI作為當(dāng)前人工智能的前沿領(lǐng)域,全球多家科技企業(yè)都在加大生成式AI的研發(fā)投入力度。
隨著技術(shù)、產(chǎn)品及應(yīng)用等方面不斷推出重要成果,如今有更多的行業(yè)用戶在思考該如何將生成式AI應(yīng)用落地。
亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建表示,當(dāng)我們談?wù)撋墒紸I時(shí),大多數(shù)人都在談?wù)摶A(chǔ)模型,而整個(gè)生成式AI應(yīng)用就像是浮在海面的冰山,露在海面上方能被大多數(shù)人看到的冰山一角就像是基礎(chǔ)模型,而在冰川的底部,同樣需要大量的基礎(chǔ)模型以外的服務(wù)來支撐,如加速芯片、數(shù)據(jù)庫、數(shù)據(jù)分析、數(shù)據(jù)安全服務(wù)等等。
那么,想要構(gòu)建一個(gè)成功的生成式AI應(yīng)用,需要哪些基礎(chǔ)設(shè)施助力?業(yè)界是否有一些最佳實(shí)踐可以參考呢?
生成式AI應(yīng)用構(gòu)建的關(guān)鍵 高性價(jià)比的基礎(chǔ)設(shè)施
都說算力、算法和數(shù)據(jù)是人工智能發(fā)展的三要素,想要讓這些要素更好地與生成式AI應(yīng)用匹配,高性價(jià)比的基礎(chǔ)設(shè)施必不可少。
AI高性能芯片為生成式AI訓(xùn)練提供算力支撐人工智能的發(fā)展從深度學(xué)習(xí)時(shí)代進(jìn)入到大模型時(shí)代,大規(guī)模預(yù)訓(xùn)練模型的參數(shù)量呈現(xiàn)指數(shù)級(jí)上升,需要高性能算力的支撐。
目前,大規(guī)模預(yù)訓(xùn)練模型訓(xùn)練算力是以往的10到100倍,當(dāng)前主流生成式AI模型的訓(xùn)練廣泛使用到英偉達(dá)Tensor Core GPU芯片,如微軟斥資數(shù)億美元購買數(shù)萬顆英偉達(dá)A100芯片以幫助Open AI打造ChatGPT。
AI計(jì)算集群為生成式AI模型訓(xùn)練降低成本AI計(jì)算集群能夠提供大規(guī)模算力、持續(xù)提高算力資源利用率、提升數(shù)據(jù)存儲(chǔ)和處理能力,進(jìn)一步降低模型訓(xùn)練門檻和成本,推動(dòng)生成式AI模型的落地進(jìn)程。
當(dāng)前較為典型的AI計(jì)算集群,例如基于英偉達(dá)最新GPU芯片H100 Tensor Core的Amazon EC2 P5實(shí)例,與上一代相比速度快6倍,訓(xùn)練成本節(jié)省40%;
基于亞馬遜云科技自研的機(jī)器學(xué)習(xí)推理芯片Amazon Inferentia2推出的Amazon EC2 Inf2實(shí)例,與其他類似的EC2實(shí)例相比性價(jià)比高40%;
基于自研機(jī)器學(xué)習(xí)訓(xùn)練芯片Amazon Trainium推出的Amazon EC2 Trn1實(shí)例,與同類實(shí)例相比訓(xùn)練成本節(jié)省高達(dá)50%。
這也是為什么有越來越多的客戶,比如Airbnb、OPPO、Sprinklr 和 Autodesk等,會(huì)選擇使用亞馬遜云科技的自研芯片來承載他們的生成式AI應(yīng)用。
基礎(chǔ)模型服務(wù)為構(gòu)建生成式AI提升效率生成式AI的核心是利用機(jī)器學(xué)習(xí)領(lǐng)域的基礎(chǔ)模型驅(qū)動(dòng)的,從RNN、CNN到VAE、GAN,每種模型都有其獨(dú)特的優(yōu)點(diǎn)和應(yīng)用領(lǐng)域,這些模型在很大程度上決定了AI系統(tǒng)的表現(xiàn)。
然而,基礎(chǔ)模型的發(fā)展和迭代速度正超越以外任何一項(xiàng)技術(shù),基本以月甚至天為單位持續(xù)迭代。
在眾多的基礎(chǔ)模型中,應(yīng)該如何便捷安全的選擇最適合自己業(yè)務(wù)場(chǎng)景的基礎(chǔ)模型,是每一家企業(yè)在構(gòu)建生成式AI應(yīng)用時(shí)面臨的挑戰(zhàn)。
事實(shí)上,借助專門構(gòu)建的生成式AI工具和基礎(chǔ)設(shè)施,可以幫助企業(yè)快速構(gòu)建高性價(jià)比的生成式AI應(yīng)用。
例如,亞馬遜云科技Amazon Bedrock是一項(xiàng)無服務(wù)器服務(wù),提供了廣泛的模型選擇、數(shù)據(jù)隱私,并且能夠自定義模型,無需管理任何基礎(chǔ)設(shè)施。
該服務(wù)提供的基礎(chǔ)模型來自Meta, Anthropic, Stability AI, AI21 Labs, Cohere等第三方領(lǐng)先提供商以及自身的Amazon Titan模型等,近期還加入了Meta的下一代開源大模型Llama2以及Anthropic的Claude2等熱門基礎(chǔ)模型。
同時(shí),Amazon Bedrock與Amazon SageMaker Jumpstart結(jié)合,用戶可以從Amazon SageMaker Jumpstart中選擇開源的基礎(chǔ)模型,然后根據(jù)自身需求可以選擇全量微調(diào),輕量微調(diào)等不同方式,進(jìn)一步確定微調(diào)框架,利用分布式訓(xùn)練實(shí)現(xiàn)微調(diào),從而更好的評(píng)估微調(diào)效果。
云原生服務(wù)加速生成式AI應(yīng)用構(gòu)建人工智能預(yù)訓(xùn)練模型的開發(fā)對(duì)于云服務(wù)有較大需求,AI云服務(wù)可以提供人工智能開發(fā)模塊,通過多元化的服務(wù)模式,降低開發(fā)者的開發(fā)成本和產(chǎn)品開發(fā)周期,為模型開發(fā)提供AI賦能。
尤其是借助云原生服務(wù),可以加速AI應(yīng)用構(gòu)建,助力業(yè)務(wù)敏捷創(chuàng)新。
比如,以微服務(wù)化和事件驅(qū)動(dòng)架構(gòu)為核心的設(shè)計(jì)框架,松耦合的去處理每個(gè)功能模塊之間的互相依賴;Serverless First能夠簡(jiǎn)化運(yùn)維、提升效率;在DevOps、基礎(chǔ)設(shè)施即服務(wù)、自動(dòng)化等現(xiàn)代應(yīng)用治理理念持續(xù)投入,可以促進(jìn)企業(yè)內(nèi)部的應(yīng)用資產(chǎn)與實(shí)踐的分享,構(gòu)建高效敏捷的構(gòu)建者文化等等。
數(shù)據(jù)服務(wù)為生成式AI打造基座數(shù)據(jù)作為生成式AI的關(guān)鍵,也將推動(dòng)生成式AI的廣泛應(yīng)用,對(duì)于所有的組織企業(yè)來說都十分重要。
首先,面向生成式AI構(gòu)建強(qiáng)大的數(shù)據(jù)“基座”,需要一套全面的服務(wù),以便能夠存儲(chǔ)用于構(gòu)建和微調(diào)模型的各種類型的數(shù)據(jù);
其次,還需要服務(wù)間的集成,以打破數(shù)據(jù)孤島,確保能夠隨時(shí)訪問所有數(shù)據(jù);
最后,還需要在構(gòu)建生成式AI應(yīng)用程序的整個(gè)生命周期中,確保數(shù)據(jù)安全并對(duì)其進(jìn)行管理。
以亞馬遜云科技為例,針對(duì)生成式AI領(lǐng)域的用戶個(gè)人信息、會(huì)話信息管理、私域知識(shí)庫等應(yīng)用場(chǎng)景都提供了專門構(gòu)建的數(shù)據(jù)庫。
在數(shù)據(jù)集成方面,亞馬遜云科技已經(jīng)在Amazon S3、Amazon Aurora、Amazon Redshift、Amazon SageMaker、Amazon EMR、Amazon Athena、Amazon Kinesis等各項(xiàng)服務(wù)之間,實(shí)現(xiàn)了深度的數(shù)據(jù)集成,幫助企業(yè)執(zhí)行分析和機(jī)器學(xué)習(xí),且無需移動(dòng)數(shù)據(jù)。
在數(shù)據(jù)治理方面,亞馬遜云科技Amazon DataZone讓客戶能夠跨組織邊界發(fā)現(xiàn)、訪問、共享和治理大規(guī)模數(shù)據(jù),并減少企業(yè)內(nèi)部成員訪問數(shù)據(jù)和使用分析工具時(shí)繁重的工作量。
構(gòu)建生成式AI應(yīng)用的行業(yè)實(shí)踐
目前,由生成式AI引導(dǎo)的企業(yè)變革序幕全面展開,以多元應(yīng)用不斷創(chuàng)新AI應(yīng)用范式,并將實(shí)踐成果逐步延伸至智慧教育、智能制造、醫(yī)療等領(lǐng)域,真正成為人們生產(chǎn)生活的得力助手。
其中,在行業(yè)類應(yīng)用場(chǎng)景中,AI助手類應(yīng)用得到了廣泛運(yùn)用,比如在協(xié)同辦公賽道就掀起了新風(fēng)口:
釘釘接入千問大模型,用戶可以喚起10余項(xiàng)AI能力如:自動(dòng)整理群聊要點(diǎn)、生成待辦、預(yù)約日程、寫文案、生成海報(bào)、一鍵生成討論要點(diǎn)等。
飛書宣布推出智能助手“My AI”,功能包括匯總會(huì)議紀(jì)要、創(chuàng)建報(bào)告、優(yōu)化和續(xù)寫文字內(nèi)容等功能。
金山辦公推出“WPS AI”,支持內(nèi)容生成、公式生成、制作PPT、掃描識(shí)別并分析文件等功能。
而在金融、醫(yī)療、工業(yè)等領(lǐng)域,最具前景的應(yīng)用則來自于數(shù)據(jù)挖掘和知識(shí)洞察(Insight)類工具。
但無論是哪種形式的生成式AI的應(yīng)用落地,背后都離不開強(qiáng)大的基礎(chǔ)設(shè)施作為支撐。
金山辦公軟件股份有限公司的 AI 研發(fā)總監(jiān)劉強(qiáng)表示,今年起WPS開始將大語言模型的能力全面引入產(chǎn)品,致力于開發(fā)新一代辦公軟件。
而在構(gòu)建生成式AI應(yīng)用的過程中,基礎(chǔ)模型性能有限,數(shù)據(jù)隱私與安全難以保障,高額管理成本等現(xiàn)實(shí)情況成為了擺在金山辦公面前的重重障礙。
亞馬遜云科技Amazon Bedrock中支持的領(lǐng)先大語言模型,在多個(gè)文字處理場(chǎng)景中符合金山辦公的需求。
除多種模型選擇外,Amazon Bedrock還在數(shù)據(jù)安全層面給金山辦公提供了充分的支持,極大地提高了金山辦公的內(nèi)部開發(fā)效率,助力金山辦公進(jìn)一步革新辦公體驗(yàn)。
西門子中國也借助了一系列云基礎(chǔ)設(shè)施、大數(shù)據(jù)、機(jī)器學(xué)習(xí)等技術(shù),來構(gòu)建生成式AI應(yīng)用。
據(jù)西門子中國大禹團(tuán)隊(duì)介紹,長(zhǎng)期以來企業(yè)內(nèi)部資源的檢索和調(diào)用都存在結(jié)構(gòu)散亂、檢索速度慢、交互不便等問題。因此,大禹團(tuán)隊(duì)決定將大數(shù)據(jù)庫和生成式 AI 應(yīng)用于一個(gè)全新的“智能知識(shí)庫”,從根本上提升知識(shí)庫的可用性。
在亞馬遜云的技術(shù)支持下,西門子中國大禹團(tuán)隊(duì)通過一個(gè)智能知識(shí)庫暨智能會(huì)話機(jī)器人的解決方案,三個(gè)月時(shí)間就上線了生成式AI對(duì)話機(jī)器人“小禹”,實(shí)現(xiàn)了快速、精準(zhǔn)的查詢和回復(fù)。
在整個(gè)解決方案中,包括預(yù)訓(xùn)練大語言模型,Amazon OpenSearch Service的向量數(shù)據(jù)服務(wù),以及相關(guān)系統(tǒng)集成等,這些核心關(guān)鍵能力讓解決方案指南能實(shí)現(xiàn)目標(biāo)知識(shí)庫約80%功能,西門子中國根據(jù)企業(yè)內(nèi)部需求再做20%定制化開發(fā),最終形成完整的解決方案。
同時(shí),Amazon OpenSearch Service的無服務(wù)器特性,讓開發(fā)人員不需要管理集群或擔(dān)心生產(chǎn)規(guī)模,可以快速推動(dòng)部署。
基于Amazon SageMaker上提供的豐富的模型開發(fā)和訓(xùn)練工具,也保證了開發(fā)人員可以在云端輕松實(shí)現(xiàn)大語言模型的調(diào)優(yōu)以及測(cè)試更多不同類型的開源模型。
結(jié)語
生成式AI正在成為企業(yè)新一輪業(yè)務(wù)創(chuàng)新的重要工具,成為下一代的生產(chǎn)力工具。
總體來看,高性價(jià)比的云基礎(chǔ)設(shè)施技術(shù)如同一艘航母,能夠?yàn)槠髽I(yè)提供堅(jiān)實(shí)的底座,讓企業(yè)擺脫基礎(chǔ)設(shè)施的束縛,更好、更高效地專注于創(chuàng)新。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 僅售999元 月底開售 閃極打響AI眼鏡量產(chǎn)發(fā)令槍
- 蘿卜快跑走紅、滴滴加碼,中國Robotaxi大戰(zhàn)升級(jí)
- 雷軍無暇顧及董明珠
- 不僅漲價(jià),美國芯片還得求著要,臺(tái)積電技術(shù)遙遙領(lǐng)先有底氣!
- 掃地機(jī)新技術(shù)看追覓
- 特朗普示好,最高法介入,TikTok賣家極限生死局
- 釋放數(shù)字金融向新力 奇富科技金融AI大模型成果落地上海金融科技國際論壇特展周活動(dòng)
- 劉興亮|酒局十誡
- 未來屬于會(huì)用AI的企業(yè)!自己做的免費(fèi)智慧發(fā)票助手,簡(jiǎn)單又強(qiáng)大
- 一觸“伙伴+華為”體系,傳媒行業(yè)點(diǎn)亮數(shù)智之光
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。