科技云報道原創(chuàng)。
隨著以大模型為代表的AIGC時代拉開序幕,算力需求持續(xù)爆發(fā),AI與邊緣深度融合已是大勢所趨,越來越多的企業(yè)開始積極布局GenAI。
GenAI技術(shù)的商用化部署和應(yīng)用成為企業(yè)競逐的新陣地,勾勒出大模型從“技術(shù)力”轉(zhuǎn)向“生產(chǎn)力”的新生態(tài)。
算力就是生產(chǎn)力,更豐富的算力資源成為人工智能競爭的核心基石。
IDC預(yù)計,全球AI計算市場規(guī)模將從2022年的195億美元增長到2026年的346.6億美元,其中GenAI計算市場規(guī)模將從2022年的8.2億美元增長到2026年的109.9億美元。
GenAI計算占整體AI計算市場的比例將從4.2%增長到31.7%。
AI算力瓶頸下邊緣計算崛起
隨著AI大模型爆發(fā),大模型迭代和訓練所需的算力呈指數(shù)級增長。同時,單個AI超算規(guī)模也受到功耗、土地、散熱等因素制約,算力供給與需求的缺口持續(xù)放大。
此前,ChatGPT官網(wǎng)一度停止Plus付費項目的購買,GPT-4推出之后也已多次下調(diào)付費用戶訪問限制,原因是訪問量激增超出了服務(wù)器的承受能力。
隨著這場GenAI熱潮逐步擴張,算力短缺已成為行業(yè)面臨的共同挑戰(zhàn)。
如果說傳統(tǒng)算力是AI大模型的筋骨,那么邊緣算力就是遍布全身的神經(jīng)系統(tǒng)。
英偉達指出,為了有效運用算力達成AI應(yīng)用目標,大規(guī)模數(shù)據(jù)中心勢必要增加資本支出以擴大云端運算效能,同時也將帶動邊緣設(shè)備的銷售。
在AI向?qū)嶋H場景落地的過程中,邊緣算力的重要性將加速凸顯。未來的AI運算將呈現(xiàn)出“訓練與迭代在云端、推理與內(nèi)容生產(chǎn)梯度分布(云側(cè)+霧側(cè)+邊緣側(cè))”的格局變化,邊緣算力有望成為AI算力的重要組成部分。
相較于傳統(tǒng)云端,邊緣計算作為一種分布式計算架構(gòu),具有低延遲、高安全性、高可靠性、保護用戶隱私等優(yōu)勢,其在實時決策在自動駕駛、醫(yī)療保健、金融、制造等各個領(lǐng)域都至關(guān)重要。
從效率方面看,邊緣計算使GenAI模型能夠在邊緣處理數(shù)據(jù),從而顯著減少延遲并實現(xiàn)更快洞察。這意味著可以實時做出關(guān)鍵決策,從而提高運營效率、增強客戶體驗和更好的整體業(yè)務(wù)成果。
其次,通過利用邊緣計算,企業(yè)可以在邊緣設(shè)備網(wǎng)絡(luò)上分配計算負載,從而優(yōu)化資源利用率并有效擴展。這種方法最大限度地減少了集中式云基礎(chǔ)設(shè)施的壓力并優(yōu)化了帶寬使用,從而節(jié)省了成本并提高了性能。
第三,通過邊緣計算,GenAI模型可以直接在邊緣設(shè)備或本地服務(wù)器上運行,最大限度地減少將敏感數(shù)據(jù)傳輸?shù)郊惺皆品?wù)器的需要。
通過使數(shù)據(jù)更接近其來源,公司可以顯著降低與數(shù)據(jù)泄露、未經(jīng)授權(quán)的訪問和合規(guī)性問題相關(guān)的風險。
從關(guān)系上看,邊緣計算并不尋求取代云計算,相反是對其重要的補充。邊緣計算和云之間的協(xié)作可實現(xiàn)混合架構(gòu),最大限度地發(fā)揮兩種范式的優(yōu)勢。
GenAI模型可以利用云的可擴展性和存儲功能,同時受益于邊緣設(shè)備的低延遲和本地處理能力。這種融合確保了GenAI采用的多功能且適應(yīng)性強的基礎(chǔ)設(shè)施。
邊緣計算重構(gòu)生產(chǎn)力邊界
隨著企業(yè)開始越來越多地擁抱AI,邊緣計算和AI的融合擁有改變?nèi)蛐袠I(yè)的巨大潛力。通過利用本地化處理、實時洞察和優(yōu)化的資源利用,可以充分釋放AI的全部潛力,同時保護敏感數(shù)據(jù)并推動組織進入AI時代。
對此,全球科技巨頭開始將目光越來越多地轉(zhuǎn)向這一領(lǐng)域。
比如,華為、高通均推出邊緣AI產(chǎn)品。去年3月,高通中國在安卓手機上首次演示了模型參數(shù)超過10億的Stable Diffusion;華為于去年7月發(fā)布智慧搜圖功能,該功能通過對模型進行小型化處理。
華為與高通一定程度上驗證了高性能邊緣AI的可行性,并且表明通過模型壓縮+聯(lián)網(wǎng)智能的方式有望在邊緣端實現(xiàn)AI大模型的體驗。
此外,英偉達黃仁勛也表示,人工智能的下一個浪潮將是具身智能。具身智能能夠在物理世界中進行操作和感知,輸出各種機械動作。
具身智能將邊緣算力需求提升到了一個新高度,具身智能的“大腦”不僅要處理視覺信息、生成提示詞,更要負責輸出指令來執(zhí)行機械動作。在移動芯片無法滿足所需算力的場景下,邊緣IDC將是算力的有效補充措施。
AIPC、AI手機、具身智能、自動駕駛等AI新應(yīng)用的興起,無疑為邊緣云市場帶來了巨大影響,這種影響既體現(xiàn)在市場規(guī)模的擴張,也反映在技術(shù)要求的提升方面。
AIPC、AI手機作為AI普惠的終端,其本質(zhì)在于云端與本地端的混合協(xié)作,通過利用云端的大數(shù)據(jù)處理能力來豐富本地設(shè)備的使用場景。
這種混合協(xié)作模式對云計算的性能和穩(wěn)定性提出了更高的要求,同時也為云計算帶來了更多的數(shù)據(jù)處理和存儲需求。
邊緣云作為離用戶最近的數(shù)據(jù)處理中心,能夠迅速響應(yīng)這些需求,提供低延遲、高帶寬的數(shù)據(jù)處理服務(wù)。
具身智能和自動駕駛的發(fā)展,更是推動了邊緣云市場的快速增長。智能機器人需要在真實的物理環(huán)境下執(zhí)行各種任務(wù),這就需要邊緣云提供強大的實時計算能力和數(shù)據(jù)交互能力。
不僅如此,邊緣AI應(yīng)用場景仍在持續(xù)豐富。邊緣云服務(wù)提供商Zenlayer技術(shù)專家表示,對于實時性要求極高的應(yīng)用,如自動駕駛和智能制造,邊緣計算能夠提供毫秒級的低延遲響應(yīng)。
通過在車輛或生產(chǎn)線上部署邊緣計算節(jié)點,客戶可以實時處理傳感器數(shù)據(jù),進行決策和控制,從而確保安全和高效的生產(chǎn)運行。
其次,對于需要處理大量數(shù)據(jù)的應(yīng)用,如智能視頻監(jiān)控和智慧城市,邊緣計算能夠減輕中心云的壓力,實現(xiàn)數(shù)據(jù)的本地化處理。
通過在攝像頭或傳感器附近部署邊緣計算設(shè)備,可以對視頻流進行實時分析,識別異常事件,并及時進行響應(yīng)。
此外,邊緣計算還能夠解決大模型在數(shù)據(jù)傳輸和隱私保護方面的問題。通過將模型推理過程放在邊緣端進行,可以減少數(shù)據(jù)傳輸量,降低網(wǎng)絡(luò)帶寬要求,同時保護用戶數(shù)據(jù)的隱私和安全。
事實上,目前已有企業(yè)開始探索邊緣計算在AI大模型中的應(yīng)用。
據(jù)Zenlayer技術(shù)專家介紹,某家專注于大模型技術(shù)的初創(chuàng)企業(yè)基于Zenlayer提供的一整套SDN解決方案,通過智能路由和數(shù)據(jù)傳輸協(xié)議優(yōu)化等手段,搭建了一條高效穩(wěn)定的數(shù)據(jù)傳輸通道,確保大模型在訓練、推理等關(guān)鍵環(huán)節(jié)都能獲得及時、準確的數(shù)據(jù)支持,從而顯著提升了模型的應(yīng)用效果和用戶體驗。
此外,還有對于一些AI大模型客戶希望將算力資源部署至海外,Zenlayer針對這類需求,提供了算力托管或算力租賃服務(wù),將計算資源部署在靠近用戶的邊緣數(shù)據(jù)中心,使大模型推理能夠在本地進行,極大地降低了數(shù)據(jù)傳輸?shù)难舆t和成本。
同時,Zenlayer還為客戶提供了一系列數(shù)據(jù)本地存儲和傳輸方案,在滿足各個國家對數(shù)據(jù)合規(guī)要求的同時,盡量優(yōu)化業(yè)務(wù)交互體驗。
結(jié)語
如果把視線放得更長遠,在AI等眾多顛覆性技術(shù)的背后,總離不開邊緣計算的存在。當全球都沸騰在AIGC的風潮里,邊緣云服務(wù)商正通過邊緣端和云邊的融合協(xié)同,滿足更多元的AI應(yīng)用場景,以更自如的算力,讓AI技術(shù)更自如地普惠。
【關(guān)于科技云報道】
專注于原創(chuàng)的企業(yè)級內(nèi)容行家——科技云報道。成立于2015年,是前沿企業(yè)級IT領(lǐng)域Top10媒體。獲工信部權(quán)威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創(chuàng)報道云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。
免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 算力荒緩解,自主化智算還有必要嗎?
- 波司登千元鵝絨褲僅3克鵝絨,警惕被“國貨品牌”割韭菜
- 中國電車進入10萬級時代,2025年決生死,但日本車先頂不住了
- 中國存儲芯片大舉圍剿美日韓芯片,外媒確認在技術(shù)上進一步突破
- 谷歌成為手機市場的殺手,國產(chǎn)手機或被迫擁護國產(chǎn)操作系統(tǒng)
- 折疊屏2024的新東西、好東西、舊東西
- 董明珠與小米的二次戰(zhàn)爭
- 芯片不賣中國,美芯無處賣了,本來不要的市場偷偷地賣,后悔莫及
- 僅售999元 月底開售 閃極打響AI眼鏡量產(chǎn)發(fā)令槍
- 蘿卜快跑走紅、滴滴加碼,中國Robotaxi大戰(zhàn)升級
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。