人工智能與邊緣計(jì)算的融合承諾為許多行業(yè)帶來變革。模型量化的快速創(chuàng)新在這方面發(fā)揮著關(guān)鍵作用,模型量化是一種通過提高可移植性和減小模型大小來加快計(jì)算速度的技術(shù)。
模型量化彌補(bǔ)了邊緣設(shè)備的計(jì)算限制與部署高精度模型的需求之間的差距,以實(shí)現(xiàn)更快、更高效、更具成本效益的邊緣AI解決方案。廣義訓(xùn)練后量化(GPTQ)、低秩適應(yīng)(LoRA)和量化低秩適應(yīng)(QLoRA)等突破有可能在數(shù)據(jù)生成時(shí)促進(jìn)實(shí)時(shí)分析和決策。
邊緣人工智能與正確的工具和技術(shù)相結(jié)合,可以重新定義我們與數(shù)據(jù)和數(shù)據(jù)驅(qū)動(dòng)的應(yīng)用交互的方式。
為什么選擇邊緣人工智能?
邊緣人工智能的目的是讓數(shù)據(jù)處理和模型更接近數(shù)據(jù)生成的地方,例如遠(yuǎn)程服務(wù)器、平板電腦、物聯(lián)網(wǎng)設(shè)備或智能手機(jī)。這可實(shí)現(xiàn)低延遲、實(shí)時(shí)的人工智能。到2025年,超過一半的深度神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)分析將發(fā)生在邊緣。這種模式的轉(zhuǎn)變將帶來多重優(yōu)勢(shì):
減少延遲:通過直接在設(shè)備上處理數(shù)據(jù),邊緣人工智能減少了與云來回傳輸數(shù)據(jù)的需要。這對(duì)于依賴實(shí)時(shí)數(shù)據(jù)并需要快速響應(yīng)的應(yīng)用至關(guān)重要。
降低成本和復(fù)雜性:在邊緣本地處理數(shù)據(jù)消除了來回發(fā)送信息的昂貴的數(shù)據(jù)傳輸成本。
隱私保護(hù):數(shù)據(jù)保留在設(shè)備上,減少數(shù)據(jù)傳輸和數(shù)據(jù)泄露的安全風(fēng)險(xiǎn)。
更好的可擴(kuò)展性:采用邊緣人工智能的去中心化方法可以更輕松地?cái)U(kuò)展應(yīng)用,而無需依賴中央服務(wù)器的處理能力。
例如,制造商可以在其流程中實(shí)施邊緣人工智能,以進(jìn)行預(yù)測(cè)性維護(hù)、質(zhì)量控制和缺陷檢測(cè)。通過運(yùn)行人工智能并在本地分析來自智能機(jī)器和傳感器的數(shù)據(jù),制造商可以更好地利用實(shí)時(shí)數(shù)據(jù)來減少停機(jī)時(shí)間,并改進(jìn)生產(chǎn)流程和效率。
模型量化的作用
為了使邊緣人工智能發(fā)揮作用,人工智能模型需要在不影響準(zhǔn)確性的情況下優(yōu)化性能。人工智能模型變得越來越復(fù)雜、越來越龐大,使得它們更難處理。這給在邊緣部署人工智能模型帶來了挑戰(zhàn),邊緣設(shè)備通常資源有限,支持此類模型的能力也受到限制。
模型量化降低了模型參數(shù)的數(shù)值精度(例如從32位浮點(diǎn)到8位整數(shù)),使模型輕量化,適合部署在手機(jī)、邊緣設(shè)備、嵌入式系統(tǒng)等資源受限的設(shè)備上。
GPTQ、LoRA和QLoRA這三種技術(shù)已經(jīng)成為模型量化領(lǐng)域潛在的游戲規(guī)則改變者:
GPTQ涉及在訓(xùn)練后壓縮模型。它非常適合在內(nèi)存有限的環(huán)境中部署模型。
LoRA涉及微調(diào)大型預(yù)訓(xùn)練模型以進(jìn)行推理。具體來說,它對(duì)構(gòu)成預(yù)訓(xùn)練模型大矩陣的較小矩陣(稱為LoRA適配器)進(jìn)行微調(diào)。
QLoRA是一種內(nèi)存效率更高的選項(xiàng),它利用GPU內(nèi)存來進(jìn)行預(yù)訓(xùn)練模型。當(dāng)使模型適應(yīng)新任務(wù)或計(jì)算資源有限的數(shù)據(jù)集時(shí),LoRA和QLoRA特別有用。
從這些方法中進(jìn)行選擇在很大程度上取決于項(xiàng)目的獨(dú)特需求、項(xiàng)目是否處于微調(diào)階段或部署階段,以及是否擁有可供使用的計(jì)算資源。通過使用這些量化技術(shù),開發(fā)人員可以有效地將人工智能帶到邊緣,在性能和效率之間取得平衡,這對(duì)于廣泛的應(yīng)用至關(guān)重要。
邊緣人工智能用例和數(shù)據(jù)平臺(tái)
邊緣人工智能的應(yīng)用非常廣泛。從處理火車站有軌車檢查圖像的智能相機(jī),到檢測(cè)佩戴者生命體征異常的可穿戴健康設(shè)備,再到監(jiān)控零售商貨架上庫存的智能傳感器,可能性是無限的。因此,IDC預(yù)測(cè)2028年邊緣計(jì)算支出將達(dá)到3170億美元,邊緣正在重新定義組織處理數(shù)據(jù)的方式。
隨著組織認(rèn)識(shí)到邊緣人工智能推理的好處,對(duì)強(qiáng)大的邊緣推理堆棧和數(shù)據(jù)庫的需求將會(huì)激增。此類平臺(tái)可以促進(jìn)本地?cái)?shù)據(jù)處理,同時(shí)提供邊緣人工智能的所有優(yōu)勢(shì),從減少延遲到增強(qiáng)數(shù)據(jù)隱私。
為了使邊緣人工智能蓬勃發(fā)展,持久的數(shù)據(jù)層對(duì)于本地和基于云的數(shù)據(jù)管理、分發(fā)和處理至關(guān)重要。隨著多模態(tài)人工智能模型的出現(xiàn),能夠處理各種數(shù)據(jù)類型的統(tǒng)一平臺(tái),對(duì)于滿足邊緣計(jì)算的運(yùn)營需求變得至關(guān)重要。統(tǒng)一的數(shù)據(jù)平臺(tái)使人工智能模型能夠在線上和離線環(huán)境中,無縫訪問本地?cái)?shù)據(jù)存儲(chǔ)并與之交互。此外,分布式推理有望緩解當(dāng)前的數(shù)據(jù)隱私和合規(guī)性問題。
隨著我們向智能邊緣設(shè)備邁進(jìn),人工智能、邊緣計(jì)算和邊緣數(shù)據(jù)庫管理的融合將成為預(yù)示快速、實(shí)時(shí)和安全解決方案時(shí)代的核心。展望未來,組織可以專注于實(shí)施復(fù)雜的邊緣策略,以高效、安全地管理人工智能工作負(fù)載并簡化業(yè)務(wù)中數(shù)據(jù)的使用。
- 中國電信:李峻辭任公司執(zhí)行董事
- 5G專網(wǎng)賦能,糯扎渡水電廠開啟智慧運(yùn)營新時(shí)代
- Dell'Oro報(bào)告:2024年調(diào)整期結(jié)束 光傳輸設(shè)備市場將恢復(fù)增長
- Dell'Oro報(bào)告:2024年調(diào)整期結(jié)束 光傳輸設(shè)備市場將恢復(fù)增長
- 為什么要云轉(zhuǎn)型?企業(yè)邁向數(shù)字化未來的必由之路
- 受AI和混合云推動(dòng) 分布式云網(wǎng)絡(luò)市場到2028年將達(dá)170億美元
- 商業(yè)航天產(chǎn)業(yè)不僅是戰(zhàn)略新興產(chǎn)業(yè),更是戰(zhàn)略常興產(chǎn)業(yè)
- 韋爾股份預(yù)計(jì)2024年?duì)I收創(chuàng)歷史新高 凈利潤預(yù)計(jì)增長五倍
- 郝文宇:我國商業(yè)衛(wèi)星應(yīng)堅(jiān)持自主發(fā)展 遵循產(chǎn)業(yè)規(guī)律
- 瑞芯微2024年預(yù)計(jì)營收創(chuàng)歷史新高 凈利潤增長超300%
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。