6月28日至29日,「稀土開發(fā)者大會」在北京圓滿落幕,這場為期兩天的盛會以“代碼不止掘金不停”為主題,匯聚了業(yè)界精英的璀璨光芒?;顒犹匮?位重量級主論壇嘉賓、12位卓越出品人以及超過70位技術(shù)先鋒,精心策劃了10大前沿主題分論壇,跨越地域界限,攜手引領(lǐng)技術(shù)潮流,深入剖析行業(yè)最新趨勢與未來發(fā)展方向。
作為本次大會的戰(zhàn)略合作伙伴,英特爾不僅在主論壇與分論壇上貢獻(xiàn)了精彩紛呈的內(nèi)容,更在外部展區(qū)大放異彩,聚焦于大模型與genAI的賦能展示。不僅展現(xiàn)了其在推動AI技術(shù)革新方面的深厚實力,更為參會者搭建了一個近距離感受未來科技魅力的平臺。
開放生態(tài)賦能創(chuàng)新
英特爾公司副總裁、英特爾中國軟件與先進(jìn)技術(shù)事業(yè)部總經(jīng)理李映在稀土開發(fā)者大會主論壇上帶來了主題《開放生態(tài),賦能創(chuàng)新:英特爾如何通過開源開放推動GenAI產(chǎn)業(yè)生態(tài)繁榮》。會上,他強調(diào)英特爾公司通過技術(shù)趨勢引領(lǐng)和開源社區(qū)建設(shè),推動社區(qū)繁榮,同時在硬件支持和創(chuàng)新項目培育方面發(fā)揮著重要作用。英特爾的技術(shù)合作釋放了硬件算力,OS優(yōu)化快速部署,顯著提升了性能,尤其是在veLinux操作系統(tǒng)上的應(yīng)用性能。通過社區(qū)治理和創(chuàng)新項目,展示了硬件級安全方案和資源管理的重要性。英特爾還推動了AI創(chuàng)新應(yīng)用在多媒體內(nèi)容生成、教育等領(lǐng)域的發(fā)展。
展望2024年,英特爾計劃通過開放生態(tài)系統(tǒng)解鎖企業(yè)人工智能,推動異構(gòu)計算AI加速框架,與Linux Foundation等合作伙伴共同構(gòu)建開放、標(biāo)準(zhǔn)的多架構(gòu)加速計算生態(tài)系統(tǒng)。英特爾中國將繼續(xù)加強全球開源社區(qū)合作,加速技術(shù)應(yīng)用創(chuàng)新,推動產(chǎn)業(yè)落地,釋放底層算力,實現(xiàn)AI的無處不在。
圖:英特爾公司副總裁、英特爾中國軟件與先進(jìn)技術(shù)事業(yè)部總經(jīng)理李映
在「大模型部署與推理」的分論壇上,英特爾高級軟件工程師繆金成、英特爾AI框架軟件工程師 王錫貴 分別帶來了《使用英特爾優(yōu)化工具加速GenAI/LLM應(yīng)用》以及《英特爾基于transformer的工具集加速LLM》的主題演講。
繆金成首先介紹了至強平臺憑借其強大的計算能力和可擴(kuò)展性,在支撐復(fù)雜LLM運行方面的獨特優(yōu)勢。具體而言,通過利用該平臺提供的32個物理核心以及xFT + vLLM技術(shù),實現(xiàn)了多路并發(fā)的卓越效果,顯著提升了模型處理速度與響應(yīng)能力。他進(jìn)一步分享了具體的部署經(jīng)驗,包括如何選擇合適的硬件配置、優(yōu)化軟件棧以充分利用硬件資源,以及利用部署工具簡化流程、加速部署周期。最終,通過實例展示,驗證了至強平臺在支持高并發(fā)、低延遲LLM服務(wù)方面的卓越表現(xiàn)。
圖:英特爾高級軟件工程師繆金成
王錫貴著重介紹了英特爾擴(kuò)展工具包,這是一個為加速Transformer模型而設(shè)計的創(chuàng)新工具集。他詳細(xì)說明了該工具包如何支持模型量化,以減少內(nèi)存占用同時保持計算精度。并分享了全面的安裝和配置指南,指導(dǎo)用戶如何在不同的操作系統(tǒng)和軟件版本上部署和優(yōu)化模型。此外,他還列出了工具包支持的大型語言模型,并提供了詳盡的性能數(shù)據(jù),展示了這些模型在不同硬件上的表現(xiàn)。
圖:英特爾AI框架軟件工程師 王錫貴
在「GenAI技術(shù)實踐」分論壇上,英特爾軟件工程師林立凡帶來了主題為《火山引擎g3i實例:基于第五代至強處理器的文生圖實踐》
林立凡在演講中總結(jié)了基于英特爾第五代至強處理器在文生圖技術(shù)上的實踐突破。他強調(diào)了火山g3i實例的架構(gòu)優(yōu)勢,特別是Intel AMX技術(shù)如何通過硬件加速提升深度學(xué)習(xí)性能。同時,他介紹了英特爾軟件棧的優(yōu)化,包括針對PyTorch、TensorFlow等框架的調(diào)整及AMX性能優(yōu)化。通過Huggingface pipeline的實戰(zhàn)案例,展示了這些優(yōu)化如何在實際應(yīng)用中提升圖像生成服務(wù)的效率。
圖:英特爾軟件工程師林立凡
在「大模型工具鏈的應(yīng)用與實踐」分論壇上,英特爾AI框架軟件工程師 王再勵帶來了主題為《助力PyTorch加速大語言模型》
在演講中他深入剖析了Intel Extension for PyTorch,這一專為強化PyTorch在英特爾平臺上性能的定制優(yōu)化工具集。王再勵簡明扼要地介紹了三大核心優(yōu)化策略:算子級優(yōu)化、自動混合精度加速及數(shù)據(jù)布局智能調(diào)整,這些策略協(xié)同作用,顯著加速了深度學(xué)習(xí)模型的訓(xùn)練與推理過程。針對大型語言模型(LLM)的內(nèi)存瓶頸,王再勵介紹了一系列創(chuàng)新優(yōu)化方案,涵蓋GEMM計算加速、圖結(jié)構(gòu)優(yōu)化、權(quán)重量化技術(shù)、K-V緩存策略優(yōu)化及高效的分布式推理方法。他特別強調(diào)了SmoothQuant與權(quán)重量化技術(shù)的應(yīng)用,這些技術(shù)能夠在保持模型精度的同時,大幅提升計算效率。
圖:英特爾AI框架軟件工程師 王再勵
展區(qū)探秘科技觸手可及
走進(jìn)英特爾展區(qū),立刻領(lǐng)略到科技的前沿魅力。展區(qū)設(shè)計現(xiàn)代且富有科技感。展品展示了英特爾的發(fā)展歷程和最新技術(shù)成果,還通過豐富的互動體驗,讓參觀者近距離感受科技的魅力。無論是科技愛好者、專業(yè)人士還是普通觀眾,都能在這里找到感興趣的內(nèi)容,全面了解英特爾如何通過科技創(chuàng)新引領(lǐng)未來。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )