久久久久国产免费-亚洲成av人影院无码不卡-免费在线观看黄色-中文字幕av高清片-亚洲最大的成人网-校园春色亚洲激情-日韩在线观看一区二区-亚洲专区中文字幕-97伦伦午夜电影理伦片-亚洲精品国产v片在线观看-欧美自拍偷拍一区-hodv一21134铃原爱蜜莉在线-日韩国产精品一区二区-中国精品妇女性猛交bbw-欧美一卡2卡3卡4卡新区在线

歡迎訪問深圳市中小企業(yè)公共服務平臺電子信息窗口

Arm 計算平臺加持,全新 Llama 3.2 LLM實現(xiàn)AI 推理的全面加速和擴展

2024-09-27 來源:Arm
5222

關鍵詞: Arm Meta Llama 3.2 AI 邊緣側 合作 開源 小型模型 云端 Kleidi PyTorch CPU 設備 未來

新聞重點:
在 Arm CPU 上運行 Meta 最新 Llama 3.2 版本,其云端到邊緣側的性能均得到顯著提升,這為未來 AI 工作負載提供了強大支持
Meta 與 Arm 的合作加快了用例的創(chuàng)新速度,例如個性化的端側推薦以及日常任務自動化等
Arm 十年來始終積極投資AI領域,并廣泛開展開源合作,為 1B 至 90B 的 LLM 實現(xiàn)在 Arm 計算平臺上無縫運行
 
人工智能 (AI) 的迅猛發(fā)展意味著大語言模型 (LLM) 的新版本不斷推陳出新。要充分發(fā)揮 AI 的潛力并抓住其帶來的機遇,需要實現(xiàn) LLM 從云端到邊緣側的廣泛部署,而這也伴隨著對計算和能源需求的大幅增長。整個生態(tài)系統(tǒng)正攜手尋找應對這一挑戰(zhàn)的解決方案,不斷推出新的更加高效的開源 LLM,以便大規(guī)模實現(xiàn)各種 AI 推理工作負載,加快為用戶帶來全新、快速的 AI 體驗。

為此,Arm與Meta 展開緊密合作,在 Arm CPU 上啟用新的Llama 3.2 LLM,集成開源創(chuàng)新與 Arm 計算平臺的優(yōu)勢,顯著推進了解決AI挑戰(zhàn)的進程。得益于Arm 的持續(xù)投資及與新型LLM 的合作, Arm CPU運行 AI 的優(yōu)勢在生態(tài)系統(tǒng)中脫穎而出,使Arm成為 AI 推理開發(fā)者的首選平臺。

加速云到邊緣側的 AI 性能

小型 LLM(如 Llama 3.2 1B 和 3B)能夠支持基于文本的基礎生成式 AI 工作負載,對于大規(guī)模 AI 推理的實現(xiàn)至關重要。通過 Arm CPU 優(yōu)化內(nèi)核在 Arm 技術驅動的移動設備上運行新的 Llama 3.2 3B LLM,可讓提示詞處理速度提高五倍,詞元 (token) 生成速度提高三倍,在生成階段實現(xiàn)每秒 19.92 個詞元。這將直接減少了在設備上處理 AI 工作負載的延遲,大大提升了用戶整體體驗。此外,當邊緣側能處理的 AI 工作負載越多,往返云端傳輸數(shù)據(jù)所節(jié)省的電量就越多,進而節(jié)省了能源和成本。
 
除了在邊緣側運行小型模型,Arm CPU同樣支持在云端運行更大的模型(如 Llama 3.2 11B 和 90B)。11B 和 90B 的模型非常適合云端基于 CPU 的推理工作負載,可生成文本和圖像,其中,在 Arm Neoverse V2 上的測試結果展現(xiàn)出了更大的性能提升。在基于 Arm 架構的 AWS Graviton4 上運行 11B 的圖像和文本模型,可以在生成階段實現(xiàn)每秒 29.3 個詞元的表現(xiàn),遠遠超出了人類大約每秒閱讀五個詞元的速度。
 
AI 將通過開源創(chuàng)新和生態(tài)系統(tǒng)協(xié)作迅速擴展

能公開獲取新的 LLMs(如Llama 3.2)至關重要。開源創(chuàng)新正以迅猛速度發(fā)展,在之前的版本中,開源社區(qū)在不到 24 小時的時間內(nèi)便能在 Arm 上部署并運行新的 LLM。
 
Arm將通過 Arm Kleidi 進一步支持軟件社區(qū),讓整個 AI 技術棧能夠充分發(fā)揮這一優(yōu)化的 CPU 性能。Kleidi 可在任何 AI 框架上解鎖 Arm Cortex 和 Neoverse CPU 的 AI 功能和性能,無需應用程序開發(fā)者進行額外的集成工作。
 
通過最近的 Kleidi 與 PyTorch 集成以及正在推進的與 ExecuTorch 集成,Arm正在為基于 Arm CPU的開發(fā)者提供從云端到邊緣側的無縫 AI 性能。得益于Kleidi 與 PyTorch 的集成,在基于 Arm 架構的 AWS Graviton 處理器上運行 Llama 3 LLM 的詞元首次響應時間加快了 2.5 倍。

同時,在端側,與參考實現(xiàn)相比,在 KleidiAI 庫的加持下,使用 llama.cpp庫在新的 Arm Cortex-X925 CPU 上運行 Llama 3 的詞元首次響應時間加快了 190%。
 
構建 AI 的未來

Arm 與 Meta 的合作成為了行業(yè)合作的新標桿,匯聚了 Arm 計算平臺的靈活性、普及性和 AI 功能,以及 Meta 等行業(yè)巨頭的技術專長,共同解鎖AI 廣泛應用的新機遇。無論是利用端側 LLM 滿足用戶的個性化需求,如根據(jù)用戶所處的位置、日程和偏好來執(zhí)行任務,還是通過企業(yè)級應用來優(yōu)化工作效率,讓用戶能夠更專注于戰(zhàn)略性任務,Arm 技術的集成都為未來奠定了基礎。未來,設備不再只是命令和控制工具,更是能在提升用戶整體體驗方面扮演積極的作用。
 
在 Arm CPU 上運行 Meta 最新 Llama 3.2 版本,其AI 性能實現(xiàn)了顯著提升。這類開放式合作是實現(xiàn)無處不在的 AI 創(chuàng)新、促進 AI 可持續(xù)發(fā)展的最佳途徑。通過新的 LLM、開源社區(qū)和 Arm 的計算平臺,Arm 正在構建 AI 的未來, 到 2025 年,將有 1000 多億臺基于 Arm 架構的設備支持 AI。

關于 Arm

Arm 作為業(yè)界性能最強、能效最高的計算平臺,以無可比擬的規(guī)模,覆蓋全球 100% 的聯(lián)網(wǎng)人群。Arm 提供先進的解決方案以滿足對計算永無止盡的需求,進而賦能全球領先的科技公司釋放前所未有的人工智能體驗和性能。Arm 攜手全球最廣泛的計算生態(tài)系統(tǒng)和 2,000 萬軟件開發(fā)者,共同在 Arm 平臺上構建人工智能的未來。



主站蜘蛛池模板: 天天撸天天操| chinese国产精品| 在线观看欧美精品| 国产精品无码专区av免费播放| av中文在线| 亚洲爱爱av| 毛片网站网址| 精品一区二区三区免费视频| 国产精品2| av 黄色| 欧美黄色性生活| 久久666| 国产午夜三级| 特黄aaaaaaaaa毛片免| 久久综合精品国产二区无码不卡| 天天操夜操| 国产香蕉久久| 最近最好的2019中文| 亚洲高清在线一区| 91插插影库| 久久无毛| 亚洲影院在线观看| 国产资源在线免费观看| 欧美男人又粗又长又大| 日日日日日日| 免费成人深夜| 91精品国产91久久| 久久中文字幕人妻| 亚洲一区二区成人| av黄色片| 午夜av中文字幕| 在线观看亚洲国产| 九九久久视频| 欧美三级理论| 国产免费色视频| 高清孕妇孕交╳╳交| 成人av资源| 黄色小视频链接| 色导航在线| 日本公公和儿媳| 激情文学一区二区| 麻豆一区在线| free性丰满hd性欧美4k| 东北少妇bbbb搡bbb搡| 高清免费在线视频| 激情五月视频| 伊人狠狠操| 成人日韩| 九九热99久久久国产盗摄| 性色一区| 国产精品手机在线观看| 天堂无乱码| 羞羞涩涩视频| 国产a国产片| sm国产在线调教视频| 国产伦理91| 宝贝乖高潮给我看h| 麻豆视频免费观看| 成年人午夜免费视频| 欧美成人亚洲| 欧美黄色一级大片| 国产精品一区二区小说| 女教师av| 韩日一区二区| 久久久久久久国产视频| 舌头进去里面吃小豆豆动态图| 亚洲欧美一区二区三区四区| 亚洲欧美操| 女人裸体免费网站| 黄漫在线看| 91青青国产| 亚洲国产精品久久久久爰色欲| 一级黄色免费片| 午夜av观看| 天天躁日日躁狠狠躁欧美| 综合av第一页| 午夜精品国产| 98精品国产| 男女上床动态图| 亚洲砖区区免费| 黄色爱情小说| 操骚b视频| 亚洲第一天堂| 性刺激的欧美三级视频| 三年中文在线观看中文版| 国产高清视频| 午夜在线不卡| 欧美一级片网址| 一区二区三区国产电影| 精品自拍av| 超碰在线影院| 大陆极品少妇内射aaaaa| 国产激情久久久久| 西门庆潘金莲三级做爰| 激情五月激情综合| 日韩欧美一卡二卡| 欧美一级片| 99午夜视频| 91亚洲一区|