国产精品内射日本在线观看,女人操女人大逼,国产成人精品男人女人高潮,欧美性爱2022天堂网

你的位置:首頁 > RF/微波 > 正文

DSP+DSA 架構(gòu)革新:安謀 “周易” X3 NPU 的技術(shù)密鑰

發(fā)布時間:2025-12-18 來源:轉(zhuǎn)載 責(zé)任編輯:lily

【導(dǎo)讀】“算力墻”“內(nèi)存墻”“功耗墻”已成為制約智能終端實現(xiàn)更復(fù)雜AI任務(wù)與更高計算效率的核心問題。神經(jīng)網(wǎng)絡(luò)處理器(NPU)作為支撐AI計算的核心硬件單元,是突破上述技術(shù)困局的關(guān)鍵支撐。安謀科技(Arm China)推出的“周易”X3 NPU IP,通過前瞻性的架構(gòu)創(chuàng)新、深度的軟硬件協(xié)同優(yōu)化及開放的生態(tài)構(gòu)建,為破解端側(cè)AI三大技術(shù)壁壘提供了系統(tǒng)性的技術(shù)支撐方案。該方案從算力供給的靈活適配、內(nèi)存利用效率的極致提升,到能效平衡的精準(zhǔn)調(diào)控,以全方位的技術(shù)突破,為端側(cè)AI的規(guī)?;涞靥峁┝藦妱艅幽堋?/p>


1766037006630556.png


錦囊一:應(yīng)對“算力墻”,從“定點”到“浮點”,架構(gòu)升級與算力靈活配置

端側(cè)AI從CNN向Transformer遷移,對高精度浮點運算的需求激增。傳統(tǒng)NPU受限于架構(gòu)適配性差、算力調(diào)度效率低等,難以滿足復(fù)雜AI場景的動態(tài)需求。為應(yīng)對大模型對端側(cè)算力的嚴(yán)苛需求,“周易”X3提供了高效的解決方案。


“周易”X3的破局之道在于底層架構(gòu)革新,它采用專為大模型而生的DSP+DSA全新架構(gòu),實現(xiàn)從定點轉(zhuǎn)向浮點計算,兼顧CNN與Transformer,解決了傳統(tǒng)NPU“偏科”問題。單Cluster可提供8-80 FP8 TFLOPS的靈活算力配置,能精準(zhǔn)匹配不同場景的多樣化算力需求。相較上一代產(chǎn)品,“周易”X3實現(xiàn)性能升級——AIGC大模型能力提升10倍、CNN模型性能提升30%-50%,充分釋放大模型算力潛能。


錦囊二:應(yīng)對“內(nèi)存墻”——高帶寬與智能存儲,提升內(nèi)存利用效率

大模型參數(shù)規(guī)模龐大,內(nèi)存帶寬與存儲壓力是另一大瓶頸。若無法高效處理數(shù)據(jù)讀寫與存儲,將導(dǎo)致AI任務(wù)卡頓與響應(yīng)延遲?!爸芤住盭3通過多重技術(shù)升級應(yīng)對內(nèi)存挑戰(zhàn):

超高速數(shù)據(jù)通道:單Core帶寬高達(dá)256GB/s,能快速完成海量數(shù)據(jù)的讀寫,減少數(shù)據(jù)在內(nèi)存中的滯留時間。計算核心帶寬相較上一代提升4倍,可保障數(shù)據(jù)高效傳輸;


智能存儲架構(gòu):升級的L2 Memory存儲系統(tǒng)有效減少DDR訪存,提升數(shù)據(jù)吞吐效率;


硬件解壓引擎:集成自研解壓硬件WDC,使大模型Weight軟件無損壓縮后通過硬件解壓能額外獲得約15%的等效帶寬;


低精度加速模式:支持端側(cè)大模型運行必備的W4A8/W4A16計算加速模式,兼顧存儲容量、帶寬與精度需求,在保證模型效果的前提下顯著提升計算效率。


實測數(shù)據(jù)顯示,多核算力線性度達(dá)70-80%、大模型Prefill階段利用率可達(dá)72%、Decode階段有效帶寬利用率突破100%[1],充分驗證其內(nèi)存調(diào)度能力與系統(tǒng)協(xié)同優(yōu)化的卓越表現(xiàn)。


 錦囊三:應(yīng)對“功耗墻”:極簡調(diào)度與按需供給,實現(xiàn)能效優(yōu)化

終端設(shè)備在有限電池容量和散熱條件下,亟需通過算力與能效的協(xié)同優(yōu)化,實現(xiàn)高性能AI任務(wù)與長續(xù)航的平衡。


“周易”X3集成AI專屬硬件引擎AIFF,搭配專用硬化調(diào)度器,能將CPU負(fù)載降至0.5%以下,且調(diào)度延遲極低。NPU在并行處理多項AI任務(wù)時,無需依賴CPU頻繁介入調(diào)度,顯著降低CPU與NPU間的通信開銷,從而降低系統(tǒng)功耗、有效延長設(shè)備續(xù)航時間。


此外,“周易”X3采用可擴展的多核架構(gòu)及層次化的內(nèi)存互連架構(gòu),支持算力靈活裁剪和擴展,系統(tǒng)可根據(jù)AI任務(wù)復(fù)雜度實現(xiàn)“按需供能”,有效降低無效計算與數(shù)據(jù)搬移,實現(xiàn)能源利用效率最大化。


Compass AI軟件平臺 助力全鏈路高效開發(fā)與部署


應(yīng)對端側(cè)AI“三堵墻”挑戰(zhàn),離不開軟硬件的深度協(xié)同。“周易”X3配套的Compass AI軟件平臺憑借完善易用、開放生態(tài)、安全保障等多維優(yōu)勢,成為面對端側(cè)AI“三堵墻”困境的超強“金牌輔助”。


1766036973501686.png

“周易” NPU Compass AI軟件平臺


Compass AI軟件平臺提供端到端統(tǒng)一工具鏈,可實現(xiàn)“一鍵部署,開箱即用”。原生支持Hugging Face、主流AI框架與OS,支持160+算子與270+模型,并對LLM/VLM/VLA及MoE等大模型推理進(jìn)行深度優(yōu)化,實現(xiàn)從CNN到Transformer模型的無縫接入,大幅降低模型部署門檻與成本。同時,平臺對量化算法的支持與具備的動態(tài)Shape能力,可在提升性能的同時有效降低功耗,避免無效計算。


此外,Compass AI軟件平臺提供多種軟件工具,并開放IR規(guī)格、開源量化工具等核心組件。開發(fā)者基于DSL編程語言,通過豐富的NN編譯器插件實現(xiàn)自定義算子,配合可視化調(diào)試工具,能夠?qū)崿F(xiàn)全鏈路可觀測、可優(yōu)化,極大提升不同場景下的開發(fā)效率,為端側(cè)AI的算力調(diào)度、功耗控制提供底層軟件支撐。


以自研IP產(chǎn)品矩陣 助推端側(cè)AI規(guī)?;涞?/p>


在安謀科技“AI Arm CHINA”戰(zhàn)略指引下,公司將以AI為核心、Arm?生態(tài)為支撐、本土創(chuàng)新為根基,持續(xù)推進(jìn)“周易”NPU、“星辰”CPU、“山海”SPU和“玲瓏”多媒體處理器四大自研IP產(chǎn)品的研發(fā),與產(chǎn)業(yè)伙伴協(xié)同共建中國智能計算生態(tài),助推端側(cè)AI的規(guī)?;涞亍?/p>


“周易”X3 NPU IP以架構(gòu)革新、內(nèi)存優(yōu)化、智能調(diào)度三大技術(shù)突破破解端側(cè)AI“三堵墻”,配套的Compass AI軟件平臺則通過全鏈路工具鏈與開放生態(tài)構(gòu)建軟硬件協(xié)同體系,顯著降低大模型端側(cè)部署門檻。在安謀科技“AI Arm CHINA”戰(zhàn)略下,“周易”NPU與“星辰”CPU等自研IP形成的產(chǎn)品矩陣,以Arm生態(tài)為基礎(chǔ)、本土創(chuàng)新為核心推動產(chǎn)業(yè)融合,為終端提供高效AI支撐的同時,加速端側(cè)AI規(guī)?;逃谩?/p>

特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索

關(guān)閉

?

關(guān)閉

锦州市| 台中县| 乾安县| 白玉县| 怀远县| 突泉县| 临西县| 澄城县| 黄平县| 西平县| 甘孜| 寿宁县| 新干县| 广灵县| 嘉祥县| 离岛区| 嫩江县| 洛宁县| 临湘市| 钦州市| 镇坪县| 家居| 古浪县| 汉阴县| 衡山县| 浦江县| 太和县| 蛟河市| 海晏县| 内乡县| 通辽市| 阿克陶县| 宁南县| 北安市| 龙游县| 孟津县| 武隆县| 板桥市| 嘉义市| 镇沅| 策勒县|