亚洲国产婷婷_手机在线观看国产精品_日本一区二区三区在线视频_亚洲精品成人久久

首頁 > 汽車測評 > 汽車測評 > 微軟亞研院多項創(chuàng)新技術(shù),彌合大模型低比特量化與終端部署間鴻溝

微軟亞研院多項創(chuàng)新技術(shù),彌合大模型低比特量化與終端部署間鴻溝

發(fā)布時間:2024-08-21 22:59:04

在人工智能領(lǐng)域,模型參數(shù)的增多往往意味著性能的提升。但隨著模型規(guī)模的擴大,其對終端設(shè)備的算力與內(nèi)存需求也日益增加。低比特量化技術(shù),由于可以大幅降低存儲和計算成本并提升推理效率,已成為實現(xiàn)大模型在資源受限設(shè)備上高效運行的關(guān)鍵技術(shù)之一。然而,如果硬件設(shè)備不支持低比特量化后的數(shù)據(jù)模式,那么低比特量化的優(yōu)勢將無法發(fā)揮。

為了解決這一問題,微軟亞洲研究院推出了全新的數(shù)據(jù)編譯器 Ladder 和算法 T-MAC,使當前只支持對稱精度計算的硬件能夠直接運行混合精度矩陣乘法。測試結(jié)果表明,Ladder 在支持 GPU 原本不支持的自定義數(shù)據(jù)類型方面,最高提速可達14.6倍;T-MAC 在搭載了最新高通 Snapdragon X Elite 芯片組的 Surface AI PC 上,使 CPU 上運行的大模型吞吐率比專用加速器 NPU 快兩倍。此外,研究員們還設(shè)計了 LUT Tensor Core 硬件架構(gòu),這種精簡設(shè)計使硬件能夠直接支持各種低比特混合精度計算,為人工智能硬件設(shè)計提供了新思路。

 

大模型已經(jīng)越來越多地被部署在智能手機、筆記本電腦、機器人等端側(cè)設(shè)備上,以提供先進的智能及實時響應服務。但包含上億參數(shù)的大模型對終端設(shè)備的內(nèi)存和計算能力提出了極高的要求,也因此限制了它們的廣泛應用。低比特量化技術(shù)因其能顯著壓縮模型規(guī)模,降低對計算資源的需求,成為了大模型在端側(cè)部署和實現(xiàn)高效推理的有效手段。

 

隨著低比特量化技術(shù)的發(fā)展,數(shù)據(jù)類型日益多樣化,如 int4、int2、int1 等低比特數(shù)據(jù),使得大模型在推理中越來越多地采用低比特權(quán)重和高比特權(quán)重計算的混合精度矩陣乘法(mixed-precision matrix multiplication,mpGEMM)。然而,現(xiàn)有的 CPU、GPU 等硬件計算單元通常只支持對稱計算模式,并不兼容這種混合精度的矩陣乘法。

 

混合精度矩陣乘法與傳統(tǒng)的矩陣乘法有何不同?

 

在傳統(tǒng)的矩陣乘法中,參與運算的兩端數(shù)值是對稱的,例如 FP16*FP16、int8*int8。但大模型的低比特量化打破了這種對稱性,使乘法的一端是高比特,另一端是低比特,例如在 1-bit 的 BitNet 模型中實現(xiàn)的 int8*int1 或 int8*int2,以及浮點數(shù)與整數(shù)的混合乘法 FP16*int4。

 

為了充分發(fā)揮低比特量化的優(yōu)勢,讓硬件設(shè)備能夠直接支持混合精度矩陣乘法,確保大模型在端側(cè)設(shè)備上的高速有效運行,微軟亞洲研究院的研究員們針對現(xiàn)有 CPU、GPU 計算算子和硬件架構(gòu)進行創(chuàng)新:

 

  • 推出了數(shù)據(jù)類型編譯器 Ladder,支持各種低精度數(shù)據(jù)類型的表達和相互轉(zhuǎn)換,將硬件不支持的數(shù)據(jù)類型無損轉(zhuǎn)換為硬件支持的數(shù)據(jù)類型指令,在傳統(tǒng)計算模式下,使得硬件能夠支持混合精度的 DNN(深度神經(jīng)網(wǎng)絡)計算;
  • 研發(fā)了全新算法 T-MAC,基于查找表(Lookup Table,LUT)的方法,實現(xiàn)了硬件對混合精度矩陣乘法的直接支持,軟件層面,在 CPU 上的計算相比傳統(tǒng)計算模式取得了更好的加速;
  • 提出了新的硬件架構(gòu) LUT Tensor Core,為下一代人工智能硬件設(shè)計打開了新思路。

 

汽車測評更多>>

從《大師與瑪格麗特》看經(jīng)典作品當代復現(xiàn)的創(chuàng)作困境 傅繼英工筆畫三十三觀音之馬郎婦觀音:至誠合作,事業(yè)騰達 粵港青年音樂家在深圳展演四場室內(nèi)樂音樂會,奏響大灣區(qū)青春樂章 若羌縣舉辦“棗花開了”系列活動之移風易俗、書畫攝影作品、臨書臨印展 第十四屆全國美術(shù)作品展覽部分進京作品巡展至河南 2024年南寧市體育局局屬事業(yè)單位免筆試招聘工作人員公告(5人) 2024年中國人民政治協(xié)商會議廣州市海珠區(qū)委員會辦公室關(guān)于招聘雇員的公告(1人) 2024年中山職業(yè)技術(shù)學院第三期招聘事業(yè)單位人員公告(16人) 2024年下半年揭陽市市直事業(yè)單位專項招聘博(碩)士研究生公告(45人) 安徽大眾第二款SUV要來了,依舊轎跑風格,定位更高 阿維塔又要推新車了,定位中型轎車,明年推出 9.98萬元起售,搭載2C快充,五菱星光純電版算是真香之選嗎? 阿維塔12增程版要來了,明天開啟預售,純電續(xù)航201km MG ES5要來了,10月15日首發(fā),主打大空間 嵐圖知音正式上市,19.69萬起,全新純電平臺打造,還配曲面屏 別錯過!這四款華為手機超高性價比,最低1199元! 解讀卡羅拉銳放,定位緊湊型SUV,配2.0L+CVT,實力表現(xiàn)如何? 外觀運動時尚的艾瑞澤8,1.6T爆發(fā)197馬力,實力表現(xiàn)到底如何? 小鵬P7i:6.4秒破百,配XNGP+AI天璣系統(tǒng),產(chǎn)品實力值得一看 長安啟源A07全新真香版即將上市,產(chǎn)品力依舊保持較高水準 定位緊湊型SUV,車身軸距2770mm的哪吒X,其實力表現(xiàn)是否值得一看 9月銷量破萬,豐田亞洲龍2024款,2.0L+CVT,值得入手嗎 10小時訂單量破5000臺,全新智己LS6比極氪7X更值得考慮? 純電中大型轎車之爭,極越07、領(lǐng)克Z10,誰更具“性價比”? 塊頭都不小呀!比亞迪騰勢N9、全新“夏”MPV現(xiàn)身目錄 蘋果推出新款iPad mini 現(xiàn)在即可訂購 10月23日在實體店開售 一汽紅旗:交付 EH7 榮耀版,助力體育強國 中國車企正在“顛覆”歐洲老牌制造商?小鵬、廣汽紛紛“安撫” 第100萬輛汽車下線 理想汽車成國內(nèi)首個“百萬輛新勢力車企” AION V 打頭陣,廣汽開始籌謀歐洲市場
主站蜘蛛池模板: 涿鹿县| 高台县| 五大连池市| 马龙县| 镇巴县| 阳西县| 社旗县| 饶阳县| 营山县| 都兰县| 岳西县| 莲花县| 辽中县| 固安县| 饶阳县| 凤城市| 游戏| 旺苍县| 盐津县| 兴义市| 璧山县| 体育| 冀州市| 西盟| 永新县| 永定县| 桐城市| 泾川县| 泉州市| 绩溪县| 丹寨县| 吉首市| 平果县| 怀远县| 江油市| 乐业县| 淮南市| 彩票| 靖州| 龙游县| 灌阳县|