国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

遇見·新視界”:LG UltraGear電競顯示器全景式體驗,多款新品陸續登場把舞臺拍成電影——佳能“佳直播PRO”助力譚維維《聲聲世世》音樂會幕后2025世界頂尖科學家論壇青年科學家大會在滬舉辦,深度對話頂尖大師總裁敲門,福利到家!京東11.11總裁送貨直播豪送E卡與免單大獎熱賣榜單已出爐 京東攜手11.11驚喜大使劉宇寧陪你逛3C數碼AI發電日Fender攜2025新品亮相上海國際樂器展 多元活動深度聯結本土音樂生態openvela首屆全球開發者大會圓滿落幕,NuttX創始人Greg親臨現場10月24日程序員節 京東11.11時尚辦公文具爆款直降 低至五折宇樹發布H2,優必選斬單,人形機器人走向實用主義長城汽車:2025 年第三季度營收 612.47 億元,同比增長 20.51%北汽藍谷:2025 年第三季度營收 58.67 億元,同比下降 3.45%九號公司:2025 年第三季度凈利潤 5.46 億元,同比增長 45.86%廣汽集團:2025 年第三季度營收 241.06 億元,同比下降 14.62%福特暫停F-150 Lightning生產,優先保障燃油混動車型OPPO與螞蟻集團簽署戰略合作:10月底推出“支付寶碰一下發紅包”功能秋冬室內空氣擔憂多?TCL小藍翼C7新風空調柜機保障室內呼吸健康TP-Link 聯洲推出入門級 Wi-Fi 7 電競無線路由器 GE400,雙頻 BE6500FM Agent登頂OpenAI MLE-Bench,由百度智能云研發星塵智能升級平臺亮相機器人頂會IROS 技術與商業化雙線突破解碼IROS 2025:中國機器人產業正在形成的六大確定性趨勢
  • 首頁 > 云計算頻道 > 大模型

    云天勵飛SPACE引擎在ACL大放異彩:大模型推理速度飆升4倍

    2024年08月14日 17:15:59 來源:CITNews中文科技資訊

      8月11日-16日,第62屆國際計算語言學年會(Annual Meeting of the Association for Computational Linguistics,簡稱 ACL)在泰國曼谷舉行。

      云天勵飛大模型團隊的論文《Generation Meets Verification: Accelerating Large Language Model Inference with Smart Parallel Auto-Correct Decoding》被錄用為ACL24的Findings長文。這是云天勵飛大模型部分研究成果的階段性展示。

      ACL 年會是計算語言學和自然語言處理領域國際排名第一的頂級學術會議,由國際計算語言學協會組織,每年召開一次,在中國計算機學會(CCF)推薦會議列表中被列為 A 類會議。

      云天勵飛的入選論文提出了SPACE引擎—— 一種實現大模型推理無損加速的創新方案。在不同類型大模型測試的結果表明,使用SPACE引擎后,模型在HumanEval測試集上推理速度提升270%-400%,推理結果質量保持不變,可做到兼顧“算得快”和“算得準”。

      云天勵飛大模型團隊的入選論文

      主流推理方案難以做到“既要又要”

      SPACE是Smart Parallel Auto-Correct Decoding的簡稱,意為“智能并行自動糾錯解碼”。

      這個推理方案有兩大特點:一是采用半自回歸推理模型,極大加快推理速度;二是在推理過程中加入驗證手段,能夠在提升推理速度的同時,保證推理精度。

      “半自回歸”是什么?為什么要加入驗證的環節?在解釋這些問題前,我們需要先了解一下當前大模型是如何“工作”的。

      打開大語言模型的APP,我們在對話框輸入“大模型是什么?”,大模型會逐字逐句地輸出它的回答:“大模型是具有數千萬參數的深度學習模型。”這個回答的過程看似很簡單。但實際上,大模型在背后經歷了多次“自回歸”的循環。

      首先,大模型會根據我們輸入的內容,先預測輸出的第一個字——“大”,然后把“大”字重新帶回到輸入端,基于“大”字預測下一個字應該輸出什么。當然,這個“預測”并不是憑空“瞎猜”,而是模型會根據前期訓練過程中見過的數據綜合判斷,選擇概率最高的字,作為下一個輸出字。

      在這個案例中,第二個輸出的字是“模”,輸出了第二個字后,大模型會再次把“大模”這兩個字帶回到輸入端,預測第三個生成的字。如此不斷循環往復,直至完整的句子結束。

      這個過程就是“自回歸”。

      目前,自回歸是大模型推理采用的主流方案。無論是ChatGPT、開源的Llama,還是國內的一眾大模型,主要都是采用自回歸的推理方案。

      自回歸方案示意圖

      自回歸方案的優勢和弊端也十分明顯。優勢是能夠確保生成的內容準確且有意義,而且上下文連貫。弊端是計算成本高、推理延時長。

      為了克服這些問題,行業提出的解決方案是“半自回歸”“投機解碼”。

      “半自回歸”是在“自回歸”和“非自回歸”之間的一種折中方案。上文提到,“自回歸”是用已生成的詞來預測下一個詞;“非自回歸”則是“自回歸”的反面,一次性預測整個句子。“非自回歸”方案能夠提升推理效率,但是輸出的精度卻大打折扣。“半自回歸”方案,則是綜合考慮了“自回歸”和“非自回歸”的優缺點,平衡大模型推理對速度和精度的要求。

      但是,采用“半自回歸”方案又引發了新的問題——一是大部分大模型用不了,二是精度無法達到產業要求。主流大模型是按照自回歸的推理模式打造的,如果要采用半自回歸方案,則需要從頭開始重新訓練大模型。而訓練一次大模型需要消耗大量的電力、算力、人力,幾乎沒有人會為了改變推理方案,把好不容易訓練出來的大模型推倒重來。

      另一個方案是“投機解碼”。這一方案按照“草擬——驗證”的流程工作,首先需要引入一個參數量相對較小的輔助模型,由小模型先“草擬”出候選答案,再由大模型去驗證候選答案正確與否。得益于小模型相比大模型推理速度快,并且大模型能夠同時對多個候選答案進行驗證,這樣的解碼方式既能夠保證輸出結果的精度,同時也能夠加快推理速度。

      但是這個方案同樣存在弊端。一是需要先做出十分“靠譜”的小模型,要能夠又快又準地“草擬”出答案,而這本身就具有一定難度。二是兩個模型之間要做到“書同文,車同軌,度同制”,在分詞器、詞表等方面做到高度一致,才能夠保證驗證結果。

      SPACE推理引擎——小小改造、大大提速

      既然幾個方案都無法做到“既要又要”,有沒有一種方案,能只保留它們的優點,規避他們的缺點呢?這就是云天勵飛大模型團隊提出的SPACE推理引擎。SPACE通過結合“半自回歸監督微調”和“自動修正解碼”兩種方案,使得大模型能夠在一次推理中生成多個結果,并且同步完成結果驗證,保證生成結果的質量。同時,這套推理引擎適用于任何的大模型。通過模型的微調和優化,任何大模型采用該推理引擎時,不僅無需再訓練額外的輔助模型,還能提高推理效率,充分利用GPU等并行計算資源,達到較高的算力利用率。

      自回歸方案(左)與SPACE方案(右)的區別

      上文提到,多數大語言模型自帶“自回歸”的屬性,無法直接套用“半自回歸”的方案。對此,SPACE采用的是“半自回歸監督微調”的方式,通過有監督的訓練,模型學會在遇到特殊的[MASK]標識時提出一系列可能的候選字(如上圖所示)。這使得模型在推理時能夠進行類似“猜測”的操作,輸出幾個最可能正確的候選字,從而具備半自回歸推理的能力。

      簡單來說,有了“半自回歸監督微調”方案的加持,在推理時大模型自己就能夠做出“猜測”,輸出大概率是正確的多個字作為候選答案。

      但是,就跟考試一樣,草稿上可以列出大量的內容,但是填到考卷上的,必須得是正確答案。如何保證正確?這就需要對結果進行驗證,而這就是“自動修正解碼”要做的工作。

      具體來說,在推理時,我們把大模型在上一步推理時自己生成的候選詞也輸入到模型中,讓模型進行自我校驗,自行判斷這些候選答案是否正確。

      判斷的方式也很簡單,如果模型生成的詞與早先的候選答案相匹配,那就認為候選詞是正確的。回顧下,在傳統的自回歸推理里面,如果一個詞是正確的,那么這個詞需要再重新輸入到語言模型中去推理產生下一個詞。

      但是在SPACE這里卻不需要。由于我們已經把候選詞提前輸入到模型中,并且這個候選詞被驗證是正確的,所以這時候我們就可以直接從正確的候選詞里面獲取新的答案,從而節省了將答案重新輸入模型再進行一次推理的時間。因此這種機制的優勢在于,當一個候選詞被驗證為正確后,就無需再將其回輸模型生成下一個答案,從而減少了推理的時間。

      作為類比,可以把傳統的自回歸推理比作4×100米接力賽跑:在常規比賽中,四名運動員需按順序逐個接棒完成全部賽程,這就好比自回歸方案,需要逐字推理。而在SPACE的方案中,四名運動員是同步起跑的,當第一名運動員沖刺完100米到達終點的同時,其他運動員也到達了屬于各自百米賽段的終點。但是第一名運動員到達終點后需要進行驗證,若驗證通過,第二名運動員的成績即可確認,而后可以對第二名運動員進行驗證,并依此類推。

      若某名運動員未能通過驗證,那他就需要返回至屬于他的百米起跑線,重新起跑完成比賽。在最好的情況下,四個運動員每人都能通過驗證,那么這個小組相當于只需要花常規比賽1/4的時間,就能完成比賽,從而達到加速效果;在最差的情況下,每個運動員都未能通過驗證,那么這時候需要花的時間就跟常規比賽一樣了。而能不能通過驗證,主要取決于候選答案準不準確。

      與此同時,在SPACE模型的推理過程中,我們也在輸入中插入特殊的[MASK]標識,以此來引導大模型生成更新版的候選答案。在這種機制下,每一輪推理模型不僅驗證了前一輪生成的候選詞的準確性,也為接下來的推理提供了新的候選詞。

      這種設計旨在增強候選詞的準確度,因為每當有新答案出現時,原有的候選詞通過更新將變得更加精確。這個過程有如天氣預報:我們每天都會對接下來一周的氣候情況做出預測,并且隨著時間的推移,對未來特定一天的天氣預測準確度會逐漸提升。這是因為隨著時間的推移,我們累積了更多的傳感數據,這使得我們能夠提供更為精確的天氣預測。

      傳統的驗證和修正方法,是上文提到的“投機解碼”,即需要先訓練出一個靠譜的小模型,再用大模型去驗證,小模型的生成質量很大程度上影響了最終結果。

      但SPACE提出了一種新的方案,不需要使用小模型,就能夠達到生成和驗證的目的,而且驗證工作和生成工作可以同步進行。如此一來,推理的效率和準確率都能夠得到大幅提升。

      讓我們再回到開頭例子,當我們輸入“大模型是什么?”,在SPACE推理模式下,大模型首先會同時生成“大模型是具有數千萬參數的”這幾個詞,同時自動修正解碼算法會立馬對生成的多個詞逐一進行驗證,并且僅保留驗證結果正確的詞輸出作為最終答案,從而實現在一次大模型前向推理的過程中生成多個詞的效果,達到加速目的。

      最后,讓我們來看看SPACE的效果。

      我們在一眾開源大語言模型上進行了實驗,實驗涵蓋了從60億到700億不同參數量的主流大語言模型。從下表中可以看到,SPACE在參數量更大的模型上,加速效果更明顯。

      此外,SPACE也能跟其他推理加速技術,例如continue batching, flash attention, KV cache, quantization等,一起結合使用,從而帶來更快的推理速度。

      為了驗證這個觀點,我們在一個主流推理框架TGI上實現了SPACE,實驗證明在結合其他推理加速技術的情況下,SPACE帶來的加速效果也是同樣出眾。

      大模型走入千行百業,“推理”至關重要

      訓練和推理是大模型生命周期的兩個核心階段,訓練是解決大模型“從無到有”的問題,而推理解決的是大模型如何應用到千行百業的問題。

      如果將去年定義為大模型爆發的元年,那么今年就是大模型應用落地的元年,因此大模型的推理能力愈發受到重視。

      云天勵飛為加速大模型的應用做出了許多努力。在算力方面,去年公司推出大模型邊緣推理芯片DeepEdge10,近期推出IPU-X6000加速卡,可應用于語言、視覺、多模態等各類大模型的推理加速。

      在算法方面,云天勵飛提出SPACE推理引擎,大幅提升大模型推理速度。在應用方面,云天勵飛自研大模型云天天書已經在智慧政務、城市治理、智慧安防、智慧交通、智慧商業、智慧教育等多行業落地應用,探索打造行業標桿。

      未來,云天勵飛將繼續努力,在大模型相關技術的研發和應用推廣方面做出更大貢獻。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    [No.X058-2]

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    欧美aa在线视频| 91精品国产高清自在线看超| 欧美日韩免费一区二区三区| 久久综合偷偷噜噜噜色| 久久久久久久久一区二区| 亚洲国产综合在线| 国产一区二区三区在线免费观看| 激情综合视频| 亚洲男女自偷自拍图片另类| 日韩欧美中文字幕在线观看| 大奶在线精品| 欧美精品国产精品日韩精品| 亚洲一区在线| 岛国在线视频| 欧美午夜精品理论片a级按摩| 成人春色激情网| 国产精品久久久久久久午夜片| 香蕉国产精品偷在线观看不卡| 免费高潮视频95在线观看网站| 极品美女销魂一区二区三区| 男人皇宫亚洲男人2020| 国产精品视频导航| 欧美日韩在线观看一区二区三区| 男女男精品视频网| 国产精品久久久久久久久久齐齐| 国产精品成人久久久久| av色图一区| 国产欧美日本一区二区三区| 国产一二三区在线观看| 欧美男男tv网站在线播放| jlzzjlzz亚洲女人| av免费看在线| 亚洲激情久久| 精品久久久久亚洲| 黄色成人免费网| 免费观看成人鲁鲁鲁鲁鲁视频| √天堂8在线网| 99国产一区二区三精品乱码| 人人爽久久涩噜噜噜网站| 中文字幕在线不卡国产视频| 黄色成人在线视频| 99re在线观看| 草莓视频丝瓜在线观看丝瓜18| a一区二区三区| 99久久婷婷这里只有精品| 中文字幕自拍vr一区二区三区| 欧美精品精品一区| 色欧美乱欧美15图片| av丝袜在线| 久久综合狠狠综合久久激情| 精品在线观看入口| 国产精品人成在线观看免费| 欧美高清一区| 天堂√8在线中文| 欧美自拍视频在线| 国产一区二区三区网站| 亚洲美洲欧洲综合国产一区| 欧美丰满少妇xxxx| 欧美日韩国产一区二区三区不卡| 日韩欧美亚洲范冰冰与中字| 国产亚洲精品久久久久久牛牛| 亚洲最新在线观看| 精品一区二区三区在线视频| 精品国产区在线| 亚洲精品国产setv| 青青青国产精品一区二区| 欧美.日韩.国产.一区.二区| 国产亚洲欧美一级| 亚洲一区二区在线视频| 99久久精品费精品国产风间由美| 91在线观看免费视频| 国产一区在线看| 日韩美女网站| 国产aⅴ精品一区二区三区色成熟| 欧美专区一二三| 888av在线| 国产探花一区| 久久偷看各类wc女厕嘘嘘偷窃| 农村少妇一区二区三区四区五区| 色综合久久88色综合天天看泰| av亚洲产国偷v产偷v自拍| 伦一区二区三区中文字幕v亚洲| 91精品中国老女人| 一区二区在线观看视频在线观看| 欧美少妇精品| 久久国产福利| 日本三级在线播放完整版| 神马香蕉久久| 美国av一区二区三区| 成人一道本在线| av电影在线播放高清免费观看| 蜜桃久久影院| 欧美性极品少妇| 欧美在线va视频| silk一区二区三区精品视频| 91丝袜呻吟高潮美腿白嫩在线观看| 久久影视免费观看| 噜噜噜噜噜久久久久久91| jizz久久精品永久免费| 97在线观看免费| 在线亚洲欧美| 激情五月色综合国产精品| 久久精品免费播放| 国内自拍欧美激情| 亚洲另类在线视频| 蜜乳av一区二区三区| 免费高清在线观看| 欧美黄色片免费观看| 久久人人97超碰精品888| 在线观看av的网站| 国产精品免费一区二区三区| 亚洲一区二区少妇| 精品久久中文字幕久久av| 成人精品一二区| 欧美电影免费观看高清| 久久91超碰青草在哪里看| 欧美性猛交xxx| 国模私拍一区二区国模曼安| 国产精品69精品一区二区三区| 成人自拍在线| 亚洲男人第一网站| 久久不射网站| 色成年激情久久综合| 久久激情综合网| 国产亚洲免费的视频看| 成人不卡免费av| 夜夜嗨av色综合久久久综合网| 国产韩日精品| 成人春色在线观看免费网站| 亚洲国产精品久久久久| 午夜精品一区二区三区免费视频| 久久亚洲一区二区三区四区五区高| 婷婷精品在线| 国产精品乱子久久久久| 91p九色成人| 成人免费av| 日韩三级视频在线看| 国产精品一久久香蕉国产线看观看| 亚洲精品国产一区二区三区四区在线| 久久精品亚洲欧美日韩精品中文字幕| 日韩中文第一页| 日韩欧美一区二区三区久久婷婷| 欧美国产精品劲爆| 亚洲精品一二三| 自拍偷拍欧美激情| 欧美1o一11sex性hdhd| 日韩欧美的一区二区| 欧美激情精品久久久久久变态| 亚洲综合色激情五月| 一区二区三区美女| 日本韩国欧美一区二区三区| 国产精品久久久久高潮| 亚洲综合色自拍一区| 色88888久久久久久影院野外| 337p粉嫩大胆色噜噜噜噜亚洲| 中文字幕亚洲电影| 日韩欧美手机在线| 亚洲欧美一区二区久久| 欧美日韩在线播放视频| 成人av免费电影| 日韩精品另类天天更新| 国产.精品.日韩.另类.中文.在线.播放| 国产精品最新在线观看| 免费在线观看视频一区|