国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

  • 首頁 > 云計算頻道 > 大模型

    昆侖萬維開源2千億稀疏大模型天工MoE,全球首創能用4090推理

    2024年06月03日 18:43:10 來源:中文科技資訊

      2024年6月3日,昆侖萬維宣布開源 2 千億稀疏大模型 Skywork-MoE , 性能強勁, 同時推理成本更低。Skywork-MoE 基于之前昆侖萬維開源的 Skywork-13B 模型中間 checkpoint 擴展而來,是首個完整將 MoE Upcycling 技術應用并落地的開源千億 MoE大模型,也是首個支持用單臺 4090 服務器推理的開源千億 MoE大模型。

      開源地址:

      Skywork-MoE 的模型權重、技術報告完全開源,免費商用,無需申請:

      • 模型權重下載:

      ○ https://huggingface.co/Skywork/Skywork-MoE-base

      ○ https://huggingface.co/Skywork/Skywork-MoE-Base-FP8

      • 模型開源倉庫:https://github.com/SkyworkAI/Skywork-MoE

      • 模型技術報告:https://github.com/SkyworkAI/Skywork-MoE/blob/main/skywork-moe-tech-report.pdf

      • 模型推理代碼:(支持 8x4090 服務器上 8 bit 量化加載推理) https://github.com/SkyworkAI/vllm

      模型架構:

      本次開源的 Skywork-MoE 模型隸屬于天工 3.0 的研發模型系列,是其中的中檔大小模型(Skywork-MoE-Medium),模型的總參數量為 146B,激活參數量 22B,共有 16 個 Expert,每個 Expert 大小為 13B,每次激活其中的 2 個 Expert。

      天工 3.0 還訓練了 75B (Skywork-MoE-Small) 和 400B (Skywork-MoE-Large)兩檔 MoE 模型,并不在此次開源之列。

      模型能力:

      我們基于目前各大主流模型評測榜單評測了 Skywork-MoE,在相同的激活參數量 20B(推理計算量)下,Skywork-MoE 能力在行業前列,接近 70B 的 Dense 模型。使得模型的推理成本有近 3 倍的下降。同時 Skywork-MoE 的總參數大小比 DeepSeekV2 的總參數大小要小 1/3,用更小的參數規模做到了相近的能力。

      技術創新:

      為了解決 MoE 模型訓練困難,泛化性能差的問題,相較于 Mixtral-MoE, Skywork-MoE 設計了兩種訓練優化算法:

      1. Gating Logits 歸一化操作

      我們在 Gating Layer 的 token 分發邏輯處新增了一個 normalization 操作,使得 Gating Layer 的參數學習更加趨向于被選中的 top-2 experts,增加 MoE 模型對于 top-2 的置信度:

      2. 自適應的 Aux Loss

      有別于傳統的固定系數(固定超參)的 aux loss, 我們在 MoE 訓練的不同階段讓模型自適應的選擇合適的 aux loss 超參系數,從而讓 Drop Token Rate 保持在合適的區間內,既能做到 expert 分發的平衡,又能讓 expert 學習具備差異化,從而提升模型整體的性能和泛化水平。在 MoE 訓練的前期,由于參數學習不到位,導致 Drop Token Rate 太高(token 分布差異太大),此時需要較大的 aux loss 幫助 token load balance;在 MoE 訓練的后期,我們希望 Expert 之間仍保證一定的區分度,避免 Gating 傾向為隨機分發 Token,因此需要較低的 aux loss 降低糾偏。

      訓練 Infra

      如何對 MoE 模型高效的進行大規模分布式訓練是一個有難度的挑戰,目前社區還沒有一個最佳實踐。Skywork-MoE 提出了兩個重要的并行優化設計,從而在千卡集群上實現了 MFU 38% 的訓練吞吐,其中 MFU 以 22B 的激活參數計算理論計算量。

      1. Expert Data Parallel

      區別于 Megatron-LM 社區已有的 EP(Expert Parallel)和 ETP(Expert Tensor Parallel)設計,我們提出了一種稱之為 Expert Data Parallel 的并行設計方案,這種并行方案可以在 Expert 數量較小時仍能高效的切分模型,對 Expert 引入的 all2all 通信也可以最大程度的優化和掩蓋。相較于 EP 對 GPU 數量的限制和 ETP 在千卡集群上的低效, EDP 可以較好的解決大規模分布式訓練 MoE 的并行痛點,同時 EDP 的設計簡單、魯棒、易擴展,可以較快的實現和驗證。

      一個最簡單的 EDP 的例子,兩卡情況下 TP = 2, EP = 2, 其中 Attention 部分采用 Tensor Parallel , Expert 部分采用 Expert Parallel

      2. 非均勻切分流水并行

      由于 first stage 的 Embedding 計算和 last stage 的 Loss 計算,以及 Pipeline Buffer 的存在, 流水并行下均勻切分 Layer 時的各 stage 計算負載和顯存負載均有較明顯的不均衡情況。我們提出了非均勻的流水并行切分和重計算 Layer 分配方式,使得總體的計算/顯存負載更均衡,約有 10% 左右的端到端訓練吞吐提升。

      比較均勻切分和非均勻切分下的流水并行氣泡:對于一個 24 層 Layer 的 LLM, (a) 是均勻切分成 4 個 stage,每個 stage  的 layer 數量是:[6, 6, 6, 6].(b) 是經過優化后的非均勻切分方式,切成 5 個 stage, 每個 stage 的 layer 數量是:[5, 5, 5, 5, 4] , 在中間流水打滿的階段,非均勻切分的氣泡更低。

      MoE Know-how

      此外,Skywork-MoE 還通過一系列基于 Scaling Laws 的實驗,探究哪些約束會影響 Upcycling 和 From Scratch 訓練 MoE 模型的好壞。

      一個可以遵循的經驗規則是:如果訓練 MoE 模型的 FLOPs 是訓練 Dense 模型的 2 倍以上,那么選擇 from Scratch 訓練 MoE 會更好,否則的話,選擇 Upcycling 訓練 MoE 可以明顯減少訓練成本。

      4090 推理

      Skywork-MoE 是目前能在 8x4090 服務器上推理的最大的開源 MoE 模型。8x4090 服務器一共有 192GB 的 GPU 顯存,在 FP8 量化下(weight 占用 146GB),使用我們首創的非均勻 Tensor Parallel 并行推理方式,Skywork-MoE 可以在合適的 batch size 內達到 2200 tokens/s 的吞吐。天工團隊完整開源了相關的推理框架代碼和安裝環境,詳情參見:https://github.com/SkyworkAI/Skywork-MoE

      結語

      我們希望本次開源的 Skywork-MoE 模型、技術報告和相關的實驗結果可以給開源社區貢獻更多的 MoE 訓練經驗和 Know-how,包括模型結構、超參選擇、訓練技巧、訓練推理加速等各方面, 探索用更低的訓練推理成本訓更大更強的模型,在通往 AGI 的道路上貢獻一點力量。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    [No.H002]

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    国产三区二区一区久久| 日韩精品水蜜桃| 国语自产精品视频在线看抢先版结局| av老司机在线观看| 欧美一区二区视频97| 老司机精品视频一区二区三区| 激情五月色综合国产精品| 国模冰冰炮一区二区| 欧美一级高清免费播放| 911精品美国片911久久久| 亚洲视频观看| 日韩免费高清视频| 久久一区91| 国产日韩欧美日韩大片| 夜夜精品视频一区二区| 日韩av二区| 免费看成人片| 九九亚洲视频| 国产欧美日韩一区二区三区在线| 久久6免费高清热精品| 亚洲国产欧美在线观看| 久草精品视频| 日韩中文字幕1| 色偷偷88欧美精品久久久| 成人h动漫精品一区二区| 欧美性生交大片免费| 电影av在线| 99精品国产福利在线观看免费| 国内精品久久久久久久果冻传媒| 亚洲第一福利网| 欧美三级蜜桃2在线观看| 精品欧美午夜寂寞影院| 一区二区电影| 欧美三级视频在线观看| 狠狠狠色丁香婷婷综合久久五月| 亚洲欧美中文另类| 大片免费在线观看| 99天天综合性| 日韩成人黄色av| 麻豆福利在线观看| 偷拍中文亚洲欧美动漫| 中文字幕国产日韩| 国产人久久人人人人爽| 北条麻妃99精品青青久久| 国产精品6699| 91精品国产色综合久久不卡蜜臀| 国产jizzjizz一区二区| 亚洲国产一区二区三区| 91久久综合| 免费在线观看黄色| 久久综合婷婷| 国产伦精品一区二区三区免费优势| 黄色羞羞视频在线观看| 亚洲品质自拍| 成人免费网站视频| 久久免费视频这里只有精品| heyzo高清国产精品| 亚洲精品av在线| 精品亚洲国产成人av制服丝袜| 日本成人小视频| 久久久久久夜精品精品免费| 成人av免费在线观看| 电影一区二区| 亚洲香蕉av在线一区二区三区| 欧美一区二区三区白人| 在线观看视频日韩| 北条麻妃在线一区二区免费播放| 欧美日韩中文国产| 91精品国产电影| 狠狠色伊人亚洲综合成人| 玉足女爽爽91| 红杏成人性视频免费看| 久久日文中文字幕乱码| 38少妇精品导航| 噜噜噜在线观看免费视频日韩| 欧美电影免费观看高清| 亚洲精品黄网在线观看| 国产精品久久久久久久7电影| 久久精品一区四区| 91黄色免费网站| 欧美日韩国产中文精品字幕自在自线| 欧美激情一区| 日韩午夜在线观看| 亚洲成年网站在线观看| 亚洲精品一区二区三区四区高清| 久久av一区二区三区亚洲| 亚洲精品v亚洲精品v日韩精品| 欧美人在线视频| 91理论片午午论夜理片久久| 国产精品99精品一区二区三区∴| 日韩欧美亚洲国产另类| 国产成人在线观看免费网站| 国产精品亚洲自拍| av小说在线播放| 国产欧美精品久久| 中文字幕乱码在线播放| 国产美女娇喘av呻吟久久| 免费欧美网站| 精品久久久久久中文字幕| 欧美激情videoshd| 欧美精品videos| www.久久草| 国产欧美精品一区| 影音先锋中文字幕一区二区| 国模无码大尺度一区二区三区| 精品视频在线看| 黄页网站一区| 欧美人体一区二区三区| 亚洲欧美日韩精品久久久久| 米奇精品一区二区三区| 精品视频久久| 一区二区三区精品久久久| 国产精品麻豆va在线播放| 久久精品免费| 91丨九色丨蝌蚪富婆spa| 国产午夜精品久久久久免费视| 亚洲va韩国va欧美va| 日韩成人综合网| 国产亚洲欧美aaaa| 久久93精品国产91久久综合| 99精品视频一区二区| 久久精品一二三区| 色天天综合狠狠色| 久久久加勒比| 99久久国产综合精品成人影院| 亚洲日韩欧美视频一区| 国产精品久久久久久久久久辛辛| 一级日本不卡的影视| 久久国产生活片100| 搡老女人一区二区三区视频tv| 欧美成人激情视频| 欧美国产日韩中文字幕在线| 久久国产精品免费一区二区三区| 亚洲天天做日日做天天谢日日欢| 日韩和欧美的一区二区| 激情综合网最新| 欧美日韩午夜激情| 欧美xxxxxxxx| zzzwww在线看片免费| 日韩午夜激情视频| 自拍偷拍亚洲欧美| 欧美国产美女| 91丨porny丨首页| 91精品国产色综合久久不卡蜜臀| 亚洲免费av高清| 中文字幕在线观看不卡| 97超级碰碰人国产在线观看| 香蕉久久精品| 91人人爽人人爽人人精88v| 91香蕉视频在线| jizzjizz亚洲| 日韩欧美二区三区| 亚洲人成伊人成综合图片| 国产精品久久久久久久免费观看| sdde在线播放一区二区| 久久久久久**毛片大全| 中文字幕佐山爱一区二区免费| 69视频在线| 成人精品免费视频| 中文字幕国产精品久久| 国内外成人在线视频| 自拍偷拍免费精品| 色悠久久久久综合先锋影音下载| 亚洲.国产.中文慕字在线|