国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

  • 首頁 > 云計算頻道 > 大模型

    1000萬上下文!新開源多模態大模型,單個GPU就能運行

    2025年04月07日 09:22:22 來源:AIGC開放社區公眾號

      今年2月初,谷歌發布的Gemini2.0Pro支持200萬上下文,震驚了整個大模型領域。

      僅過了2個月,Meta最新開源的Llama4Scout就將上下文擴展至1000萬,整整提升了5倍開啟千萬級時代。對于這么大的窗口大家可能沒什么概念,普通版本的《戰爭與和平》大概有1300頁100萬字左右,Llama4Scout可以一次性解讀這本書。

      如果你開發完一個項目想讓大模型幫你檢查一下是否有BUG、可優化的地方,只要代碼少于1000萬token,Llama4Scout都能幫你解決。驚不驚喜,整個代碼庫都成提示詞了~

      Llama4Scout簡單介紹

      Llama4Scout是一個專家混合架構模型,一共有1090億參數。其中,有170億活躍參數和16個專家路由,能在單個***GPU上使用,具備原生多模態的能力,可以處理文本和圖像,支持最多8張圖像的輸入。

      架構創新方面,Llama4Scout使用了無位置交叉嵌入的交錯注意層NoPE。傳統的Transformer架構通過位置編碼將每個單詞的位置信息嵌入到模型中,從而使模型能夠區分不同位置的單詞。

      但這種顯式的位置編碼方法在長度泛化方面存在局限性。例如,當模型在訓練時接觸到的序列長度較短,在測試時需要處理更長的序列時,顯式位置編碼可能無法有效地泛化到這些未見過的長度。而NoPE可以很好解決這個難題。

      NoPE的設計非常簡潔,就是直接移除了Transformer模型中的位置編碼部分。這意味著使用NoPE架構的模型中,輸入序列的單詞不會被附加任何顯式的位置信息。模型僅依賴于其自注意力機制和前饋網絡來處理序列數據。

      在NoPE模型的第一層中,通過特定的權重設置,模型可以恢復輸入序列的絕對位置信息。模型可以通過自注意力機制和前饋網絡將絕對位置信息寫入隱藏狀態。這一過程依賴于模型的因果注意力掩碼和softmax函數,使得模型能夠從輸入序列中恢復絕對位置信息。

      在后續層中,NoPE可以實現相對位置編碼。通過特定的權重設置,模型可以使得注意力機制依賴于單詞之間的相對距離,而不是絕對位置。NoPE可以捕捉到單詞之間的相對位置信息,從而實現相對位置編碼。

      根據測試數據顯示,NoPE在長度泛化方面表現出色,超過了所有顯式位置編碼方法。在多種推理和數學任務中,NoPE能夠成功地從較短的訓練序列泛化到更長的測試序列。

      例如,在加法任務中,NoPE在長度為40的序列上的準確率達到了0.69,而其他位置編碼方法的準確率均低于0.55。這表明NoPE能夠更好地捕捉序列中的數學規律,并將其應用于更長的序列。

      NoPE的計算效率也更高。由于不需要計算額外的注意力機制項,因此在訓練和推理過程中都能節省時間和計算資源,尤其是在需要處理長序列的任務中。

      所以,Llama4Scout擁有1000萬上下文卻能在單個***使用,NoPE發揮了非常大的作用。

      訓練數據方面,Llama4Scout使用了30萬億token數據,包括文本、圖像、視頻,比之前開源的Llama3高兩倍。

      此外,Llama4Scout在預訓練階段還特別注重多語言能力的培養,在200種語言上進行了訓練,其中包括超過100種擁有超過10億標記的語言,使得Llama4Scout在處理跨語言任務時具備了強大的語言理解和生成能力。

      媲美DeepSeek V3的新模型

      除了Llama4Scout,Meta還開源了一個模型Llama4Maverick,同樣是專家混合模型,一共有4000億參數。其中,170億參數處于活躍狀態和128個專家路由。同樣可以在單個***運行,不過只有100萬上下文。

      Maverick使用的訓練方法和數據與Scout差不多。根據公布的測試數據顯示,Maverick在MMLU/Pro、GPQA、DocVQA、MathVista超過了谷歌的Gemini2.0和OpenAI的GPT-4o,可以媲美DeepSeek最新開源的V3模型。

      訓練創新方面,Meta在訓練Maverick時,用了一種新辦法來優化訓練流程包括三個步驟:先進行輕量級監督微調(SFT),接著開展在線強化學習(RL),最后做輕量級直接偏好優化(DPO)。

      但在這個過程中,有一個重要問題:SFT和DPO這兩個步驟,可能會對模型限制得太厲害。這就會讓模型在在線RL這個階段沒辦法充分地去探索各種可能性,結果就是模型在做推理、編碼以及數學相關任務的時候,算得沒那么準表現不佳。

      為了解決這個難題,Meta剔除了超過50%被標記為“簡單”的數據,并在剩余更具挑戰性的數據集上進行輕量級SFT。在隨后的多模態在線RL階段,通過精心挑選更具挑戰性的提示,實現了性能的顯著提升。

      此外,Meta實施了連續在線RL策略,即交替進行模型訓練,然后利用訓練好的模型持續篩選并僅保留中等至較難難度的提示。

      事實證明,這種策略在計算成本和準確性的權衡方面非常有效。接著進行了輕量級DPO,以處理與模型響應質量相關的極端情況,有效地在模型的智能和對話能力之間實現了良好的平衡

      正訓練2萬億參數教師模型——Llama4Behemoth

      Meta表示,Scout和Maverick只是開源的首批Llama4系列模型。正在訓練一個總參數2萬億,活躍參數2880億活躍參數和16個專家路由的教師模型——Llama4Behemoth。

      Llama4Behemoth主要用于蒸餾、微調小模型,Llama4Maverick便是通過它完成的。為了實現性能的最大化,Meta對SFT數據進行大幅刪減,要剪掉95%的數據,而較小的模型僅需剪掉50%,以此來實現對質量和效率的必要關注。

      由于兩萬億參數模型前所未有的規模,為其擴展強化學習(RL)還需要對底層的強化學習基礎設施進行改造。

      Meta開發了一個完全異步的在線強化學習訓練框架,增強了靈活性,F有的分布式訓練框架為了將所有模型堆疊到內存中,犧牲了計算內存。新基礎設施能夠將不同模型靈活分配到單獨的GPU上,根據計算速度在多個模型之間平衡資源,訓練效率比上一代提升了大約10倍。

      根據實驗數據顯示,Llama4Behemoth在MMLU Pro、GPQA、MATH-500等測試的數據比GPT-4.5、Claude Sonnet3.7、Gemini2.0Pro更好。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    香蕉久久久久久久av网站| 亚洲国产精品综合久久久| 女海盗2成人h版中文字幕| 欧美亚洲动漫制服丝袜| 91精品国产成人观看| 精品一区二区三区久久久| 久久亚洲导航| 日本三级韩国三级久久| 粉嫩av一区二区三区免费野| 欧美午夜精品一区二区三区电影| 成人a在线视频| 国产精品男女| 日韩不卡一区二区| 女子免费在线观看视频www| 亚洲一品av免费观看| 96sao精品免费视频观看| 国产精品福利在线| 欧美福利视频导航| av在线最新| 国内外成人在线| 成人免费视频网站在线观看| 久久婷婷一区| 99久久夜色精品国产亚洲1000部| 在线午夜精品| 国产成人精品一区二区在线| 欧美三级情趣内衣| 综合136福利视频在线| 一区二区三区 在线观看视| 欧美日韩美女在线观看| 国产精品午夜一区二区三区| 国产精品腿扒开做爽爽爽挤奶网站| 久久亚洲精品国产精品紫薇| 香蕉视频在线播放| 久久久久久久久久久免费精品| 国产一区 二区 三区一级| 一区二区在线免费播放| 国产精品视频一区二区三区不卡| 91精品成人久久| 老司机精品视频在线观看6| 岛国精品在线观看| 日韩欧美国产一区二区在线播放| 国产精品夜夜夜| 欧美乱妇一区二区三区不卡视频| 中文字幕视频一区二区在线有码| 欧美激情国内偷拍| 国产精品久久久久久久裸模| 中文字幕中文乱码欧美一区二区| 日本一区二区三区四区在线视频| 麻豆av一区二区三区久久| 欧美日韩亚洲精品内裤| 91在线观看下载| 久久影院一区二区三区| 一区二区三区视频在线观看视频| 久久久久久国产精品三级玉女聊斋| 国产成人鲁色资源国产91色综| 日韩精品视频在线免费观看| 久久精品99无色码中文字幕| 亚洲精品字幕| 日韩一级片网站| 销魂美女一区二区三区视频在线| 亚洲一区二区三区成人在线视频精品| 精品无人区卡一卡二卡三乱码免费卡| 日韩美女国产精品| av电影免费在线观看| 国产乱人伦偷精品视频不卡| 欧美午夜片在线观看| 亚洲69av| 丁香花在线电影小说观看| 精品国产乱码一区二区三区| 午夜激情视频在线| 国产精品国精产品一二| 亚洲aⅴ怡春院| 久久色.com| 久久精品国产久精国产爱| 精品一区二区三区视频日产| 懂色av中文一区二区三区| 国产亚洲久久| 欧美精品一区二区三区四区| 麻豆传媒视频在线观看| 精品国产青草久久久久福利| 91丝袜美腿美女视频网站| **亚洲第一综合导航网站| 青青草成人在线| 国产精品视频在线看| 国产精品欧美一区二区三区奶水| 国产伦理精品| 毛片网站在线免费观看| 欧美人牲a欧美精品| 亚洲第一视频网站| 亚洲欧美经典视频| 欧美电影免费看| 日本久久一区二区| 欧美日韩视频不卡| 欧美精品久久天天躁| 亚洲在线第一页| 亚洲精品videossex少妇| 欧美精品vⅰdeose4hd| 欧美性视频一区二区三区| 黄色一级大片在线免费看产| www.成人爱| 中文字幕在线看视频国产欧美在线看完整| 欧美bbbxxxxx| 久久精品道一区二区三区| 久久久久久91| 国产欧美日本一区二区三区| 在线精品视频在线观看高清| 欧美极品aⅴ影院| 99re8这里有精品热视频免费| 成人免费视频网站入口| 日韩欧美不卡在线观看视频| 国产精品女主播| 国产精品久久久久77777丨| 国产激情视频一区二区在线观看| 国产精品久久久久久网站| 国产日韩影视精品| 欧美日韩国产一二| 中文字幕在线播放| 老司机精品视频在线观看6| 国产亚洲在线| 中文亚洲免费| 日韩和欧美一区二区三区| 亚洲小说欧美另类社区| xvideos成人免费中文版| 国产精品色在线| 久久色精品视频| 欧美性一区二区三区| 天海翼亚洲一区二区三区| 亚洲在线第一页| 亚洲福利视频网| 欧美风情在线观看| 91精品视频免费| 色综合久久88色综合天天6| 亚洲精品中文字幕| 久久亚洲精品成人| 欧美一区二区三区视频免费| 一本大道久久精品懂色aⅴ| 国产精品久久久久久久久久久免费看| 99ri日韩精品视频| 国产一区欧美一区| 丰满放荡岳乱妇91ww| 亚洲aⅴ怡春院| 清纯唯美亚洲综合| 91色视频在线观看| 岛国精品一区二区| 日韩女优视频免费观看| 欧美精品xxxxbbbb| 影音先锋日韩资源| 国内精品久久久久影院 日本资源| 国产精品秘入口| 国产精品旅馆在线| 国产精品nxnn| 成人黄色在线观看| 一区二区高清视频在线观看| 久久精品99久久| 欧美极品少妇xxxxⅹ裸体艺术| 国产日韩精品入口| 热久久免费国产视频| 日本麻豆一区二区三区视频| av片在线免费观看| 尤物九九久久国产精品的特点| www.成人.com| 日韩国产精品一区二区| 国产激情视频一区二区在线观看| 欧美国产中文高清|