Seed-OSS 使用了 12 萬億(12T)tokens 進行訓練,并在多個主流開源基準測試中取得了出色的表現。

  這三個模型均以 Apache-2.0 許可證發布,允許研究人員和企業開發者自由使用、修改和再分發。

  主要特性:

  靈活的推理預算控制:允許用戶根據需要靈活調整推理長度。這種對推理長度的動態控制能力,可在實際應用場景中提升推理效率。

  增強的推理能力:在保持平衡且優秀的通用能力的同時,針對推理任務進行了特別優化。

  智能體能力:在涉及工具使用和問題解決等智能體任務中表現突出。

  研究友好:考慮到在預訓練中加入合成指令數據可能會影響后續研究,字節同時發布了含有與不含指令數據的預訓練模型,為研究社區提供了更多樣化的選擇。

  原生長上下文:在訓練中原生支持最長 512K 的上下文窗口。

  模型架構

  Seed-OSS-36B 的架構結合了多種常見的設計選擇,包括因果語言建模、分組查詢注意力(Grouped Query Attention)、SwiGLU 激活函數、RMSNorm 和 RoPE 位置編碼。

  每個模型包含 360 億參數,分布在 64 層網絡中,并支持 15.5 萬詞表。

  其最具代表性的特性之一是原生長上下文能力,最大上下文長度可達 512k tokens,能夠在不損失性能的情況下處理超長文檔和推理鏈。

  這一長度是 OpenAI 最新 GPT-5 模型系列的兩倍,大約相當于 1600 頁文本。

  另一個顯著的特性是引入了推理預算,它允許開發者在模型給出答案之前,指定模型應執行多少推理過程。

  這一設計在近期其他一些開源模型中也有所體現,例如 Nvidia 新推出的 Nemotron-Nano-9B-v2。

  在實際應用中,這意味著團隊可以根據任務的復雜性和部署的效率需求來調節性能。

  推薦的預算值為 512 tokens 的倍數,其中 0 表示直接輸出答案的模式。

  結果

  基準測試結果顯示,Seed-OSS-36B 位列當前性能較強的開源大模型之列。

  Seed-OSS-36B-Base

  含合成數據版本的 Base 模型在 MMLU-Pro 上取得 65.1 得分,在 MATH 上取得 81.7 得分。非合成基礎版本雖然在許多方面略微落后,但也具有競爭力。

  Seed-OSS-36B-Instruct

  Instruct 版本在多個領域都取得了 SOTA 成績。

  數學與推理:Seed-OSS-36B-Instruct 在 AIME24 上取得 91.7% 的成績,在 BeyondAIME 上取得 65,均代表開源領域的最新 SOTA 水平。

  代碼能力:在 LiveCodeBench v6 上,Instruct 模型得分 67.4,同樣刷新 SOTA 紀錄。

  長上下文處理:在 RULER(128K 上下文長度)測試中,該模型達到 94.6,創下開源模型的最高分。

  思考預算

  用戶可以靈活指定模型的推理預算。下圖展示了在不同任務中,隨著推理預算變化而產生的性能曲線。

  對于較簡單的任務(如 IFEval),模型的思維鏈較短,隨著推理預算的增加,分數會出現一定波動。

  而在更具挑戰性的任務(如 AIME 和 LiveCodeBench)中,模型的思維鏈較長,分數則會隨著推理預算的增加而提升。

  模型在運行過程,會提醒用戶 token 使用情況:

  Got it, let's try to solve this problem step by step. The problem says ... ...

  I have used 129 tokens, and there are 383 tokens remaining for use.

  Using the power rule, ... ...

  I have used 258 tokens, and there are 254 tokens remaining for use.

  Alternatively, remember that ... ...

  I have used 393 tokens, and there are 119 tokens remaining for use.

  Because if ... ...

  I have exhausted my token budget, and now I will start answering the question.

  To solve the problem, we start by using the properties of logarithms to simplify the given equations: (full answer omitted).

  如果未設置推理預算(默認模式),Seed-OSS 將以無限長度啟動推理。

  如果指定了推理預算,字節建議用戶優先選擇 512 的整數倍數(如 512、1K、2K、4K、8K 或 16K),因為模型已在這些區間上進行了大量訓練。

  當推理預算為 0 時,模型會被指示直接輸出答案;對于低于 512 的預算,字節也建議統一設為 0。

中文科技資訊微信二維碼logo

  文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

海報生成中...

瀏覽

最新新聞

熱門新聞

即時

全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

新聞

市場占比高達35.8%,阿里云引領中國AI云增長

9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
成人四虎影院| 91精品国产免费久久久久久| 日韩一区二区视频在线观看| 中文有码一区| 成人在线免费观看| **精品中文字幕一区二区三区| 亚洲国产成人午夜在线一区| 国产激情偷乱视频一区二区三区| 欧美激情精品久久久久| 久久综合狠狠综合久久综合88| 91久久亚洲| 中文字幕无线精品亚洲乱码一区| 精品视频在线你懂得| 99热这里只有成人精品国产| 91精品久久久久久久久| 国产精品欧美久久久久一区二区| 青青草97国产精品麻豆| 日本不卡视频在线| 影院欧美亚洲| 亚洲精品综合久久中文字幕| 国产在线观看一区二区三区| 高清shemale亚洲人妖| 亚洲专区一二三| 国内精品视频免费| av在线私库| 亚洲成a人v欧美综合天堂麻豆| 成人午夜电影在线播放| 四虎国产精品永久在线国在线| 国产欧美一区二区三区在线| 蜜桃av色综合| 国产不卡视频在线| 欧美激情亚洲另类| 国产精品私人影院| av电影天堂一区二区在线观看| 91麻豆精品国产91久久久更新资源速度超快| 国产高清无密码一区二区三区| 国产高清视频一区三区| 欧美一区二粉嫩精品国产一线天| 日韩精品五月天| 欧美videossex| 日韩欧美第二区在线观看| 国产精品免费一区二区三区在线观看| 国产精品一二三产区| 国产激情视频一区| 福利精品一区| 国产精品欧美在线| 欧美不卡在线| 精品免费在线| 国产一区精品在线| 视频二区一区| 黑人中文字幕一区二区三区| 91免费观看在线| 日韩精品伦理第一区| 日本三级在线视频| 国产一区国产二区国产三区| 国产91精品青草社区| 亚洲一区久久| aaa在线播放视频| 欧美办公室脚交xxxx| 精品三级在线观看视频| 少女频道在线观看免费播放电视剧| 精品成人18| 99视频在线播放| kk眼镜猥琐国模调教系列一区二区| 国产精品99久久久久久动医院| 日韩av一级大片| 亚洲不卡视频| 成人99免费视频| 精品伊人久久久久7777人| 欧美精品一区二区不卡| 亚洲成色www久久网站| 久久香蕉综合色| 亚洲影院色在线观看免费| 国产农村妇女毛片精品久久莱园子| 色在线免费观看| 亚洲人成久久| 欧美日韩免费观看中文| 国产91精品高潮白浆喷水| 国内自拍一区| 老司机深夜福利在线观看| 国产不卡视频在线| 99精品视频中文字幕| 久久久久久艹| 精品视频在线播放一区二区三区| 成人看片毛片免费播放器| 女一区二区三区| 欧美激情在线狂野欧美精品| 婷婷色在线资源| 欧美精品www在线观看| 日韩理论电影院| 91免费版在线| 粉嫩一区二区三区性色av| 欧美三级乱人伦电影| 日本精品视频在线观看| 国产欧美日韩丝袜精品一区| 国内精品伊人久久久久av影院| 日韩精品一级| 欧美狂野另类xxxxoooo| 日韩久久免费av| 亚洲最大av网| 国产精品高潮呻吟久久久久| 日韩欧美三级在线| 一区二区网站| 亚洲欧美日韩国产yyy| 综合av在线| www.成人影院| 欧美综合视频在线观看| 中文字幕精品一区| 欧美伊人久久| 97超级碰在线看视频免费在线看| 日韩三级精品电影久久久| 国产精品久久久久久久久久白浆| 亚洲摸下面视频| 亚洲国产精品av| 亚洲91精品| 18videosex性欧美麻豆| 成人h视频在线| 国产一区二区三区在线观看免费| av日韩在线免费观看| 久久久国产精品x99av| 国产精品影片在线观看| 国产丝袜高跟一区| 在线精品91av| 亚洲国产视频直播| 95av在线视频| 成人做爰69片免费看网站| 亚洲一级一级97网| 日韩在线观看网址| 尤物精品在线| 91视频-88av| 久久免费视频66| 色悠悠国产精品| 色婷婷国产精品综合在线观看| 91九色露脸| 亚洲精品成人a8198a| 亚洲色图制服诱惑| 国产v综合v| 亚洲2区在线| 亚洲国产激情一区二区三区| 亚洲a成v人在线观看| 日韩福利影视| 亚洲精品美女久久久久| 日韩av电影免费观看高清完整版| 日本免费新一区视频| 91在线精品一区二区三区| 久久久久久久久久久网站| 国产aⅴ夜夜欢一区二区三区| 亚洲成人精品视频| 九九热在线精品视频| 美女被久久久| 精品按摩偷拍| 欧美乱大交xxxxx| 91精品一区| 亚洲国产岛国毛片在线| 午夜激情电影在线播放| 欧美日韩国产大片| 亚洲免费电影一区| 成人在线观看免费网站| 秋霞午夜一区二区三区视频| 亚洲一区二区国产| 91国自产精品中文字幕亚洲| 国产精品视频久久| 国产伦精品一区二区三区免| 精品免费视频|