首次參與打榜,Grok取得第一名,MiroMind為開源模型的第一。馬斯克為此興奮發文,稱之為最好的benchmark

  FutureX與Prophet Arena:AI智能體未來預測基準的誕生

  不久前,字節跳動 SEED 團隊聯合斯坦福大學、復旦大學、普林斯頓大學共同推出Future X,是全球首個動態實時 LLM 智能體未來預測基準。它從全球200多個高質量網站精選只有下周才會有明確結果的問題,讓AI直面正的未來事件:股票價格的漲跌、體育比賽的勝負、政治選舉的結果、科技公司的戰略走向等。

  這種評估方式的核心優勢非常顯著。AI 必須像人類分析師一樣,基于當前可獲得的信息,運用邏輯推理、趨勢分析和概率計算來做出預測。這一機制極大地推動了 AI 智能體在真實世界復雜場景中的實用能力提升,也成為衡量智能體系統核心智能水平的重要標桿。

  Prophet Arena則是另一個AI預測能力評估平臺,通過實時收集和分析真實世界事件,考察AI模型在不確定性推理、信息整合和概率預測等方面的表現。

  MiroMind如何成功預測未來

  MiroMind 在 FutureX 榜單上表現驚艷。8 月第 3 周,首次參與即獲得第六名的成績。而在 9 月的提交中,更實現了雙重突破:搭載 GPT-5 的 MiroFlow 智能體框架在第 1 周和第 2 周連續奪得榜首,同時搭載自研模型 MiroThinker 的 MiroFlow 均位列前五,力壓眾多國際頂尖機構和閉源商業模型。

1758520209545027.jpg

  在測試中,MiroMind 成功預測了 2025 年 9 月 9 日ATP 男子單打排名第 4-6 位的選手,其難點在于網球排名系統極為復雜,涉及積分計算、比賽結果、時間窗口等多個變量。

  MiroMind 的模型在預測中制定了五步策略:

  1. 制定詳細預測計劃:模型首先展現了戰略規劃能力,制定了系統性的預測方案。

  2. 獲取基礎數據:通過網絡檢索獲取 9 月 1 日的男子網球 TOP 10 排名數據,建立預測基準線。

  3. 理解積分規則:深入研究比賽排名與積分的對應關系,特別對比了 2024 年與 2025 年的 dropping 規則,確保計算一致性。

  4. 動態信息更新:搜索 9 月 1 日之后的比賽成績,并分類處理:對已有結果的比賽,直接更新對應選手排名;對尚未結束的比賽,識別其可能影響。

  5. 概率分析與綜合判斷:多情景分析,針對尚未出結果的比賽,模型分析了6種可能情況;引入博彩網站概率數據,作為外部驗證基準;最終基于 outcome 和 probability 加權計算,得出最可能排名結果。

  MiroMind 還成功預測了 2025 年 9 月 11 日 數字加密貨幣 Solana 將突破的一系列關鍵價格檔位,體現了模型在處理價格波動類問題上的系統建模能力與風險控制水平。這輪預測中,MiroMind 則是制定了六步策略:

  1. 構建市場基準線:聚合 CoinGecko、Coinbase、Binance、Kraken 等多平臺實時數據,明確 Solana 當前價格區間及近期價格走勢,建立精準預測起點;

  2. 量化短期波動空間:基于歷史數據計算年化波動率、平均日內振幅等關鍵指標,評估 Solana 在一天內可能達到的價格區間,判斷各檔位的突破概率;

  3. 梳理外部影響因素:系統檢索 9 月 10 日的宏觀經濟事件(如美國 PPI 發布)、Solana 鏈上動態和潛在生態活動,評估是否存在可能引發劇烈波動的催化因素;

  4. 分析市場情緒信號:提取 OKX、Kraken 等平臺的永續合約資金費率與基差數據,判斷市場是否存在明顯的多空傾斜,作為重要情緒指標參考;

  5. 挑選穩健價格檔位:結合價格分布、風險容差與市場結構,挑選那些在大多數行情路徑下都有可能成立的價格檔位,避開臨界邊緣值,確保預測結果穩健可靠;

  6. 交叉驗證與最終判斷:對比統計結果、衍生品信號與第三方市場預期,最終確定最優預測選項,兼顧穩健性與覆蓋率。

  MiroMind 的登頂并非偶然,而是基于AI預測未來的幾項核心能力:

  · 信息洞察力:能快速抓取、理解和整合海量數據——從股市行情到新聞動態,再到社交輿情。沒有全面信息,預測就是空想。

  · 邏輯推理與趨勢感知:能發現模式、識別因果、判斷趨勢。未來不是憑直覺,而是建立在嚴密邏輯和數據分析之上。

  · 概率與不確定性管理:能量化可能性、權衡風險,在不確定環境下做出最優判斷。未來充滿變數,聰明的預測是概率化的決策。

  · 跨領域整合能力:能把金融、政治、科技、社會等多領域信息融會貫通。未來事件往往是多因素交織,單一視角難以洞察全局。

  建設最好預測大模型和創新者平臺

  MiroFlow 框架在 GAIA-Validation 上也取得了 82.4% 的優異成績,并在 HLE、BrowseComp 以及 xBench-DeepSearch 等基準測試中領先眾多國際對手。更值得關注的是,MiroFlow 提供了完全開源、可復現的框架和配置,致力于建設一個創新者平臺。這個平臺為研究者和開發者提供從基礎框架、模型到工具鏈的完整支持,使大家能夠自由實驗、快速迭代,并在多 Agent 協作、多模態理解等前沿領域進行探索。

1758520126919740.png

  MiroFlow 框架之外,MiroMind 團隊推出的自研旗艦基礎智能體模型(Agent Foundation Model)——MiroThinker,不僅具備強大的推理、決策和多模態理解能力,還能在多 Agent 協作中發揮核心作用,在各類榜單中已成為開源模型的引領者,并不斷縮小與閉源商業模型的差距。MiroThinker 很快將以完全開源的形式向全球開發者和研究者開放,提供可復現的模型和實驗環境。

  陳天橋:持續投入,誠邀全球AI人才

  從盛大,到天橋腦科學研究院,再到All in AI,陳天橋四分之一個世紀以來持續探索人類未來科技的邊界:

  · 虛擬世界的創造者,1999年創辦盛大,開創了中國網絡游戲與網絡文學行業。

  · 人類大腦的探索者,2016年創辦全球最大的私人腦科學機構天橋腦科學研究院,在腦機接口等基礎、前沿研究領域碩果累累。

  · 未來世界的塑造者,開展AI+長期記憶、AI預測未來等全新前沿探索。目前MiroMind 正在探索將長期記憶模塊深度嵌入模型,在復雜、多變的環境中做出更精準可靠的預測,實現真正的時間維度智能。

  陳天橋說:“我們正在全力打造一個全球最好的預測大模型,讓AI記住過去,洞察未來。我們持續歡迎全球志同道合的AI優秀人才加入,共同創造未來。”

中文科技資訊微信二維碼logo

  文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

海報生成中...

[No.X026]
瀏覽

最新新聞

熱門新聞

即時

全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

新聞

市場占比高達35.8%,阿里云引領中國AI云增長

9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業IT

“三位一體”數據保護體系,筑牢企業出海安全“生命

戴爾科技一直致力于通過“三位一體”數據保護體系,為中國企業的數據安全“保駕護航”。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
中文字幕少妇一区二区三区| 亚洲尤物精选| 欧美中文字幕第一页| 国产日韩欧美高清在线| 精品一区二区三区免费视频| 亚洲日本丝袜连裤袜办公室| 国产精品极品在线| 国产成人精品综合在线观看| 亚洲五月综合| 91精品国产色综合| 亚洲欧洲免费| 91精品免费看| 91香蕉国产在线观看软件| 欧美一区二区高清在线观看| 国产精品123区| 毛片一区二区三区| 亚洲.欧美.日本.国产综合在线| 精品国产一区二区三区麻豆免费观看完整版| 香蕉av777xxx色综合一区| 欧美壮男野外gaytube| 91久久精品无嫩草影院| 成人激情直播| 久久久蜜桃一区二区人| 最好看的2019年中文视频| kk眼镜猥琐国模调教系列一区二区| 国产免费视频在线| 日韩精品一区二区三区视频播放| 精品国产一区二区三区四区精华| 中文字幕一区三区| 欧美精品videossex性护士| 国内成人自拍视频| 污污的视频在线观看| 三级不卡在线观看| 老汉色老汉首页av亚洲| 欧美精选午夜久久久乱码6080| 欧美激情国产日韩精品一区18| 亚洲国产精品第一区二区| 欧美一卡2卡3卡4卡无卡免费观看水多多| 91精品蜜臀在线一区尤物| 色婷婷av一区二区三区大白胸| 91久久精品午夜一区二区| 欧美mv日韩mv国产网站| 一区二区三区久久久| 日本小视频在线免费观看| 国产精品美乳一区二区免费| 中文字幕久热精品视频在线| 国产在线视频欧美一区二区三区| 成a人片在线观看| 亚洲国产一区在线| 91.麻豆视频| 久久久综合视频| 欧美日韩中国免费专区在线看| 免费电影一区| 亚洲热av色在线播放| 日本午夜精品理论片a级appf发布| 国产伦精品一区二区三区视频孕妇| 欧美午夜免费| 欧美一级一区| 欧美在线二区| 一个人www视频在线免费观看| 国产精品原创| 欧美伊久线香蕉线新在线| 欧美激情办公室videoshd| 亚洲国产一区二区三区高清| 日韩av一区在线观看| 欧美性生活大片视频| 91精品国产精品| 最近2019年好看中文字幕视频| 欧美一三区三区四区免费在线看| 久久不见久久见免费视频7| 六月天综合网| 在线亚洲+欧美+日本专区| 欧美日本一区二区高清播放视频| 国产成人精品免费久久久久| 麻豆精品一区二区三区| 99久久精品国产亚洲精品| 欧美亚洲国产激情| 欧美日韩在线一二三| 风间由美性色一区二区三区| 91亚洲精品在线| 在线不卡一区二区| 久久不见久久见免费视频7| 九九综合久久| 澳门久久精品| 久久国产中文字幕| 毛片在线网站| 欧美高清你懂得| 欧美成人vr18sexvr| 91在线高清观看| 日本在线视频站| 亚洲精品亚洲人成在线| 亚洲h片在线看| 今天的高清视频免费播放成人| 精品国产乱码久久久久久丨区2区| 91精品国产麻豆| 色综合欧美在线| 99亚洲伊人久久精品影院红桃| 国产youjizz在线| 精品动漫一区二区三区在线观看| 成人亚洲激情网| 日韩有码一区| 亚洲色图视频免费播放| 国产精品国产福利国产秒拍| 国产99精品一区| 色88888久久久久久影院按摩| 日韩国产精品久久久久久亚洲| 国产欧美一区二区白浆黑人| 亚洲偷熟乱区亚洲香蕉av| 91国自产精品中文字幕亚洲| 视频国产精品| 久久综合88| 国产成人av一区二区三区| 国产精品红桃| 国产亚洲欧美另类一区二区三区| 91啪九色porn原创视频在线观看| 国产一区二区三区视频在线| 久久久无码精品亚洲日韩按摩| 国产精品亚洲视频在线观看| 91精品久久久久久久久不口人| 欧美黑人巨大精品一区二区| 欧美国产精品专区| wwww国产精品欧美| 国产福利片在线观看| 都市激情久久| 亚洲精品影院| 99久re热视频这里只有精品6| 欧美色精品天天在线观看视频| 成人乱码手机视频| 国产精品亚洲片夜色在线| 国产成人精品亚洲线观看| 在线观看视频一区二区| 欧美性xxxxx极品少妇| 国产成人精品一区二区三区在线| 日本麻豆一区二区三区视频| 国产一区在线免费观看| 精品国产一区二区三区四区| 91中文精品字幕在线视频| 国产成人免费在线观看| 高清久久精品| 伊人av综合网| 国产精品扒开腿做爽爽爽视频软件| 国产成人精品在线| 亚洲日韩中文字幕一区| 欧美激情在线免费观看| 国产乱码精品一区二区三区四区| 国产经典欧美精品| 日韩欧美中文字幕在线视频| 日韩欧美亚洲v片| 后进极品白嫩翘臀在线播放| 韩日成人影院| 国产成人超碰人人澡人人澡| 久久亚洲高清| 久久精品99久久久| 欧美精品18videos性欧| 91成品人片a无限观看| 狠狠色综合日日| 超碰97人人人人人蜜桃| se在线电影| 亚洲男人天堂2019| 日韩欧美精品在线不卡| 成人在线亚洲| 97久久中文字幕| 精品在线观看一区二区| 米奇777四色精品人人爽|