評估方法說明:

  1.使用pass@1指標,結合bash、編輯器工具對Opus 4.1、Opus 4和Sonnet 4進行測試。在10次試驗中取平均值,單次嘗試修補,測試時不進行額外計算,采用核采樣(nucleus sampling)方法,設置top_p值為0.95。

  2.本文報告的所有分數均基于默認Agent框架("Terminus 1"),并在5次試驗中取平均值。

  3.Claude在MMMLU上的得分,取自14種非英語語言得分的平均值。

  4.Opus 4.1、Opus 4和Sonnet 4在AIME上的測試采用核采樣方法,設置top_p值為0.95。

  全新的Claude 4模型從根本上改變了團隊處理復雜項目的方式。對于那些需要持續投入精力和深厚專業知識的大型企業而言,這一變革尤為顯著。Claude 4雙模推理模型支持客戶在即時響應與深度推演間靈活選擇,這些模型可徹底改變企業將AI應用于復雜任務和日常高容量業務操作的方式。兩款模型均旨在為跨數千個步驟的多步驟工作流,提供更強大、更自主的AI Agents支持。Claude Opus 4.1也是Anthropic迄今為止功能最強的模型,編程能力冠絕業界。

  Claude Opus 4.1如同一位精明能干的協作伙伴,Agentic搜索與研究、內容創作以及記憶和上下文管理方面表現出色,能夠綜合提煉深刻見解、產出高質量內容并實現高效總結。

  Claude Opus 4.1可直接替代Opus 4,它在實際編碼和Agent任務中,展現出更出色的性能和精準度。Anthropic表示,Claude Opus 4.1是其迄今為止最智能的模型,且在編碼和Agent領域處于行業領先地位。該模型具備先進的編碼能力,能夠獨立規劃并執行復雜的端到端開發任務,同時根據用戶風格進行調整,并始終保持高質量輸出。此外,該模型還改進了前端代碼生成功能,在有效處理復雜邏輯的同時,能輸出高質量的視覺效果。

  另外,Opus 4.1具備出色的長期任務處理能力和復雜問題解決能力,是持續推理和長鏈行動中的理想虛擬協作伙伴。它還能提升AI Agents的性能,使其能夠以極高的準確度應對復雜的多步驟任務。

  Claude Sonnet 4則以高效性著稱,將敏捷思維與實用智能完美融合,適用于各類項目。憑借速度與性能的平衡,Claude Sonnet 4可在各項任務間無縫切換,秉持務實態度,確保首次執行即能圓滿完成。

  Claude Sonnet 4在編碼和推理能力上,均超越了其前代產品Claude Sonnet 3.7,并在性能與成本優化之間實現了平衡,非常適合處理大批量應用場景,成為大多數生產應用的理想之選。Claude Sonnet 4的應用范圍十分廣泛,既能為實時客戶支持Agent提供支持,也能處理代碼審查、漏洞修復等日常開發任務,還可作為特定任務的子Agent同時處理搜索、數據分析或內容合成等多項任務。旅游和酒店業客戶可以借助Claude Sonnet 4實時處理客戶請求,并以近乎實時的速度提供個性化回復。

  這兩款模型均具備 "深度思考"功能,使Claude能夠在深度推理和行動執行兩種模式間靈活切換。Claude可根據需要進行數據分析,并在工作過程中不斷提高準確性,從而更精準地預判并執行后續步驟。

  Anthropic公司增長與營收部門負責人Kate Jensen表示:"Claude Opus 4和Claude Sonnet 4將AI從一種工具,轉變為每個人、每個團隊的真正協作伙伴。我們的客戶將看到項目周期大幅縮短——在許多情況下,能從數周縮短至數小時。Claude 4系列模型在編碼、高級推理及多步驟工作流方面樹立了新標桿,同時能全面理解業務背景并輸出精準結果。其真正的突破在于,Claude承擔了大量繁重工作,讓團隊人才得以專注于戰略性工作。"

  核心信息

  新一代Claude模型標志著Agentic AI能力的重大飛躍,徹底改變了企業將AI應用于專業復雜任務和日常高容量運營的方式。Claude Opus 4.1Claude Sonnet 4不再局限于內容生成,而是更像專業的虛擬協作伙伴,能夠在復雜任務中保持專注,留存相關上下文信息,無需提供持續指導即可提供完整的解決方案。

  這一能力革新了企業應對挑戰的方式,從軟件開發到營銷策略制定均可適用。對于日常用戶而言,這意味著他們可以使用更懂自身需求的AI,且該AI能獨立承擔項目中更大比例的工作。

  數據解讀:

  兩款模型均配備20token的上下文窗口,能讓用戶處理和生成大篇幅內容(如文檔分析和研究工作),且始終保持內容質量與連貫性。token是模型可處理的最小文本數據單位(例如一個單詞、短語或單個字符)。較長的響應在豐富的代碼生成和內容創作中效果尤為顯著。

  據Anthropic介紹,Claude Opus 4.1在SWE-bench基準測試中,將其頂尖的編碼性能提升至74.5%,實現了穩定且顯著的進步,助力開發人員及其應用始終保持領先地位。與前代產品相比,Claude Opus 4.1能夠更專注更精準地瀏覽大型代碼庫,并擅長處理長時間運行的任務,對編碼Agent的規劃和協調能力也有所提升。除編碼外,Opus 4.1還增強了Claude的深度研究和數據分析能力,尤其是在細節追蹤和Agent搜索方面。

  兩款模型能夠在提供快速直接答案與逐步推理解答之間靈活切換,在關鍵行業基準測試中,大幅提升了多步驟工作流程的性能表現。

  據Anthropic公司稱,Claude Opus 4.1和Claude Sonnet 4預示著未來AI系統,將在創意工作和知識型工作中成為能力日益強大的合作伙伴。例如,它們可在企業中承擔更多專業角色,如處理日常分析工作、跨部門協作,甚至在極少監督的情況下管理完整的工作流程。

中文科技資訊微信二維碼logo

  文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

海報生成中...

瀏覽

最新新聞

熱門新聞

即時

全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

新聞

市場占比高達35.8%,阿里云引領中國AI云增長

9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
久久一级大片| 2020国产精品视频| 国产在线国偷精品免费看| 青青草原综合久久大伊人精品| 菠萝菠萝蜜在线视频免费观看| 麻豆传媒视频在线| 蜜桃成人免费视频| 最新精品国产| 在线观看精品一区二区三区| 欧美极品少妇xxxxⅹ高跟鞋| 欧美高跟鞋交xxxxhd| 欧美日韩国产欧美日美国产精品| 日韩你懂的电影在线观看| 久久久无码精品亚洲日韩按摩| 综合一区在线| 国产黄色在线| 欧美日韩在线播放| 超碰人人在线| 欧洲av在线精品| 国产精品亚洲综合天堂夜夜| 国产美女扒开尿口久久久| 日韩中文字幕在线精品| 精品一区中文字幕| 中文字幕日韩一区二区不卡| 国产亚洲人成网站| 亚洲精品欧洲精品| 久久久久久影视| 亚洲精品偷拍| 国产成人精品免费| 国产伦精品一区二区三区四区视频| 日韩综合av| 国产剧情一区在线| 黄色在线论坛| 中文幕一区二区三区久久蜜桃| 一级精品视频在线观看宜春院| 色综合视频一区二区三区日韩| 香蕉综合视频| 二区三区四区高清视频在线观看| 国产综合久久久久| 蜜乳av一区| 日韩一区二区影院| 视频一区视频二区中文字幕| 亚洲精品国产九九九| 91一区二区三区在线| 免费黄网站在线| 51色欧美片视频在线观看| 日韩一区二区欧美| 91精品久久久久久久蜜月| 亚欧洲精品视频在线观看| 日韩伦理一区二区| 91视频精品在这里| 亚洲在线资源| 最新中文字幕一区二区三区| 久久亚洲欧美国产精品乐播| 亚洲伊人网站| 久久福利精品| 另类专区欧美蜜桃臀第一页| 一级成人国产| 波多野结衣一区二区三区| 欧美日韩在线电影| 亚洲视频一起| 成人亚洲精品| 中文字幕免费精品一区| 欧美日韩另类图片| 久久成人国产精品| 黑人中文字幕一区二区三区| 春暖花开亚洲一区二区三区| 欧美亚洲免费高清在线观看| 亚洲欧美变态国产另类| 国产精品黄色影片导航在线观看| 91露出在线| 欧美一二三区在线观看| 欧美sss在线视频| 亚洲999一在线观看www| 欧美激情另类| 日韩av电影院| 狠狠做六月爱婷婷综合aⅴ| 天天色天天射天天综合网| 青青草这里只有精品| 综合网日日天干夜夜久久| 91超碰在线电影| 国产精品一区在线播放| 国产三区在线成人av| 亚洲精品午夜av福利久久蜜桃| 免费观看在线黄色网| 亚洲一区久久| 成人毛片老司机大片| 一区二区三区在线| 国产亚洲精品va在线观看| 欧美精品久久一区二区三区| 久久女同精品一区二区| 7m精品福利视频导航| 日本欧美一区二区在线观看| 777久久久精品| 一本久久a久久免费精品不卡| 黄页视频在线播放| 欧美日韩免费一区二区三区| 偷拍一区二区三区| 国产目拍亚洲精品99久久精品| 九九热这里有精品| 中文字幕av一区二区三区谷原希美| 成人精品aaaa网站| 亚洲午夜精品17c| 亚洲国产欧美日本视频| 国产一区二区三区成人欧美日韩在线观看| 欧美日韩加勒比精品一区| 亚洲精品久久久久久久久久久久| 玖玖国产精品视频| 97av影视网在线观看| 欧美爱爱网站| 欧美视频久久| 亚洲乱码一区二区三区在线观看| 日韩视频久久| 欧美高清在线视频| 亚洲精品va| 欧美丰满嫩嫩电影| 亚洲精品自拍动漫在线| 色yeye香蕉凹凸一区二区av| 欧洲国产精品| 国产欧美日韩电影| 免费一二一二在线视频| 免费日韩一区二区三区| 亚洲天堂精品视频| 国产成人91久久精品| 在线观看男女av免费网址| 亚洲欧美日韩高清| 在线视频观看日韩| 欧美大片免费高清观看| 成人久久18免费网站麻豆| 成人做爰视频www| 日韩一区和二区| 国产在线国偷精品产拍免费yy| a视频在线播放| 欧美另类视频| 精品不卡在线视频| 国产mv日韩mv欧美| 亚洲精品3区| 国产日韩欧美夫妻视频在线观看| 欧美黑人巨大精品一区二区| 亚洲国产精品综合久久久| 国产一区激情在线| 成人免费福利在线| 午夜日韩成人影院| 91国产成人在线| 最新中文字幕在线播放| 午夜av一区| 日韩欧美精品网站| 欧美夫妻性生活xx| 亚洲精品美腿丝袜| 国产盗摄——sm在线视频| 免费视频最近日韩| 精品51国产黑色丝袜高跟鞋| 国产精品区一区二区三含羞草| 欧美无人高清视频在线观看| 国内精品久久久久久久| 日韩在线中文| 日本最新不卡在线| 91蜜桃网址入口| 老牛嫩草一区二区三区日本| 日本中文字幕一区二区有限公司| 亚洲第一视频在线观看| 激情成人四房播| 久久久国产综合精品女国产盗摄| 番号集在线观看|