在周四舉行的 Anthropic 首屆開發者大會“Code with Claude”上,該公司發布了兩款全新 AI 模型,并表示:這兩款 AI 模型在多個行業基準測試中表現出色,是目前業內最 強的模型之一。
這兩款屬于“屬于 Claude 4 家族”的新模型分別為Claude Opus 4 和 Claude Sonnet 4。據 Anthropic 介紹,這些模型能分析大規模數據集、執行長周期任務并處理復雜操作。兩款模型都針對編程任務進行了優化,適合用于編寫和編輯代碼。
付費用戶與免費聊天應用用戶都可使用 Sonnet 4,但只有付費用戶才能使用 Opus 4。在 Anthropic 的 API(通過 Amazon Bedrock 平臺與谷歌 Vertex AI 提供)上,Opus 4 的定價為每百萬個輸入/輸出 token 分別為 15 美元/75 美元,Sonnet 4 為 3 美元/15 美元。
token 是 AI 模型處理數據的基本單位。100 萬個 token 大約相當于 75 萬個英文單詞 —— 比《戰爭與和平》還多約 16.3 萬字。
Anthropic 推出 Claude 4 系列模型正值公司大幅擴張收入之際。據報道,這家由前 OpenAI 研究人員創辦的公司計劃在 2027 年實現 120 億美元營收,而今年的預計收入為 22 億美元。為應對開發前沿模型帶來的高成本,Anthropic 最近獲得了 25 億美元的信貸額度,并從亞馬遜等投資方籌集了數十億美元。
不過,競爭對手也在奮力追趕。今年早些時候,Anthropic 推出了旗艦模型 Claude Sonnet 3.7 以及其代碼代理工具 Claude Code,而 OpenAI 和谷歌等競爭者也在發布更強大的模型與開發工具。
這次,Anthropic 準備憑 Claude 4 奮力一搏。
今天推出的兩款模型中,Opus 4 更強大。據稱,它能夠在復雜工作流中保持“持續聚焦的努力”;而 Sonnet 4 是 Sonnet 3.7 的“即插即用替代品”,在編程、數學能力、以及指令理解上均有提升。
Anthropic 還稱,Claude 4 系列相比 Sonnet 3.7 更不容易出現“獎勵投機”(reward hacking)行為,即模型為了完成任務而鉆規則漏洞、走捷徑。
不過,要明確的是,這些改進并不意味著它是每項基準測試中最好的。例如,雖然 Opus 4 在衡量代碼能力的 SWE-bench Verified 上超過了谷歌 Gemini 2.5 Pro、OpenAI 的 o3 與 GPT-4.1,但在多模態評估 MMMU 和博士級科學題集 GPQA Diamond 上仍不敵 o3。
為加強安全性,Anthropic 為 Opus 4 設置了更嚴格的防護機制,包括更強的有害內容檢測器和網絡安全防御系統。公司內部測試發現,Opus 4 可能“顯著提升”具有 STEM 背景人員獲取、制造或部署化學、生物或核武器的能力,因此被標記為符合其“ASL-3”模型安全規范。
Anthropic 表示,Opus 4 和 Sonnet 4 均為“混合模型”,既能迅速響應,也能進入“深度推理”模式,在需要時花更多時間權衡解決方案。在推理過程中,模型會顯示“用戶友好型”的思考摘要。至于不顯示完整思考過程的原因,部分是為了保護公司的“競爭優勢”,Anthropic 在提供給 TechCrunch 的草稿博文中坦承。
Claude 4 系列還可并行使用多種工具(如搜索引擎),在推理與工具調用間切換,從而提高回答質量。它們還能提取并存儲事實以構建“隱性知識”,從而提升任務完成的可靠性。
為了更好服務開發者,Anthropic 正升級其 Claude Code 工具。該工具允許開發者直接從終端運行任務,如今已集成到多種 IDE(集成開發環境)中,并提供 SDK,可將其接入第三方應用。
新發布的 Claude Code SDK 支持在多個操作系統中以子進程形式運行 Claude Code,方便開發人員打造 AI 編程助手或工具,充分發揮 Claude 模型能力。
Anthropic 還推出了適用于 Microsoft VS Code、JetBrains 與 GitHub 的 Claude Code 擴展插件。GitHub 插件支持開發者利用 Claude Code 響應審查意見,并嘗試修復代碼錯誤或進行修改。
雖說 AI 模型仍難以編寫高質量軟件(通常存在安全漏洞和邏輯錯誤),但其在提高開發效率方面的潛力推動了業界的快速采用。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。