Meta公司與香港中文大學合作,近日推出Multi-SpatialMLLM模型,通過整合深度感知、視覺對應和動態感知三大組件,顯著提升了多模態大語言模型(MLLMs)的空間理解能力。
該模型依托超過2700萬樣本的MultiSPA數據集,涵蓋多樣化的3D和4D場景,并利用GPT-4o生成任務模板,有效解決了傳統模型在動態信息處理上的局限。
測試數據顯示,Multi-SpatialMLLM在MultiSPA基準測試中性能平均提升36%,部分任務準確率達80-90%。
此外,在BLINK基準測試中,其準確率接近90%,遠超專有系統。該模型在提升空間推理能力的同時,保持了原有視覺問答任務的性能,展現出強大的通用性。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。