最近,AI 領域都在思考一件事:多模態大模型落地產業,好的打法應該是什么?
通用人工智能時代正在到來,AI 大模型技術已成為數字經濟下基礎設施建設的重要支撐,也成為產業智能化轉型的核心「引擎」,AI 大模型 + 產業應用迎來了前所未有的發展機遇。
在10月28日舉辦的 CNCC2023「超智融合 AI 大模型應用落地發展論壇」上,智子引擎發布了「元乘象 Chatimg3.0」,展示了多模態通用生成模型「元乘象 Chatimg3.0」的最新進展與落地探索。
Chatimg3.0核心技術的升級迭代
元乘象 Chatimg3.0是一個超精細識別、少幻覺的多模態大模型,同時支持多圖理解、物體定位、OCR 等功能。Chatimg3.0給硬件設備裝上了大腦,可實現更自然更流暢的人機交流,為 AI 多模態大模型賦能產業應用打下了堅實的基礎。
與 Chatimg2.0相比,Chatimg3.0主要進行了兩方面的升級,包括第一階段的預訓練(描述、檢測、OCR 等多任務訓練)以及第二階段的指令微調(高質量的人工精篩指令集)。
為更好的評估多模態大模型的能力,智子引擎構建了一個全新的多模態對話測試集,從描述、推理、檢測、問答、業務五個方面對模型能力進行評測,而且在問答和業務兩個方面的能力上趕超 GPT-4V,展現出了國產大模型優秀的發展潛力。
以下是 Chatimg3.0對比 GPT-4V 在測試中的具體表現:
重點領域探索應用
目前,智子引擎已經將「元乘象 Chatimg3.0」應用于全域防控和無人機巡檢等領域,通過與無人機、電子探頭等前端感知設備的融合,升級傳統巡檢和安防,實現了 AI 缺陷識別、異常檢測、行為分析、重點監控、自主巡查、風險預測等功能,推動了 AI 工程化革新進程。
作為國內首個多模態大模型研發團隊,智子引擎不僅在人才和技術上擁有先天的優勢,多個知名投資機構和 IT 行業龍頭的天使投資,也讓這家公司「如虎添翼」。
在軟通動力、華軟科技等知名企業的協同助力下,融合「元乘象 Chatimg3.0」研發的「智子・天穹」和「智子・天巡」系統一經面世便得到了行業的關注,產品被快速應用于城市治理、智慧電力、管道巡檢、園區管理、農業、金融等多行業應用場景,并逐步開始試點部署。
未來,為了加速大模型產業應用落地,促進數字經濟可持續發展,智子引擎將繼續加強模型訓練和能力升級,匯聚行業頂尖人才和優勢資源,為大模型助力產業升級不遺余力。核心模型 「元乘象 Chatimg」未來還會在 AI agents、具身智能等方向持續發力,并將收獲更多行業關注。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。