国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

  • 首頁 > 云計算頻道 > 大模型

    天工大模型登頂多模態榜單!解決幻覺、跨語言兩大難題

    2023年09月06日 14:20:56 來源:微信公眾號量子位

      本文來自于微信公眾號 量子位 (ID:QbitAI),作者:豐色。

      國產大模型,登頂多模態榜單!

      昆侖萬維最近在大模型圈可謂“風生水起”。

      幾天前剛被曝挖來了AI大牛顏水成,出任天工智能聯席CEO。

      現在,其「天工」大模型Skywork-MM又登頂多模態榜單,在騰訊優圖實驗室聯合廈門大學開展的多模態大語言模型(Multimodal Large Language Model,簡稱“MLLM”)測評中,綜合得分排名第一。

      騰訊優圖實驗室聯合廈門大學在新建的評測基準MME上首次對全球范圍內MLLM模型進行了全面定量評測并公布了16個排行榜,包含感知、認知兩個總榜單以及14個子榜單。

      MME數據集是一個最近發布的多模態語言模型測評基準。

      它通過大型多模態語言模型在涵蓋感知和認知任務的14個子任務上的表現來全面評估模型。

      而Skywork-MM只用了不到50M的圖文數據——遠小于其他大模型(>100M),拿下了第一(榜單地址見文末)。

      如何做到?

      主要是解決了現有多模態大模型中頗為困擾的兩大問題:

      幻覺和較弱的跨語言能力。 多模態兩大難

      所謂幻覺,是指多模態大模型在回答問題時,傾向于肯定的答案,即使我們所給的問題中根本沒有相關特征。

      例如面對下面這張圖像。

      如果問它“這個男人的頭發是什么顏色?”,即使優秀如LLaVA、MiniGPT-4等多模態大模型,也會“睜著眼說瞎話”:黑色。

      再如這張圖片:一個玻璃杯、一個茶杯、一個浴缸里面有條小金魚。

      如果問它“圖片中的所有物品都是黃色的嗎?”,沒有誰能答對。

      至于跨語言能力問題,主要表現在應對中文場景中的問題回答不盡如人意。

      比如辨認下面這張圖片是“科羅拉多大峽谷還是蘇州園林”時,3個雙語多模態語言模型:LLaVA、 LLaVA-Chinese、ImageBind-LLm全部回答成前者。

      問它們從哪里能觀賞到該景色,就更是一言難盡了。

      甚至有時,模型還會直接回復純英文。

      這兩大問題嚴重影響著現有多模態大模型的性能。

      怎么解決? 三方面入手

      昆侖萬維天工大模型Skywork-MM從分別從數據、模型和訓練流程三方面入手。

      其中重點是數據和模型。

      先看數據。

      首先對于幻覺問題。

      從本質出發,該問題主要是整個模型訓練過程中使用的數據太偏重正樣本。

      也就是說,模型描述的都是圖片中有什么,而沒有學習圖片中沒有什么。

      如果訓練過程中再碰上弱相關的圖文數據,模型就更加放飛聯想、形成較嚴重的幻覺。

      為此,天工大模型多模態團隊提出以圖像為中心,喂給模型既包含正樣本也包含負樣本的多模態指令微調數據:

      這使得模型既能夠學習一張圖像中存在的視覺特征,也能學習到不存在的特征。

      這樣,模型的指令跟隨能力便得到增強:問什么答什么,沒有的也不胡編。

      其次,對于跨語言中的中文問題,一共有兩個解決思路:

      (1)增強中文的指令追隨能力。

      由于“微調指令的文化gap很小”,只需將上面解決幻覺問題中構造的英文指令微調數據翻譯成中文使用。

      (2)增強中文相關場景的識別能力。

      需要注意的是,在解決跨語言問題時,我們重點關注的點是文化偏差——

      即通用的視覺特征和語言特征可以通過共有的語料進行關聯,但是各個語言文化中專有的視覺特征和語言特征的關聯需要大量特殊學習。

      因此我們需要加入大規模的中文圖像-文本對數據。

      不過,這樣的中文語料并不好收集,一是囿于數據質量,而是困于數量。

      怎么辦?

      引出Skywork-MM在模型架構上的改進。

      為了不讓低質量的圖文數據影響模型效果,天工大模型多模態團隊在設計上選擇將視覺模型和大語言模型完全凍結。

      這樣做的目的是保持視覺模型在前置CLIP訓練中學習到的視覺特征不損失,以及大語言模型的語言能力不損失。

      同時,為了更好的關聯不同文化環境中的視覺特征和語言特征,模型整體包含了一個可學習的視覺特征采樣器和語言模型的LoRA適配器。

      如下圖所示,Skywork-MM一共包含四大模塊:

      給定一張圖像,LVM先提取圖像特征,然后將圖像特征輸入到重采樣器中,計算出可為LLM輸入的token。

      LLM接收token和指令提示(如果有),然后輸出圖像描述或對問題的回答。

      至于訓練流程,主要分為兩階段:

      第一階段使用雙語的大規模圖文對數據進行圖像概念和語言概念的關聯學習。

      第二階段使用多模態微調數據進行指令微調。

      此時,各種類型的指令微調數據(包括正樣本和負樣本)就組成統一的Chat Prompt形式。

      Ps. 上圖中的重采樣器和LoRA適配器標記了火焰,它們是可訓練的。 登頂MME綜合榜單

      如下表所示,Skywork-MM一共用了大約50M圖文數據,這比當前的同類大模型都要少得多。

      但經過以上數據、模型和訓練流程三方面的改進,Skywork-MM效果拔群。

      如下圖所示:

      它能夠準確理解圖片中的反常行為;

      也能聽明白一些特殊的指令(根據選項回答問題,根據風景寫詩,寫廣告詞,寫獲獎感言等等);

      對于中文場景問題,表現得也不再像個“歪果仁”了。

      可謂擁有了良好的指令跟隨和中文場景問答能力。

      因此像第一段展示的那些幻覺和跨語言問題,它完全可以信手拈來:

      孟非沒有頭發就沒有,不會說成黑色;蘇州園林、非誠勿擾節目一眼認出;三個物體沒有一個是黃色。

      而如開頭所示,在與其他模型的橫向測試中,Skywork-MM直接榮登MME榜單綜合第一,包括感知榜單第一(且與第二名有著43分的差距)、認知榜單第二。

      這個榜單大約今年6月上線、目前GitHub4k標星,是當前多模態大模型最新的測評基準之一。

      它一共包含14個子任務,其中感知任務除OCR,還包括粗粒度和細粒度對象識別,前者識別對象的存在與否、數量、位置和顏色;后者識別電影海報、名人、場景、地標和藝術品。

      認知任務則包括常識推理、數值計算、文本翻譯和代碼推理。

      下表顯示Skywork-MM在該榜單感知任務中的OCR+粗粒度識別上的具體得分:

      細粒度識別得分:

      以及認知任務得分:

      可以看到,能與Skywork-MM偶爾“平分秋色”的只有MiniGPT-4和BLIP系列。

      而除了MME榜單,Skywork-MM還在另一多模態基準MMBench的開發集上表現出色:

      進步空間

      需要注意的是,盡管昆侖萬維天工大模型這一最新成果,代表了當前多模態大模型的最高水平,但它還是存在很多進步空間。

      例如:

      文化和語言障礙仍然存在,還需要我們開發一種多語言的LVM,更有效地提取不同文化特有的視覺特征,或者再收集更多各語言的大規模、高質量圖像文本對,確保模型準確掌握視覺概念和文本概念的關聯。

      除此之外,目前的成果只建立在較小規模的基礎之上(13B),如果研究更大的多模態模型,我們在使用數據、參數設置、訓練策略等方面可能都需要進一步探索。

      評估基準也還可以更全面,目前MME和MMBench的測試范圍都有限。

      以及從上面的粗粒度感知識別任務榜單來看,現有所有多模態大模型對于根據圖片準確識別物體位置的能力(對實現機器人感知意義重大)都比較欠缺:

      最高的模型得分才33.33,離滿分100還有很大的差距。

      這個缺陷從下圖也可以看出:

      毫無疑問的是,人工智能的未來一定是多模態的。

      以上這些問題說明,我們才剛剛開始探索它真正的潛力。

      然而,我們相信,在一次又一次的榜單排名更迭之中,屬于多模態大模型的“ChatGPT時刻”終將會到來。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    日韩欧美在线视频| 欧美亚洲第一页| 欧美aaaaa级| 亚洲欧美综合| 亚洲一级黄色| 91国产视频在线观看| 国产精品夜夜夜| 亚洲人成网站免费播放| 久久久噜噜噜久久人人看| 欧美精品手机在线| 国产精品免费aⅴ片在线观看| 久久国产精品成人免费观看的软件| 国产欧美日韩综合精品二区| 亚洲一区二区三区在线免费| 美日韩黄色大片| 日韩欧美一区二区在线| 亚洲啊v在线免费视频| 欧美成人综合网站| 亚洲精品国产精华液| 国产欧美日韩一区二区三区| 日韩欧美在线1卡| 久久天天躁日日躁| 性感美女极品91精品| 婷婷久久综合九色综合99蜜桃| 国产私拍福利精品视频二区| 久久国产夜色精品鲁鲁99| 黄色成人美女网站| 粉嫩av一区二区三区四区五区| 亚洲片av在线| 欧美日韩免费高清一区色橹橹| 日韩成人av在线播放| 国产精品毛片aⅴ一区二区三区| 麻豆亚洲一区| 涩涩视频在线免费看| 国产亚洲一区二区三区在线观看| 日本道色综合久久| 亚洲欧洲日韩精品在线| 99在线免费观看视频| 97久久超碰福利国产精品…| 国产成人免费av电影| 色拍拍在线精品视频8848| 欧美 日韩 国产一区二区在线视频| 国产精品高清亚洲| 国产精品视频播放| 国产欧美日韩一级| 国内精品自线一区二区三区视频| 亚洲国产精彩中文乱码av在线播放| 日韩三级影视| 蜜桃视频m3u8在线观看| 性xx色xx综合久久久xx| 国产偷国产偷精品高清尤物| 婷婷综合五月| 女人丝袜激情亚洲| 色婷婷激情一区二区三区| a免费在线观看| 中文字幕资源网在线观看免费| 亚洲国产专区校园欧美| 91成品人片a无限观看| 国产无一区二区| 国产精品久久毛片av大全日韩| 香蕉成人啪国产精品视频综合网| 日本免费在线一区| 日韩精品在在线一区二区中文| 国产视频精品在线| 色婷婷综合久久久中文一区二区| 911精品国产一区二区在线| 91久久大香伊蕉在人线| 精品无人区麻豆乱码久久久| 3d动漫啪啪精品一区二区免费| 神马影院我不卡| 国产精品99久久99久久久二8| 麻豆91精品| 97国产成人精品视频| 精品一区二区三区视频在线观看| 一本色道久久综合| 国产精品综合色区在线观看| 免费视频久久| 免费v片在线观看| 亚洲电影免费观看| 亚洲国产精品久久久| 美女羞羞视频在线观看| www.日韩欧美| 青青草97国产精品免费观看| 欧美性猛交丰臀xxxxx网站| 久久青青色综合| 免费久久99精品国产自| 奇米777国产一区国产二区| 国产一区二区你懂的| 国产精品一区二区性色av| 亚洲日本在线观看视频| 国产95亚洲| 亚洲人成亚洲精品| 欧美一区二区高清| 国产精品免费看久久久香蕉| 国内视频一区二区| 视频一区二区综合| 日本精品网站| 动漫美女被爆操久久久| 国产成人精品亚洲日本在线桃色| 在线日韩国产精品| 欧美日韩在线三级| 国产精品av久久久久久麻豆网| 亚洲人成网www| av大大超碰在线| 激情伊人五月天久久综合| www国产成人免费观看视频 深夜成人网| 国内精品国产三级国产在线专| 欧美一区二区视频网站| 亚洲国产精品va在线看黑人动漫| 国产综合成人久久大片91| 免费在线观看不卡| 91精品黄色片免费大全| 欧美极品少妇xxxxⅹ免费视频| 亚洲精品老司机| www.99久久热国产日韩欧美.com| 成人亚洲网站| 亚洲精品无吗| 亚洲欧美中文日韩在线v日本| 亚洲性色av| 亚洲美女动态图120秒| 亚洲麻豆国产自偷在线| 成人黄色视屏网站| 久久99蜜桃综合影院免费观看| 午夜老司机精品| 色哟哟一区二区| 日韩av免费在线看| 欧美在线你懂得| 日韩av在线影院| 在线观看h片| 日本视频免费一区| 亚洲男女性事视频| 91久久久久久久久久久久久| 国产成人综合亚洲网站| 国产精品嫩草影院在线看| av在线亚洲男人的天堂| 欧美调教视频| 国产不卡视频一区二区三区| 日本vs亚洲vs韩国一区三区| 日本精品在线播放| 国产一区二区高清不卡| 国产精品99蜜臀久久不卡二区| 欧美一级日韩免费不卡| 久久黄色影视| 一区二区三区色| 在线免费观看不卡av| 欧美人在线观看| 欧美日韩系列| 国产精品美女久久久久久久| 一二三区精品视频| 日本不卡一区二区三区在线观看| www.亚洲在线| 成人黄色在线网站| 91丨九色丨蝌蚪富婆spa| 91av资源在线| 网曝91综合精品门事件在线| 欧美日韩大陆在线| 国产伦精品一区二区三区视频免费| 国产精品免费一区二区三区在线观看| 999国内精品视频在线| 国产美女精品视频免费播放软件| 91国语精品自产拍在线观看性色| 日韩免费特黄一二三区| 精品一区av| 欧美日韩中文精品|