国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

  • 首頁 > 云計算頻道 > 大模型

    大模型都會標注圖像了,簡單對話即可!來自清華&NUS

    2024年01月04日 11:09:12 來源:量子位 (ID:QbitAI)

      張傲 投稿

      量子位 | 公眾號 QbitAI

      多模態大模型集成了檢測分割模塊后,摳圖變得更簡單了!

      只需用自然語言描述需求,模型就能分分鐘標注出要尋找的物體,并做出文字解釋。

      在其背后提供支持的,是新加坡國立大學NExT++實驗室與清華劉知遠團隊一同打造的全新多模態大模型。

      隨著GPT-4v的登場,多模態領域涌現出一大批新模型,如LLaVA、BLIP-2等等。

      為了進一步擴展多模態大模型的區域理解能力,研究團隊打造了一個可以同時進行對話和檢測、分割的多模態模型NExT-Chat。

      NExT-Chat的最大亮點,是在多模態模型中引入位置輸入和輸出的能力。

      其中位置輸入能力指的是根據指定的區域回答問題(下方左圖);位置輸出能力指的則是定位對話中提及的物體(下方右圖):

      即使是復雜的定位問題,也能迎刃而解:

      除了物體定位,NExT-Chat還可以對圖片或其中的某個部分進行描述:

      分析完圖像的內容之后,NExT-Chat可以利用得到的信息進行推理:

      為了準確評估NExT-Chat的表現,研究團隊在多個任務數據集上進行了測試。

      在多個數據集上取得SOTA

      作者首先展示了NExT-Chat在指代表達式分割(RES)任務上的實驗結果。

      雖然僅僅用了極少量的分割數據,NExT-Chat卻展現出了良好的指代分割能力,甚至打敗了一系列有監督模型(如MCN,VLT等)和用了5倍以上分割掩模標注的LISA方法。

      △RES任務上NExT-Chat結果

      接著,研究團隊展示了NExT-Chat在REC任務上的實驗結果。

      如下表所示,相比于相當一系列的有監督方法(如UNITER),NExT-Chat都可以取得更優的效果。

      一個有意思的發現是NExT-Chat比使用了類似框訓練數據的Shikra效果要稍差一些。

      作者猜測,這是由于pix2emb方法中LM loss和detection loss更難以平衡,以及Shikra更貼近現有的純文本大模型的預訓練形式導致的。

      △REC任務上NExT-Chat結果

      在圖像幻覺任務上,如表3所示,NExT-Chat可以在Random和Popular數據集上取得最優的準確率。

      △POPE數據集上NExT-Chat結果

      在區域描述任務上,NExT-Chat也能取得最優的CIDEr表現,且在該指標打敗了4-shot情況下的Kosmos-2。

      △RefCOCOg數據集上NExT-Chat結果

      那么,NExT-Chat背后都采用了哪些方法呢?

      提出圖像編碼新方式

      傳統方法的缺陷

      傳統的模型主要通過pix2seq的方式進行LLM相關的位置建模。

      比如Kosmos-2將圖像劃分成32x32的區塊,用每個區塊的id來代表點的坐標;Shikra將物體框的坐標轉化為純文本的形式從而使得LLM可以理解坐標。

      但使用pix2seq方法的模型輸出主要局限在框和點這樣的簡單格式,而很難泛化到其他更密集的位置表示格式,比如segmentation mask。

      為了解決這個問題,本文提出了一種全新的基于embedding的位置建模方式pix2emb。

      pix2emb方法

      不同于pix2seq,pix2emb所有的位置信息都通過對應的encoder和decoder進行編碼和解碼,而不是借助LLM本身的文字預測頭。

      △pix2emb方法簡單示例

      如上圖所示,位置輸入被對應的encoder編碼為位置embedding,而輸出的位置embedding則通過Box Decoder和Mask Decoder轉化為框和掩模。

      這樣做帶來了兩個好處:模型的輸出格式可以非常方便的擴展到更多復雜形式,比如segmentation mask。 模型可以非常容易的定位任務中已有的實踐方式,比如本文的detection loss采用L1 Loss和GIoU Loss (pix2seq則只能使用文本生成loss),本文的mask decoder借助了已有的SAM來做初始化。

      通過將pix2seq與pix2emb結合,作者訓練了全新的NExT-Chat模型。

      NExT-Chat模型

      △NExT-Chat模型架構

      NExT-Chat整體采用了LLaVA架構,即通過Image Encoder來編碼圖像信息并輸入LLM進行理解,并在此基礎上添加了對應的Box Encoder和兩種位置輸出的Decoder。

      為了解決LLM不知道何時該使用語言的LM head還是位置解碼器的問題,NExT-Chat額外引入一個全新的token類型來標識位置信息。

      如果模型輸出了,則該token的embedding會被送入對應的位置解碼器進行解碼而不是語言解碼器。

      此外,為了維持輸入階段和輸出階段位置信息的一致性,NExT-Chat額外引入了一個對齊約束:

      △位置輸入、輸出約束

      如上圖所示,box和位置embedding會被分別通過解碼器、編碼器或解碼器編碼器組合,并要求前后不發生變化。

      作者發現該方法可以極大程度促進位置輸入能力的收斂。

      而NExT-Chat的模型訓練主要包括3個階段: 第一階段:訓練模型基本的框輸入輸出基本能力。NExT-Chat采用Flickr-30K,RefCOCO,VisualGenome等包含框輸入輸出的數據集進行預訓練。訓練過程中,LLM參數會被全部訓練。 第二階段:調整LLM的指令遵循能力。通過一些Shikra-RD,LLaVA-instruct之類的指令微調數據使得模型可以更好的響應人類的要求,輸出更人性化的結果。 第三階段:賦予NExT-Chat模型分割能力。通過以上兩階段訓練,模型已經有了很好的位置建模能力。作者進一步將這種能力擴展到mask輸出上。實驗發現,通過使用極少量的mask標注數據和訓練時間(大約3小時),NExT-Chat可以快速的擁有良好的分割能力。

      這樣的訓練流程的好處在于:檢測框數據豐富且訓練開銷更小。

      NExT-Chat通過在充沛的檢測框數據訓練基本的位置建模能力,之后可以快速的擴展到難度更大且標注更稀缺的分割任務上。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    欧美精品aaa| 四虎成人精品永久免费av九九| 无遮挡爽大片在线观看视频| 91亚洲精品丁香在线观看| 3344国产永久在线观看视频| 国产精品灌醉下药二区| 久久精品视频免费看| 国产精品视频网址| 91国内精品白嫩初高生| 成人影院天天5g天天爽无毒影院| 日韩欧美综合| 亚洲小说欧美另类婷婷| 国产日韩精品一区二区三区在线| 欧美精品一区二区三区视频| 成人在线视频区| 久久影院亚洲| 91女厕偷拍女厕偷拍高清| 欧洲一区在线观看| 国产精品一区二区久久| 在线播放毛片| 国产欧美日韩中文久久| 久久久久久久久久婷婷| 日韩亚洲精品电影| 老司机福利在线视频| 狠狠v欧美v日韩v亚洲ⅴ| 欧美黑人xxxx| 男人的天堂亚洲在线| 欧美日韩在线三区| 欧美午夜精品久久久久久蜜| 亚洲欧美清纯在线制服| 91国产视频在线播放| 国产农村妇女毛片精品久久麻豆| 欧美激情久久久| 国产片在线观看| 久久精品国产99| av成人手机在线| 九九亚洲精品| 亚洲素人一区二区| 国产日韩欧美综合精品| 婷婷激情一区| 亚洲男男av| 中文字幕伦av一区二区邻居| av片在线观看| 日韩一区二区三区视频在线观看| 2020最新国产精品| 亚洲日产国产精品| av在线播放国产| www.成人在线.com| 亚洲免费观看高清完整版在线观看熊| 国产日韩欧美激情| 国产精品欧美一区二区三区不卡| 青青久久av北条麻妃黑人| 中文字幕av一区中文字幕天堂| 亚洲一区二区三区香蕉| 国产丝袜在线精品| 中文字幕精品一区二区三区精品| 日本电影在线观看网站| 亚洲护士老师的毛茸茸最新章节| 精品国产乱码一区二区三区| 91亚洲精品| 日韩精品中文字幕第1页| 狼狼综合久久久久综合网| 成人深夜视频在线观看| eeuss影院在线播放| 在线一级成人| yourporn在线观看中文站| 亚洲一区亚洲二区| av资源中文在线| 96精品视频在线| 亚洲人体大胆视频| 亚洲高清影院| 国产欧美欧洲在线观看| 波波电影院一区二区三区| 日韩欧美中文在线观看| 午夜精品成人在线| 91黄在线观看| 99久久精品免费观看国产| 欧美爱爱视频| 久久视频在线直播| 精品国产污污免费网站入口| 国产精品久久久久9999高清| 4438x亚洲最大成人网| 日韩欧美极品在线观看| 中文字幕av一区二区三区人| 成人动漫免费在线观看| 亚洲欧美电影在线观看| 亚欧日韩另类中文欧美| 色男人天堂综合再现| 欧美亚洲日本网站| 色大18成网站www在线观看| 欧美一区日韩一区| 亚洲大片av| 久久aⅴ国产紧身牛仔裤| www.91在线| 欧美亚洲成人免费| 99久久精品久久久久久清纯| 久久久婷婷一区二区三区不卡| 亚洲黄色中文字幕| 最近更新的2019中文字幕| 日韩精品中文字幕一区| 国产98在线| 蜜桃av一区| 日本综合视频| 欧美日韩亚洲综合一区二区三区| 欧美午夜理伦三级在线观看| 久久频这里精品99香蕉| 18视频免费网址在线观看| 国产精品午夜av在线| 麻豆传媒一区二区三区| 91香蕉视频在线| 国产69精品久久久久99| 色偷偷久久一区二区三区| 国产精品嫩草影院com| 91精品国产91久久久久久最新毛片| 国产日韩av高清| 亚洲欧美另类自拍| 欧美激情a∨在线视频播放| 青青草一区二区三区| 啪啪亚洲精品| 国产精品久久三| 亚洲成av人影院在线观看| 成人爽a毛片免费啪啪| 狠狠久久综合| 一本久道综合久久精品| 午夜激情久久| 久久久久国产精品一区| 亚洲精品国产成人久久av盗摄| 97在线精品视频| 综合在线观看色| 国产探花在线精品| av电影免费在线观看| 玉米视频成人免费看| 欧美成人a∨高清免费观看| 91蜜桃在线免费视频| 久久精品系列| 成年人在线观看| 91|九色|视频| 成人免费观看视频大全| 色老汉av一区二区三区| a视频网址在线观看| 亚洲精品一二| 亚洲成人av| 丁香花在线观看完整版电影| 亚洲资源一区| a黄色在线观看| 日本久久一区二区三区| 牛牛电影国产一区二区| 网友自拍视频在线| 精品国产福利视频| 国产欧美日韩综合精品一区二区| 91在线视频精品| 视频一区视频二区在线观看| a级精品国产片在线观看| 国产精品自产拍在线观| 91免费精品国偷自产在线在线| 日韩高清在线观看一区二区| 五月天久久比比资源色| 久久超碰97人人做人人爱| 91福利视频网| 久久精品国产亚洲一区二区| 久久婷婷影院| 免费观看国产成人| 免费亚洲精品视频| 精品国产露脸精彩对白|