国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

晉商銀行攜手電科金倉,入選2025“金信通”金融科技創新應用案例破解5億人睡眠痛點!TCL小藍翼P7 Ultra安寢之眼睡眠科技定制整夜好眠豆包手機后思考:AGI會在中國率先跑出來嗎?深藍汽車完成C輪融資格力×抖音生服“青春之歌冰雪季”盛大收官,極寒中綻放中國制造力量開源成就訪談|開“芯”者說:一場關于RISC-V、生態與未來的深度對談螢石參編《智能家居施工安裝規范》團體標準發布,Y5000FVX Ultra摘2025鼎智獎新國標車型上市觀察:在安全原則與實用需求之間尋找最優解全地形車、觀光車、房車一站式看齊!2026年5月廣州廣交會展館變身“車旅嘉年華”漢嘉更名數智:戰略升級啟新程,“大數據+人工智能(機器人)”促發展⾸驅科技×V26無畏巡回:智能出⾏品牌聯名全球頂級電競IP正式官宣CIAS 2025第七屆中國汽車產業數智峰會圓滿落幕CAICT:11月國內手機市場出貨量3016.1萬部 5G手機占比91.6%斬獲LeadeRobot三項年度大獎,珞石機器人亮相中國機器人行業年會DSMC 2025第六屆中國制造業華北數智峰會圓滿收官中國電子學會工業工程分會2025年年會在京成功舉辦北汽福田發布國內首款量產液氫重卡:15分鐘加滿能跑1000公里最高時速120km/h!廣汽L3自動駕駛進入實證測試OPPO Pad Air5上架:4年流暢耐用 1899元起昂達推出Intel Z790主板新品:四槽DDR4內存、售價779元
  • 首頁 > 云計算頻道 > 大模型

    蘋果多模態模型大升級!文本密集、多圖理解,全能小鋼炮

    2024年10月14日 09:37:29 來源:​新智元公眾號

      近日,一向畫風精致的「蘋果牌AI」,也推出了升級版的多模態大模型,從1B到30B參數,涵蓋密集和專家混合模型,密集文本、多圖理解,多項能力大提升。

      多模態大語言模型(MLLM)如今已是大勢所趨。

      過去的一年中,閉源陣營的GPT-4o、GPT-4V、Gemini-1.5和Claude-3.5等模型引領了時代。

      而開源MLLM也同樣在蓬勃發展,LLaVA系列,InternVL2,Cambrian-1和Qwen2-VL的強勁表現,讓作為老大哥的GPT-4o時常躺槍。

      開源與閉源之間差距縮小,兼具單圖、多圖、視頻理解能力的MLLM也成為大家研究的重點。

      說到潮流,怎么能沒有蘋果的一席之地?

      近日,一向畫風精致的「蘋果牌AI」,也推出了升級版的多模態大模型——MM1.5。

      論文地址:https://arxiv.org/pdf/2409.20566

      MM1.5以前代MM1模型為基礎,采用數據為中心的方法進行訓練,顯著增強了文本密集型圖像理解、視覺指代和定位、以及多圖像推理的能力。

      MM1.5系列的參數量從1B到30B,涵蓋密集和專家混合(MoE)模型,即使較小的尺寸也有優異的表現。

      具體來說,MM1.5提升了OCR(光學字符識別)能力,支持任意圖像長寬比和高達4M像素的分辨率,并且擅長理解富含文本的圖像。

      在強大而細粒度的圖像理解能力加持下,MM1.5能夠超越文本提示來解釋視覺內容,例如點和邊界框。

      研究人員還通過對額外的高質量多圖像數據進行監督微調(SFT),進一步提高了模型的上下文學習和開箱即用的多圖像推理能力。

      本文作者重點關注兩種小規模的MLLM,包括1B和3B的密集模型與MoE模型,其中小尺寸的密集模型可以輕松部署在移動設備上。

      「小模型」也符合蘋果一貫的作風,在自家的各種設備上,能夠更好地與用戶場景(如隱私和安全性)融為一體。

      之前微軟和蘋果的很多實踐也證明了,利用高質量數據和先進的訓練策略,小個子的模型在各種下游任務中同樣表現強勁,足以超越大尺寸的模型。

      當然了,光是小還不夠,通用性更為重要。

      MM1.5系列模型在30B參數的范圍之內,都能很好地符合縮放定律,模型越大,性能越強。

      另一方面,研究人員以MM1.5為基礎,微調出服務于視頻理解的MM1.5-Video,以及為移動UI(比如iPhone屏幕)理解定制的MM1.5-UI。

      模型構建

      MM1.5保留了與MM1相同的模型架構,并將改進的努力集中在以下幾個關鍵方面:

      持續的預訓練

      作者在SFT階段之前引入了一個額外的高分辨率連續預訓練階段,這對于提高富含文本的圖像理解性能至關重要。

      作者探索了用于持續預訓練的富含文本的OCR數據,重點關注圖像中文本的詳細轉錄,還嘗試了高質量的合成圖像字幕。

      SFT

      混合中的每一類SFT數據如何影響最終模型的性能?特別是支持每種功能的數據對其他功能有何影響,作者對此進行了廣泛的消融實驗。

      動態高分辨率

      對于高分辨率圖像編碼,作者遵循流行的任意分辨率方法,將圖像動態劃分為子圖像,并進行徹底的消融以細化設計中的關鍵細節。

      為了保留前代模型的零樣本和少樣本學習能力,并更有效地將它們轉移到SFT階段,在開發MM1.5時,研究人員通過探索純文本數據的影響,并優化不同預訓練數據類型的比例,來進一步擴展MM1的預訓練。

      這種方法提高了知識密集型基準測試的性能,并增強了模型整體的多模態理解能力。

      如上圖所示,模型訓練包含三個階段:

      在每個階段,都需要確定最佳數據組合并評估每種數據類型的影響。

      消融實驗設置

      在消融研究中遵循以下默認設置:

      靜態圖像分割通過4個子圖像分割(加上一個概覽圖像)來實現,并且每個子圖像通過位置嵌入插值調整為672×672分辨率。為了加快實驗迭代速度,在消融過程中沒有使用動態圖像分割。

      對于多圖像數據的編碼,僅當當前訓練樣本包含少于三幅圖像時才啟用圖像分割,以避免序列長度過長。

      如下圖所示,模型可以以引用坐標和邊界框的形式,解釋對輸入圖像中的點和區域的引用。

      MM1.5采用與前代相同的CLIP圖像編碼器和LLM主干網絡,并以C-Abstractor作為視覺語言連接器。

      對于連續預訓練和SFT,作者將批量大小設置為256。使用AdaFactor優化器,峰值學習率為1e-5,余弦衰減為0。對于連續預訓練,最多訓練30k步。在SFT期間,所有模型都針對一個epoch進行優化。

      模型使用MM1的預訓練檢查點進行初始化。這個階段對45M高分辨率OCR數據(包括PDFA、IDL、Renderedtext和DocStruct-4M)進行持續的預訓練,每個訓練批次從這四個數據集中均勻采樣數據。

      與SFT階段類似,作者使用靜態圖像分割,將每個圖像分為五個子圖像,每個子圖像的大小調整為672×672分辨率。作者發現這種高分辨率設置對于持續預訓練至關重要。

      最后,將數據集分組有助于數據平衡和簡化分析。在較高層面上,作者根據每個示例中呈現的圖像數量將數據集分為單圖像、多圖像和純文本類別,詳細的分類情況如下圖所示:

      研究人員根據主要衡量的功能將基準分為幾類,并提出類別平均分數(每個子類別的所有基準數字的平均分數),以代表該功能的平均性能。

      SFT消融

      然后是對于SFT數據混合的全面消融。作者首先評估一般數據類別,然后逐步評估單獨添加其他子類別的影響。

      在訓練過程中,作者混合來自不同子類別的數據,通過從混合物中隨機采樣數據來構建每個訓練批次,并使用類別平均得分來比較使用每種功能的模型,結果如下圖所示。

      作者觀察到,添加富含文本的數據可以顯著提高文本密集型和知識基準的性能,數學數據也遵循類似的趨勢。

      以一般數據類別為參考,對目標類別數據進行上采樣/下采樣,使得在每個訓練批次中,一般數據類別和目標類別的數據比例為1:α。

      為了衡量α的平均影響,作者提出MMBase分數用于模型比較。如下圖所示,作者針對不同的數據類別改變α。對于科學、數學和代碼類別,作者發現α的最佳比率分別為0.1、0.5和0.2。

      下一項需要探究的是單圖像、多圖像和純文本數據的混合比例。

      枚舉三個比率之間的所有組合將產生大量的計算成本。因此,作者分別對純文本數據和多圖像數據進行消融,以評估模型對比例的敏感程度。

      對于純文本數據,作者測試了0到0.2的范圍,下圖結果表明,不同的w值對模型的基礎影響較小。

      通過圖7(右)還可以觀察到,增加多圖像數據的采樣率會導致基本功能的性能下降(MMBase分數減少),而多圖像平均分數會增加。所以作者選擇w= 0.1為單圖像數據分配更高的權重,以提高潛在的性能。

      基于上述研究,作者提出了三種混合:基礎混合、單圖像混合、全混合。

      下圖前三列表明,包含參考數據和多圖像數據會稍微降低密集文本、知識和一般基準的平均性能。

      最后一欄表明,作者優化的組合實現了最佳的整體性能,平衡了基準測試中的所有功能。

      最后,放幾張跑分對比,包括Text-rich、In Context Learning和Multi-image:

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    国产寡妇亲子伦一区二区| 亚洲在线中文字幕| 国产乱码精品一区二区三区五月婷| 日韩美女在线播放| 91精品久久久久久久久不口人| 日韩电影免费观看高清完整版在线观看| 91精品国产乱码久久久久久久| av久久网站| 欧美精品一区二区三区在线看午夜| 色网站国产精品| 少女频道在线观看高清| 91在线视频免费| 久久综合毛片| 手机在线一区二区三区| 999av小视频在线| 免费成人你懂的| 欧美怡红院视频一区二区三区| 国产亚洲欧洲一区高清在线观看| 亚洲天堂网中文字| 在线不卡中文字幕| 国产精品白丝一区二区三区| 在线免费看a| 欧美三级欧美成人高清www| 揄拍成人国产精品视频| 最新国产在线拍揄自揄视频| 日韩中文一区二区| 国产精品二区影院| 国产一级精品aaaaa看| 中文字幕亚洲综合久久筱田步美| 成人av片在线观看| 97夜夜澡人人双人人人喊| 亚洲午夜精品视频| 国产精品麻豆久久久| 国产精品一区二区三区四区色| 亚洲高清不卡av| 国内精品视频在线| 亚洲系列另类av| 欧美裸体bbwbbwbbw| 日韩三级成人av网| 成人福利视频在线看| 亚洲校园激情春色| 日韩成人精品视频| 亚洲欧美偷拍卡通变态| 国产精品视区| 九九热精品视频在线观看| 电影亚洲一区| 97视频在线观看视频免费视频| 日本韩国一区二区三区| 精品福利av| 国产精品一区二区女厕厕| 欧美黄在线观看| 一区二区三区免费在线观看| 欧美一区1区三区3区公司| 在线播放日韩| 欧美日韩伊人| 欧美亚洲一区三区| 国产精品欧美大片| 丝袜美腿玉足3d专区一区| 欧美xxxxxxxx| 成人日韩在线观看| 亚洲黄色性网站| 亚洲va欧美va国产va天堂影院| 精品伊人久久久久7777人| 性欧美xxxx视频在线观看| 自拍偷拍亚洲激情| 日本精品一级二级| 亚洲国产美女| 日韩中文字幕在线视频| 深夜福利一区| 日本在线中文字幕一区二区三区| 亚洲h片在线看| 韩国三级中文字幕hd久久精品| 91精品xxx在线观看| 亚洲美女一区二区三区| 欧美一区日本一区韩国一区| 天堂av资源在线观看| 久久久亚洲午夜电影| 久久国产一二区| 成年女人的天堂在线| 欧美在线www| 亚洲女人初尝黑人巨大| 日本sm残虐另类| 久久夜精品香蕉| 日韩在线视频免费观看高清中文| 欧洲精品中文字幕| 91亚洲精品久久久久久久久久久久| 精品视频一区 二区 三区| 欧美日韩一区成人| av一区二区三区在线| 欧美专区在线观看一区| 欧美日韩国产成人高清视频| 国产精品久久久久久久久久久久| 成人羞羞网站入口免费| 日韩欧美在线一区二区三区| 欧美男人的天堂一二区| 欧美日韩免费观看一区二区三区| 美女隐私在线观看| 图片区日韩欧美亚洲| 国产欧美日韩一区二区三区在线| 国产ts人妖一区二区三区| 在线观看日韩电影| 久久久久久久久久av| 色综合男人天堂| 免费在线看一区| 国内在线视频| 亚洲福利av在线| 日韩中文字幕在线精品| 欧美日韩色一区| 久久精品国内一区二区三区水蜜桃| 一本到高清视频免费精品| av一区在线| 精品动漫3d一区二区三区免费| 欧美色图天堂网| 欧美极品美女电影一区| 99综合在线| 天天综合天天综合色| 亚洲影院污污.| 成人羞羞视频播放网站| 一区二区三区精品视频在线观看| 国产一级一区二区| 亚洲一区二区三区中文字幕在线观看| 日韩激情片免费| 久久男人av资源网站| 国产高清免费在线播放| 黄网站在线观| 看亚洲a级一级毛片| 国内精品久久久久影院薰衣草| 欧美在线视频二区| 日韩中文字幕一区| 制服丝袜中文字幕在线| 玖玖在线精品| 免费国产一区二区| 国产1区2区3区精品美女| 在线中文字幕一区二区| av成人动漫在线观看| 国产脚交av在线一区二区| 美国毛片一区二区三区| 成人jjav| jizz久久精品永久免费| 中文字幕九色91在线| 日韩在线观看电影完整版高清免费悬疑悬疑| 国产99久久精品一区二区300| 中文字幕一区二区精品区| 久久久综合视频| 精品国产午夜肉伦伦影院| 中文字幕成人在线观看| 伊人色**天天综合婷婷| 成人免费观看网站| 午夜精品久久久久久久久久蜜桃| 亚洲天堂av在线播放| 91片在线免费观看| 日韩欧美在线一区二区| 国产视频一区不卡| 国产日韩一区二区三区在线| 伊人久久亚洲热| 亚洲欧美日韩精品一区二区| 国产精品美女久久久久久久久久久| 一区二区av在线| 欧美一进一出视频| 神马久久久久久| 久久免费少妇高潮久久精品99| 亚洲欧洲美洲av| 美女呻吟一区| 日韩欧美一级二级|