国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

  • 首頁 > 云計算頻道 > 大模型

    谷歌發布可讀屏AI模型ScreenAI:可理解用戶界面和信息圖表

    2024年03月05日 09:35:26 來源:新智元公眾號

      每個人想要的大模型,是真·智能的那種......

      這不,谷歌團隊就做出來了一個強大的「讀屏」AI。

      研究人員將其稱為ScreenAI,是一種理解用戶界面和信息圖表的全新視覺語言模型。

      論文地址:https://arxiv.org/pdf/2402.04615.pdf

      ScreenAI的核心是一種新的屏幕截圖文本表示方法,可以識別UI元素的類型和位置。

      值得一提的是,研究人員使用谷歌語言模型PaLM 2-S生成了合成訓練數據,以訓練模型回答關屏幕信息、屏幕導航和屏幕內容摘要的問題。

      舉個栗子,比如打開一音樂APP頁面,可以詢問「有幾首歌時長少于30秒」?

      ScreenAI便給出了簡單的答案:1。

      再比如命令ScreenAI打開菜單,就可以選中。

      架構靈感來源——PaLI

      圖1中展示了ScreenAI模型架構。研究人員受到了PaLI系列模型架構(由一個多模態編碼器塊組成)的啟發。

      該編碼器塊包含一個類似ViT的視覺編碼器和一個消費圖像(consuming image)和文本輸入的mT5語言編碼器,后接一個自回歸解碼器。

      輸入圖像通過視覺編碼器轉化為一系列嵌入,這些嵌入與輸入文本嵌入結合,一起輸入mT5語言編碼器。

      編碼器的輸出傳遞給解碼器,生成文本輸出。

      這種泛化公式能夠使用相同的模型架構,解決各種視覺和多模態任務。這些任務可以重新表述為文本+圖像(輸入)到文本(輸出)的問題。

      與文本輸入相比,圖像嵌入構成了多模態編碼器輸入長度的重要部分。

      簡而言之,該模型采用圖像編碼器和語言編碼器提取圖像與文本特征,將二者融合后輸入解碼器生成文本。

      這種構建方式可以廣泛適用于圖像理解等多模態任務。

      另外,研究人員還進一步擴展了PaLI的編碼器-解碼器架構,以接受各種圖像分塊模式。

      原始的PaLI架構只接受固定網格模式的圖像塊來處理輸入圖像。然而,研究人員在屏幕相關領域遇到的數據,跨越了各種各樣的分辨率和寬高比。

      為了使單個模型能夠適應所有屏幕形狀,有必要使用一種適用于各種形狀圖像的分塊策略。

      為此,谷歌團隊借鑒了Pix2Struct中引入的一種技術,允許根據輸入圖像形狀和預定義的最大塊數,生成任意網格形狀的圖像塊,如圖1所示。

      這樣能夠適應各種格式和寬高比的輸入圖像,而無需對圖像進行填充或拉伸以固定其形狀,從而使模型更通用,能夠同時處理移動設備(即縱向)和臺式機(即橫向)的圖像格式。

      模型配置

      研究人員訓練了3種不同大小的模型,包含670M、2B和5B參數。

      對于670M和2B參數模型,研究人員從視覺編碼器和編碼器-解碼器語言模型的預訓練單峰檢查點開始。

      對于5B參數模型,從 PaLI-3的多模態預訓練檢查點開始,其中ViT與基于UL2的編碼器-解碼器語言模型一起訓練。

      表1中可以看到視覺和語言模型之間的參數分布情況。

      自動數據生成

      研究人員稱,模型開發的預訓練階段很大程度上,取決于對龐大且多樣化的數據集的訪問。

      然而手動標注廣泛的數據集是不切實際的,因此谷歌團隊的策略是——自動數據生成。

      這種方法利用專門的小模型,每個模型都擅長高效且高精度地生成和標記數據。

      與手動標注相比,這種自動化方法不僅高效且可擴展,而且還確保了一定程度的數據多樣性和復雜性。

      第一步是讓模型全面了解文本元素、各種屏幕組件及其整體結構和層次結構。這種基礎理解對于模型準確解釋各種用戶界面并與之交互的能力至關重要。

      這里,研究人員通過爬蟲應用程序和網頁,從各種設備(包括臺式機、移動設備和平板電腦)收集了大量屏幕截圖。

      然后,這些屏幕截圖會使用詳細的標簽進行標注,這些標簽描述了UI 元素、它們的空間關系以及其他描述性信息。

      此外,為了給預訓練數據注入更大的多樣性,研究人員還利用語言模型的能力,特別是PaLM 2-S分兩個階段生成QA對。

      首先生成之前描述的屏幕模式。隨后,作者設計一個包含屏幕模式的提示,指導語言模型生成合成數據。

      經過幾次迭代后,可以確定一個有效生成所需任務的提示,如附錄C所示。

      為了評估這些生成響應的質量,研究人員對數據的一個子集進行了人工驗證,以確保達到預定的質量要求。

      該方法在圖2中進行了描述,大大提升預訓練數據集的深度與廣度。

      通過利用這些模型的自然語言處理能力,結合結構化的屏幕模式,便可以模擬各種用戶交互和情景。

      兩組不同任務

      接下來,研究人員為模型定義了兩組不同的任務:一組初始的預訓練任務和一組后續的微調任務。

      這兩組的區別主要在于兩個方面:

      - 真實數據的來源:對于微調任務,標記由人類評估者提供或驗證。對于預訓練任務,標記是使用自監督學習方法推斷的或使用其他模型生成的。

      - 數據集的大。和ǔnA訓練任務包含大量的樣本,因此,這些任務用于通過更擴展的一系列步驟來訓練模型。

      表2顯示所有預訓練任務的摘要。

      在混合數據中,數據集按其大小按比例加權,每個任務允許的最大權重。

      將多模態源納入多任務訓練中,從語言處理到視覺理解和網頁內容分析,使模型能夠有效處理不同的場景,并增強其整體多功能性和性能。

      研究人員在微調期間使用各種任務和基準來估計模型的質量。表3總結了這些基準,包括現有的主要屏幕、信息圖表和文檔理解基準。

      實驗結果

      圖4顯示了ScreenAI模型的性能,并將其與各種與屏幕和信息圖形相關的任務上的最新SOT結果進行了比較。

      可以看到,ScreenAI在不同任務上取得的領先性能。

      在表4中,研究人員呈現了使用OCR數據的單任務微調結果。

      對于QA任務,添加OCR可以提高性能(例如Complex ScreenQA、MPDocVQA和InfoVQA上高達4.5%)。

      然而,使用OCR會稍微增加輸入長度,從而導致整體訓練速度更慢。它還需要在推理時獲取OCR結果。

      另外,研究人員使用以下模型規模進行了單任務實驗:6.7億參數、20億參數和50億參數。

      在圖4中可以觀察到,對于所有任務,增加模型規模都可以改進性能,在最大規模下的改進還沒有飽和。

      對于需要更復雜的視覺文本和算術推理的任務(例如InfoVQA、ChartQA和Complex ScreenQA),20億參數模型和50億參數模型之間的改進明顯大于6.7億參數模型和20億參數模型。

      最后,圖5顯示了,對于長寬比>1.0的圖像(橫向模式圖像),pix2struct分割策略明顯優于固定網格分割。

      對于縱向模式圖像,趨勢相反,但固定網格分割僅稍微好一些。

      鑒于研究人員希望ScreenAI模型能夠在不同長寬比的圖像上使用,因此選擇使用pix2struct分割策略。

      谷歌研究人員表示,ScreenAI模型還需要在一些任務上進行更多研究,以縮小與GPT-4和Gemini等更大模型的差距。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    国产免费观看久久| 日韩成人精品一区| 亚洲国产岛国毛片在线| 亚洲第一区色| 一个人看的www视频在线免费观看| 成人激情在线观看| 亚洲国产一区二区三区在线播| 欧美大胆在线视频| 91精品国产福利| 亚洲警察之高压线| 91大神在线播放精品| 日韩美女av在线免费观看| 国产在线精品自拍| 一区二区久久久| 精品久久91| 成人毛片av在线| 国产91色在线|亚洲| 国产欧美久久一区二区三区| 亚洲综合精品自拍| 精品久久国产老人久久综合| 男人操女人的视频在线观看欧美| 激情懂色av一区av二区av| www.av一区视频| 在线一区二区三区做爰视频网站| 欧美视频日韩视频| 亚洲免费av网站| 高清免费成人av| 中文字幕日韩免费视频| 久久99精品国产麻豆婷婷| 日韩不卡一区二区三区| 久久爱www成人| 97久久精品人人做人人爽50路| 久久久久久尹人网香蕉| 久久www免费人成精品| 久久精品国产亚洲aⅴ| 欧美日韩精品免费观看视完整| 成人国产免费视频| 国产精品丝袜在线播放| 五月天久久网站| 亚洲欧洲av一区二区| 午夜精品一区二区三区在线| 91日韩一区二区三区| 精品无人乱码一区二区三区的优势| 综合激情成人伊人| 日韩欧美精品一区二区三区经典| 国产原厂视频在线观看| 欧美日韩国产高清一区二区| 成人a'v在线播放| www.欧美三级电影.com| 国产午夜亚洲精品午夜鲁丝片| 2014亚洲片线观看视频免费| 午夜免费日韩视频| 久久精品国产理论片免费| 欧美一区二区福利视频| 欧美亚洲自偷自偷| 精品亚洲国产成av人片传媒| 亚洲精品一二三**| 中文字幕一区二区三区四区| 成人动漫视频在线观看免费| 精品va天堂亚洲国产| 91在线观看| 国产精品亚洲一区二区三区在线| 一本一道综合狠狠老| 欧美xxxxx牲另类人与| 亚洲男女毛片无遮挡| 成人免费网站观看| www免费在线观看| 欧美一区二区三区在线观看视频| 亚洲精品电影久久久| 国产91精品在线播放| 欧美日韩一区二区三区在线看| 日韩欧美激情四射| 华人av在线| 欧美猛交免费看| 国产精品一区二区三区毛片淫片| 91丨porny丨在线| 欧美美女激情18p| 日韩极品在线观看| 免费成人美女在线观看| 欧美日韩国产一区二区三区不卡| 国产视频一区二| 午夜视频在线观看一区| av伦理在线| 亚洲午夜久久久久久久久电影院| 国产精品久久午夜夜伦鲁鲁| 欧美国产日本视频| 国产福利在线免费观看| 国产欧亚日韩视频| 91精品国自产在线观看| 水蜜桃在线视频| 国产中文字幕精品| 97在线免费观看视频| 在线区一区二视频| 日本麻豆一区二区三区视频| 77777影视视频在线观看| …久久精品99久久香蕉国产| 99精品免费| 美女扒开腿让男人桶爽久久动漫| 国产乱人伦精品一区二区在线观看| 日韩女优中文字幕| 国产91精品欧美| 四虎成人精品一区二区免费网站| 黄色片网站在线| 视频一区二区三| 亚洲精品一区二区三区蜜桃久| 欧美jizz19性欧美| 精品视频在线一区二区在线| 岛国在线视频免费看| 国产精品久久久久秋霞鲁丝| 在线观看日韩av| 欧美freesex黑人又粗又大| 国产精品一区二区婷婷| 久久天堂国产精品| 美女少妇精品视频| 香蕉久久免费影视| 国产精品久99| 1769视频在线播放免费观看| 中文字幕精品久久| 日韩中文字幕亚洲| 麻豆国产精品va在线观看不卡| 日本一区免费视频| 少女频道在线观看免费播放电视剧| 中文成人av在线| 亚洲风情在线资源| 亚洲偷欧美偷国内偷| 亚洲一区二区三区四区五区黄| 天堂va在线| 国产精品一品视频| 久久国产精品免费一区| 国产亚洲成人一区| 国产亚洲成aⅴ人片在线观看| 综合久久久久| 亚洲桃色综合影院| 国产一区玩具在线观看| 久久成人精品电影| 欧美高清在线观看| 欧美××××黑人××性爽| 久久成人免费网| 大地资源网3页在线观看| 成人黄视频在线观看| 欧美亚洲日本精品| 精品一区二区三区在线观看视频| 亚洲日本一区二区三区在线| 日本中文字幕中出在线| av午夜精品一区二区三区| 中文字幕日韩欧美精品高清在线| 欧美美女在线| 亚洲综合第一页| 国产视频一区欧美| 奇米影视一区二区三区| 992tv国产精品成人影院| 国产精品中文有码| 欧美成人免费小视频| 96视频在线观看欧美| 国产农村妇女毛片精品久久麻豆| 久久理论片午夜琪琪电影网| 国产精品国色综合久久| 欧美理论片在线| 丝袜a∨在线一区二区三区不卡| 91情侣在线视频| 亚洲综合在线免费观看| 国产精品久久综合av爱欲tv| 最近2019中文字幕第三页视频| 国产人成亚洲第一网站在线播放|