国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

京東“吸MAO館”公益貓咖開業 參與活動領免費愛心貓窩中國科學探險協會與海爾智家簽署戰略合作協議《卷一:智慧科考站—生活艙標準體系建設指南(2026—2030年)》(白皮書)與《智慧科考站生活艙 家用和類似用途電器設計與選型指南》團體標準成功立項優必選宣布擬以 16.65 億元收購浙江鋒龍 43.01% 股份英偉達與 AI 芯片初創企業 Groq 達成技術授權協議英特爾®至強® D處理器:賦能智能網卡,破解算力-網絡協同瓶頸第四屆人工智能與產業鏈創新高層論壇暨2025寧波智能產品創新大賽圓滿落幕達到金牌分數線:字節跳動推出新一代數學推理專用模型Seed Prover 1.5小鵬X9超級增程全球首發冰雪穩行系統:100km/h剎停不跑偏光帆科技全球首款具備視覺感知能力的主動式AI耳機正式發布拼多多入選2025年《中國優秀品牌發展案例》以創新赴約,為未來賦能!鯤鵬昇騰創新大賽2025全國總決賽即將開賽聯想ThinkCentre X AIO Aura Edition 一體機曝光:27.6 英寸 16:18 屏幕阿福和靈光,能承載螞蟻的TO C野心嗎?啟信慧眼AI驅動智能商業決策,推動商業大數據B端市場革新TCL冠軍中國行,奧運冠軍趙蕊蕊見證小藍翼新一代AI健康空調發布冠軍見證,TCL空調雙新品亮相:定義年輕人“冠軍級”舒適生活中國第一具身大模型獲21億元融資,銀河通用機器人估值突破200億機構:生成式AI與自主AI代理推動電信客戶體驗框架轉型國產替代加速!900次場景落地,天數智芯釋放 AI 算力高成長潛力
  • 首頁 > 云計算頻道 > 大模型

    剛拿下NeurIPS最佳論文,字節就開源VAR文生圖版本,拿下SOTA擊敗擴散模型

    2025年01月03日 16:20:58 來源:量子位公眾號

      自回歸文生圖,迎來新王者——

      新開源模型Infinity,字節商業化技術團隊出品,超越Diffusion Model。

      值得一提的是,這其實是從前段時間斬獲NeurIPS最佳論文VAR衍生而來的文生圖版本。

      在預測下一級分辨率的基礎上,Infinity用更加細粒度的bitwise tokenizer建模圖像空間。同時他們將詞表擴展到無窮大,增大了Image tokenizer的表示空間,大大提高了自回歸文生圖的上限。他們還將模型大小擴展到20B。

      結果,不僅在圖像生成質量上直接擊敗了Stabel Diffusion3,在推理速度上,它完全繼承了VAR的速度優勢,2B模型上比同尺寸SD3快了3倍,比Flux dev快14倍,8B模型上比同尺寸的SD3.5快了7倍。

      目前模型和代碼都已開源,也提供了體驗網站。

      來看看具體細節。

      自回歸文生圖新王者

      在過去自回歸模型和擴散模型的對比中,自回歸模型廣受詬病的問題是生成圖像的畫質不高,缺乏高頻細節。

      在這一背景下,Infinity生成的圖像細節非常豐富,還能夠生成各種長寬比圖像,解掉了大家過去一直疑慮的VAR不支持動態分辨率的問題。

      具體性能上面,作為純粹的離散自回歸文生圖模型,Infinity在一眾自回歸方法中一鳴驚人,遠遠超過了HART、LlamaGen、Emu3等方法。

      與此同時,Infinity也超過了SDXL,Stable diffusion3等Diffusion路線的SOTA方法。

      人類評測上,用戶從畫面整體、指令遵循、美感三個方面對于Infinity生成圖像和HART、PixArt-Sigma、SD-XL、SD3-Meidum生成圖像進行了雙盲對比。

      其中HART是一個同樣基于VAR架構,融合了diffusion和自回歸的方法。PixArt-Sigma、SD-XL、SD3-Meidum是SOTA的擴散模型。

      Infinity以接近90%的beat rate擊敗了HART模型。顯示了Infinity在自回歸模型中的強勢地位。

      此外,Inifnity以75%、80%、65%的beat rate擊敗了SOTA的擴散模型如PixArt-Sigma、SD-XL、SD3-Meidum等,證明了Infinity能夠超過同尺寸的擴散模型。

      那么,這背后具體是如何實現的?

      Bitwise Token自回歸建模提升了模型的高頻表示

      大道至簡,Infinity的核心創新,就是提出了一個Bitwise Token的自回歸框架——

      拋棄原有的“Index-wise Token”,用+1或-1構成的細粒度的“Bitwise Token”預測下一級分辨率。

      在這個框架下,Infinity表現出很強的scaling特性,通過不斷地scaling視覺編碼器(Visual Tokenizer)和transformer,獲得更好的表現。

      在Bitwise Token自回歸框架中,關鍵技術是一個多尺度的比特粒度視覺編碼器(Visual Tokenizer)。

      它將H×W×3大小的圖像編碼、量化為多尺度的特征:1×1×d,2×2×d,…,h×w×d。其中d是視覺編碼器的維度,每一維是+1或-1。詞表的大小是2d。過去的方法中,會繼續將d維的特征組合成一個Index-wise Token(索引的范圍是0~2d-1,用這個Index-wise Token作為標簽進行多分類預測,總共類別是詞表大小,即2d。

      Index-wise Token存在模糊監督的問題。如下圖所示,當量化前的連續特征發生微小擾動后(0.01變成-0.1),Index-wise Token的標簽會發生劇烈變化(9變成1),使得模型優化困難。

      而Bitwise Token僅有一個比特標簽發生翻轉,其他比特標簽仍能提供穩定監督。相比于Index-wise Token,Bitwise Token更容易優化。

      研究人員在相同的實驗設置下對比了Index-wise Token和Bitwise Token。

      結果顯示,預測Bitwise Token能夠讓模型學到更細粒度的高頻信號,生成圖像的細節更加豐富。

      無窮大詞表擴展了Tokenizer表示空間

      從信息論的角度來看,擴散模型采用的連續Visual Tokenizer表示空間無窮大,而自回歸模型采用的離散Visual Tokenizer表示空間有限。

      這就導致了自回歸采用的Tokenizer對于圖像的壓縮程度更高,對于高頻細節的還原能力差。為了提升自回歸文生圖的上限,研究人員嘗試擴大詞表以提升Visual Tokenizer的效果。

      但是基于Index-wise Token的自回歸框架非常不適合擴大詞表。基于Index-wise Token的自回歸模型預測Token的方式如下圖左邊所示,模型參數量和詞表大小正相關。

      當d=32的時候,詞表大小為232,預測Index-wise Token的transformer分類器需要有2048×232=8.8×1012=8.8T的參數量!

      光一個分類器的參數量就達到了50個GPT3的參數量,這種情況下擴充詞表到無窮大顯然是不可能的。

      研究人員的解決方法簡單粗暴,如上圖右邊所示,丟掉索引,直接預測比特!有了Bitwise Token自回歸建模后,研究人員采用d個+1或-1的二分類器,并行地預測下一級分辨率+1或-1的比特標簽。做出這樣的改變后,參數量一下從8.8T降到了0.13M。所以說,采用Bitwise Token建模自回歸后,詞表可以無限大了。

      有了無限大詞表,離散化的Visual Tokenizer落后于連續的問題似乎沒有這么嚴重了:

      如上表所示,當詞表大小放大到后,離散的視覺編碼器在ImageNet上重建的FID居然超過了Stable Diffusion提出的連續的VAE。

      從可視化效果來看,無限大詞表(Vd=232),相比于小詞表,對于高頻細節(如上圖中的人物眼睛、手指)重建效果有質的提升

      Model Scaling穩步提升效果

      解決了制約生成效果天花板的視覺編碼器的問題后,研究人員開始了縮放詞表和縮放模型的一系列實驗。

      研究發現,對于125M的小模型,使用Vd=216的小詞表,相比于Vd=232的大詞表,收斂的更快更好。

      但是隨著模型的增大,大詞表的優勢逐漸體現出來。當模型增大到2B并且訓練迭代超過50K以后,大詞表取得了更好的效果。最終Infinity采取Vd=232的大詞表,考慮到232已經超過了int32的數值范圍,可以認為是無窮大的數,這也是Infinity的命名由來。

      總結來看,(無窮)大詞表加大模型,加上充分的訓練后,效果要明顯好于小詞表加大模型。

      除了scaling詞表以外,研究人員還做了對Infinity模型大小的scaling實驗。

      他們在完全相同的實驗設定下比較了125M、361M、940M、2.2B、4.7B五個不同尺寸大小的模型。

      可以看到,隨著模型的增大和訓練資源的增加,驗證集損失穩步下降,驗證集準確率穩定提升。另外,研究人員發現驗證集Loss和各項測試指標存在很強的線性關系,線性相關系數高達0.98。

      下圖每個九宮格對應同一個提示詞在不同模型大小、不同訓練步數的生成圖像。

      從上往下分別是:逐漸增大模型規模,對應125M、1B、5B模型生成的圖像。

      從左往右分別是模型訓練的步數逐漸增多后生成的圖像。

      我們能明顯看出:Infinity有著良好的scaling特性,更大的模型、更多的訓練,能夠生成語義結構、高頻細節更好的圖像。

      另外Infinity還提出了比特自我矯正技術,讓視覺自回歸文生圖模型具有了自我矯正的能力,緩解了自回歸推理時的累計誤差問題。

      Infinity還能夠生成各種長寬比圖像,解決了VAR不支持動態分辨率的問題。

      下圖列出了Infinity和其他文生圖模型對比的例子。

      可以看到,Infinity在指令遵循,文本渲染、畫面美感等方面都具有更好的表現。

      除了效果以外,Infinity完全繼承了VAR預測下一級分辨率的速度優勢,相比于擴散模型在推理速度上具有顯著的優勢。

      2B模型生成1024x1024的圖像用時僅為0.8s,相比于同尺寸的SD3-Medium提升了3倍,相比于12B的Flux Dev提升了14倍。8B模型比同尺寸的SD3.5快了7倍。20B 模型生成1024x1024的圖像用時3s,比12B的Flux Dev還是要快將近4倍。

      目前,在GitHub倉庫中,Infinity的訓練和推理代碼、demo、模型權重均已上線。

      Infinity2B和20B的模型都已經開放了網站體驗,感興趣的同學可以試一試效果。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    久久久久久亚洲综合影院红桃| 七七婷婷婷婷精品国产| 国产裸体写真av一区二区| 韩国av一区二区| 波多野结衣中文字幕久久| 亚洲字幕一区二区| 国产精品国产自产拍高清av水多| 亚洲一级二级三级| 国产宾馆实践打屁股91| 久久人人爽爽人人爽人人片av| 久久丁香综合五月国产三级网站| missav|免费高清av在线看| 1769视频在线播放免费观看| 国产成人综合在线播放| 欧美日本不卡高清| 亚洲天堂中文字幕在线观看| 欧美精品一区三区在线观看| 欧美日韩中文在线观看| 欧美伊人久久久久久久久影院| 国产一区二区视频在线看| 黄色美女久久久| 国产精品久久久久久久久久辛辛| 亚洲欧美日韩国产综合在线| 91精品国产色综合久久不卡98口| 偷拍自拍亚洲| 国产精品久久亚洲7777| 欧美成人午夜激情| 日本欧美加勒比视频| 亚洲女性喷水在线观看一区| 国产一区二区91| 中文字幕亚洲一区二区av在线| 日韩av在线导航| 91国拍精品国产粉嫩亚洲一区| 日韩欧美一级二级三级久久久| 理论片一区二区在线| 亚洲精品小视频| av中文在线资源库| 国产乱人伦精品一区二区在线观看| 久久精品亚洲精品国产欧美| 成人午夜在线观看视频| 国产成人精品久久二区二区91| 性欧美videoshd高清| 精品粉嫩aⅴ一区二区三区四区| 精品视频一区在线视频| 91视频欧美| 高清日韩电视剧大全免费| 亚洲韩国青草视频| 久久高清免费观看| 在线免费观看日本欧美| 亚洲专区中文字幕| 性欧美videosex高清少妇| 91亚洲自偷观看高清| 国产欧美视频一区二区三区| 亚洲字幕久久| 久久婷婷国产综合精品青草| 欧美午夜精品一区二区三区电影| 三级外国片在线观看视频| 精品免费视频一区二区| 开心久久婷婷综合中文字幕| 国内精品久久久久影院 日本资源| 欧美大片免费| 欧美羞羞视频| 先锋成人av| 亚洲一卡二卡三卡四卡五卡| 亚洲欧美日本韩国| 欧美粗暴jizz性欧美20| 99在线热播精品免费| 在线观看欧美www| 久久99久久99精品免观看软件| 国产精品国产自产拍在线| **精品中文字幕一区二区三区| 老**午夜毛片一区二区三区| 国产精品久久久久久户外露出| 亚洲综合一二三区| 在线亚洲欧美| 日韩黄色影视| 欧美另类99xxxxx| 中文字幕中文字幕一区二区| 久久婷婷av| 99re6在线精品视频免费播放| 国产成人免费视频网站| 欧美日韩夜夜| 国产精品18久久久久久vr| 久久黄色美女电影| 韩国av一区二区三区四区| 91av免费看| 久久在线播放| 欧美经典一区二区三区| 久久亚洲精品国产亚洲老地址| 国产三级伦理在线| 久久精品日产第一区二区三区| 天堂va久久久噜噜噜久久va| 久久av中文| 欧美日韩三区四区| 亚洲福利专区| 日韩美女天天操| 日韩电影视频免费| 视频一区国产精品| 91玉足脚交白嫩脚丫在线播放| 国产精品久久久久久久午夜| 国产精品igao视频| 亚洲一二三区在线观看| 久久深夜福利| 热99在线视频| 日韩av在线免费看| jizz亚洲女人高潮大叫| 欧美三级电影在线观看| 国产欧美中文字幕| 亚洲乱码精品一二三四区日韩在线| av在线播放一区二区三区| 在线观看中文字幕不卡| 在线播放欧美女士性生活| 911久久香蕉国产线看观看| 日韩欧美国产激情| 亚洲午夜精品视频| 欧美视频专区一二在线观看| 日韩精品免费电影| 精品免费视频一区二区| 在线观看久久av| 久久综合久久综合亚洲| bl视频在线免费观看| 欧美精品videosex牲欧美| 国产大陆精品国产| 蜜臀久久99精品久久一区二区| 欧美日韩在线亚洲一区蜜芽| 成人婷婷网色偷偷亚洲男人的天堂| 淫片在线观看| 中文字幕欧美亚洲| 欧美亚男人的天堂| 欧美日韩另类视频| 五月婷婷久久综合| 欧美日韩成人一区二区三区| 樱桃视频成人在线观看| 国产精品自在欧美一区| 成人av第一页| 亚洲天堂av老司机| 欧美另类精品xxxx孕妇| 亚洲欧美成人精品| 久久亚洲精品视频| 日韩一级视频免费观看在线| 日本高清免费不卡视频| 91在线播放网站| 在线观看精品国产视频| 成人免费视频观看| 视频一区二区中文字幕| 欧美大片日本大片免费观看| 日韩在线免费av| 国产精品久久久久久久久搜平片| 麻豆免费在线| 三级成人在线| 从欧美一区二区三区| 日日夜夜精品视频天天综合网| 99视频+国产日韩欧美| 欧美gv在线| 一二三四社区欧美黄| jizz性欧美23| 隔壁老王国产在线精品| 国产精品狠色婷| 99亚洲伊人久久精品影院红桃| 午夜影院久久久| 热久久天天拍国产| 欧美日韩一区二区三区四区在线观看| 久久久视频在线| 欧美亚洲视频在线看网址|