国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

零際品牌全球發布會【10月28日19:00直播中】來京東11.11先人一步下單一加 15、一加 Ace 6 享限量現貨優先發貨京東前采銷回應爭議:“比價”機制旨在保障消費者權益別“買貴了”京東發布“家有3米看百吋”電視觀看距離標準 100%免費送裝一體解決購機難題供需變化下的產業機遇:長鑫科技以雙突破引領存儲創新遇見·新視界”:LG UltraGear電競顯示器全景式體驗,多款新品陸續登場把舞臺拍成電影——佳能“佳直播PRO”助力譚維維《聲聲世世》音樂會幕后2025世界頂尖科學家論壇青年科學家大會在滬舉辦,深度對話頂尖大師總裁敲門,福利到家!京東11.11總裁送貨直播豪送E卡與免單大獎熱賣榜單已出爐 京東攜手11.11驚喜大使劉宇寧陪你逛3C數碼AI發電日Fender攜2025新品亮相上海國際樂器展 多元活動深度聯結本土音樂生態openvela首屆全球開發者大會圓滿落幕,NuttX創始人Greg親臨現場10月24日程序員節 京東11.11時尚辦公文具爆款直降 低至五折宇樹發布H2,優必選斬單,人形機器人走向實用主義長城汽車:2025 年第三季度營收 612.47 億元,同比增長 20.51%北汽藍谷:2025 年第三季度營收 58.67 億元,同比下降 3.45%九號公司:2025 年第三季度凈利潤 5.46 億元,同比增長 45.86%廣汽集團:2025 年第三季度營收 241.06 億元,同比下降 14.62%福特暫停F-150 Lightning生產,優先保障燃油混動車型OPPO與螞蟻集團簽署戰略合作:10月底推出“支付寶碰一下發紅包”功能
  • 首頁 > 云計算頻道 > 大模型

    谷歌:大模型不僅有涌現能力,訓練時間長了還有「領悟」能力

    2023年08月15日 14:26:06 來源:微信公眾號 機器之心

      本文來自于微信公眾號 機器之心(ID:almosthuman2014),作者:陳萍、小舟、梓文。

      模型在達到一定規模時會出現涌現現象,谷歌的研究表明,模型在訓練到一定時間后,會出現另一種現象,即「領悟」現象。

      2021年,研究人員在訓練一系列微型模型時取得了一個驚人的發現,即模型經過長時間的訓練后,會有一個變化,從開始只會「記憶訓練數據」,轉變為對沒見過的數據也表現出很強的泛化能力。

      這種現象被稱為「領悟(grokking)」,如下圖所示,模型在長時間擬合訓練數據后,「領悟」現象會突然出現。

      既然微型模型有這種特性,那么更復雜一點的模型在經過更長時間的訓練后,是否也會突然出現「領悟」現象?最近大型語言模型(LLM)發展迅猛,它們看起來對世界有著豐富的理解力,很多人認為 LLM 只是在重復所記憶的訓練內容,這一說法正確性如何,我們該如何判斷 LLM 是輸出記憶內容,還是對輸入數據進行了很好的泛化?

      為了更好的了解這一問題,本文來自谷歌的研究者撰寫了一篇博客,試圖弄清楚大模型突然出現「領悟」現象的真正原因。

      本文先從微型模型的訓練動態開始,他們設計了一個具有24個神經元的單層 MLP,訓練它們學會做模加法(modular addition)任務,我們只需知道這個任務的輸出是周期性的,其形式為 (a + b) mod n。

      MLP 模型權重如下圖所示,研究發現模型的權重最初非常嘈雜,但隨著時間的增加,開始表現出周期性。

      如果將單個神經元的權重可視化,這種周期性變化更加明顯:

      別小看周期性,權重的周期性表明該模型正在學習某種數學結構,這也是模型從記憶數據轉變為具有泛化能力的關鍵。很多人對這一轉變感到迷惑,為什么模型會從記憶數據模式轉變為泛化數據模式。

      用01序列進行實驗

      為了判斷模型是在泛化還是記憶,該研究訓練模型預測30個1和0隨機序列的前三位數字中是否有奇數個1。例如000110010110001010111001001011為0,而010110010110001010111001001011為1。這基本就是一個稍微棘手的 XOR 運算問題,帶有一些干擾噪聲。如果模型在泛化,那么應該只使用序列的前三位數字;而如果模型正在記憶訓練數據,那么它還會使用后續數字。

      該研究使用的模型是一個單層 MLP,在1200個序列的固定批上進行訓練。起初,只有訓練準確率有所提高,即模型會記住訓練數據。與模運算一樣,測試準確率本質上是隨機的,隨著模型學會通用解決方案而急劇上升。

      通過01序列問題這個簡單的示例,我們可以更容易地理解為什么會發生這種情況。原因就是模型在訓練期間會做兩件事:最小化損失 和權重衰減。在模型泛化之前,訓練損失實際上會略有增加,因為它交換了與輸出正確標簽相關的損失,以獲得較低的權重。

      測試損失的急劇下降使得模型看起來像是突然泛化,但如果查看模型在訓練過程中的權重,大多數模型都會在兩個解之間平滑地插值。當與后續分散注意力的數字相連的最后一個權重通過權重衰減被修剪時,快速泛化就會發生。

      「領悟」現象是什么時候發生的?

      值得注意的是,「領悟(grokking)」是一種偶然現象 —— 如果模型大小、權重衰減、數據大小和其他超參數不合適,「領悟」現象就會消失。如果權重衰減太少,模型就會對訓練數據過渡擬合。如果權重衰減過多,模型將無法學到任何東西。

      下面,該研究使用不同的超參數針對1和0任務訓練了1000多個模型。訓練過程充滿噪音,因此針對每組超參數訓練了九個模型。表明只有兩類模型出現「領悟」現象,藍色和黃色。

      具有五個神經元的模塊化加法

      模加法 a+b mod67是周期性的,如果總和超過67,則答案會產生環繞現象,可以用一個圓來表示。為了簡化問題,該研究構建了一個嵌入矩陣,使用 cos⁡ 和 sin⁡ 將 a 和 b 放置在圓上,表示為如下形式。

      結果表明,模型僅用5個神經元就可以完美準確地找到解決方案:

      觀察經過訓練的參數,研究團隊發現所有神經元都收斂到大致相等的范數。如果直接繪制它們的 cos⁡ 和 sin⁡ 分量,它們基本上均勻分布在一個圓上。

      接下來是

      ,它是從頭開始訓練的,沒有內置周期性,這個模型有很多不同的頻率。

      該研究使用離散傅立葉變換 (DFT) 分離出頻率。就像在1和0任務中一樣,只有幾個權重起到關鍵作用:

      下圖表明,在不同的頻率,模型也能實現「領悟」:

      開放問題

      現在,雖然我們對單層 MLP 解決模加法的機制及其在訓練過程中出現的原因有了扎實的了解,但在記憶和泛化方面仍有許多有趣的開放性問題。

      哪種模型的約束效果更好呢?

      從廣義上講,權重衰減的確可以引導各種模型避免記憶訓練數據。其他有助于避免過擬合的技術包括 dropout、縮小模型,甚至數值不穩定的優化算法。這些方法以復雜的非線性方式相互作用,因此很難先驗地預測哪種方法最終會誘導泛化。

      此外,不同的超參數也會使改進不那么突然。

      為什么記憶比泛化更容易?

      有一種理論認為:記憶訓練集的方法可能比泛化解法多得多。因此,從統計學上講,記憶應該更有可能首先發生,尤其是在沒有正則化或正則化很少的情況中。正則化技術(如權重衰減)會優先考慮某些解決方案,例如,優先考慮 「稀疏 」解決方案,而不是 「密集 」解決方案。

      研究表明,泛化與結構良好的表征有關。然而,這不是必要條件;在求解模加法時,一些沒有對稱輸入的 MLP 變體學習到的 「循環 」表征較少。研究團隊還發現,結構良好的表征并不是泛化的充分條件。這個小模型(訓練時沒有權重衰減)開始泛化,然后轉為使用周期性嵌入的記憶。

      在下圖中可以看到,如果沒有權重衰減,記憶模型可以學習更大的權重來減少損失。

      甚至可以找到模型開始泛化的超參數,然后切換到記憶,然后切換回泛化。

      較大的模型呢?

      理解模加法的解決方案并非易事。我們有希望理解更大的模型嗎?在這條路上可能需要:

      1) 訓練更簡單的模型,具有更多的歸納偏差和更少的運動部件。

      2) 使用它們來解釋更大模型如何工作的費解部分。

      3) 按需重復。

      研究團隊相信,這可能是一種更好地有效理解大型模型的的方法,此外,隨著時間的推移,這種機制化的可解釋性方法可能有助于識別模式,從而使神經網絡所學算法的揭示變得容易甚至自動化。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    不卡一卡二卡三乱码免费网站| 91精品国产自产精品男人的天堂| 一区二区福利视频| 欧美一区二区观看视频| 蜜臀av国内免费精品久久久夜夜| 国产精品二区不卡| 国产欧美精品久久| 午夜精品视频一区二区三区在线看| 亚洲嫩草精品久久| 久久免费黄色| 国产精品jk白丝蜜臀av小说| 国自产拍偷拍福利精品免费一| 91传媒免费看| 日韩激情美女| 666欧美在线视频| 国产成人8x视频一区二区| 日韩wuma| 沈樵精品国产成av片| 黄色欧美成人| 亚洲国产日韩一级| 中文字幕乱码在线播放| 久久国产夜色精品鲁鲁99| 亚洲人成久久| 久久久www免费人成黑人精品| 一本色道久久综合亚洲精品不卡| 日本韩国欧美三级| 婷婷精品久久久久久久久久不卡| 亚洲电影成人av99爱色| 91视频成人| 91免费电影网站| 相泽南亚洲一区二区在线播放| 精品中文字幕人| 国产尤物久久久| 最近2019好看的中文字幕免费| 日本一区二区三区电影免费观看| 日韩精品视频中文字幕| 国产精品一区在线观看乱码| 精品国产日本| 国产免费一区二区三区香蕉精| 亚洲午夜精品| 欧美私人啪啪vps| 神马午夜伦理不卡| 欧美精品综合| 亚洲欧美在线第一页| 久久综合九色欧美综合狠狠| 久久综合色一综合色88| 国产精品一二区| 色偷偷综合网| 亚洲国产日韩精品在线| 人人狠狠综合久久亚洲婷| 78精品国产综合久久香蕉| 日本精品免费观看高清观看| 精品免费av一区二区三区| 欧美日韩精品一区二区视频| 亚洲午夜在线视频| 国产精品中文| 日本一区免费看| 国产一区二区三区在线看麻豆| 91精品国产综合久久香蕉麻豆| 国产精品乱战久久久| 日本一区二区三区免费乱视频| 国产精品高潮呻吟久久av无限| 亚洲成人xxx| 国产综合在线视频| 亚洲欧洲国产精品久久| 欧美在线观看天堂一区二区三区| 欧美激情视频免费观看| 国产精品高潮呻吟久久久久| 香蕉久久夜色精品| 美女福利一区二区| 日本公妇乱淫免费视频一区三区| 日韩中文字幕av在线| 欧美va亚洲va在线观看蝴蝶网| 春色校园综合激情亚洲| 香蕉久久夜色精品国产| 91精品视频在线免费观看| 亚洲成人自拍网| 久久精品午夜一区二区福利| 国产嫩草一区二区三区在线观看| 麻豆免费在线| 成年在线观看免费人视频| 国产亚洲1区2区3区| 欧美一区二区三区艳史| 欧美日韩国产综合新一区| 欧美mv日韩mv国产网站app| 亚洲伦理网站| 国产精品丝袜在线播放| 精品国产乱码久久久久久郑州公司| 欧美日韩亚洲精品内裤| 亚洲欧美在线播放| 国产精品免费视频xxxx| 国产精品精品视频| 成年人在线观看网站| 成av人电影在线观看| 一区二区三区久久| 欧美亚洲动漫精品| 亚洲欧洲另类精品久久综合| 久久久久久久久久久国产| 久久综合狠狠综合久久综青草| 狠狠综合久久av一区二区小说| 怕怕欧美视频免费大全| 日韩欧美一级二级三级| 老牛影视一区二区三区| 久久久久久久97| 国产激情一区| 亚洲男男av| 亚洲男人天堂手机在线| 亚洲理论电影网| 亚洲国产欧美一区二区三区丁香婷| 亚洲免费视频观看| 美女隐私在线观看| 久久99国产成人小视频| 欧美日韩和欧美的一区二区| 国模精品一区二区三区色天香| 欧美日韩中文字幕精品| 在线日韩av| av片在线观看永久免费| 在线视频国内自拍亚洲视频| 国产伦精品一区二区三区在线观看| 91亚洲精品久久久久久久久久久久| 日本久久精品视频| 欧美高清不卡| 亚洲一区在线播放| 五月开心婷婷久久| 最爽无遮挡行房视频在线| 日韩一区二区三区av| 国产欧美日韩综合精品| 欧美一区二区三区艳史| 精品亚洲一区二区三区在线播放| 日本一区二区动态图| 久久婷婷丁香| 久久精品欧美一区二区三区不卡| 欧美日韩高清在线一区| 国产亚洲在线| 日韩欧美精品电影| 国产精品自拍小视频| 国产精品三级电影| 久久精品亚洲国产| 精品欧美黑人一区二区三区| 久久福利网址导航| 热草久综合在线| h网站视频在线观看| 欧美精品日韩三级| 狂野欧美激情性xxxx欧美| 欧美精选视频在线观看| 一二三四社区欧美黄| 亚洲欧美日韩天堂一区二区| 亚洲成人精品| 久操精品在线| 欧美影视一区| 亚洲在线免费视频| 天海翼精品一区二区三区| 亚洲欧美欧美一区二区三区| 色爱综合区网| 黄色在线成人| 欧洲激情一区二区| 午夜国产一区| 国产精品日韩欧美综合| 国产热re99久久6国产精品| 高清视频一区二区三区| **女人18毛片一区二区| 亚洲精品中文在线观看| 久久久久久久一区二区| 日韩欧美精品一区二区三区经典|