国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

  • 首頁 > 云計算頻道 > 大模型

    OpenAI科學家盛贊中國大模型:算法非常強,算力用到極致!

    2024年12月30日 09:21:30 來源:AIGC開放社區公眾號

      OpenAI創始團隊成員、高級研究科學家Andrej Karpathy很罕見地,分享了一個來自中國的開源大模型——DeepSeek-v3。

      Karpathy表示,DeepSeek僅用了280萬小時的GPU算力,就訓練出了比Llama-3405B(使用3080萬小時GPU)更強的前沿模型,整體成本節省了11倍左右,將算力發揮到了極致。

      這為小模型和受算力限制的組織打開了全新世界——即便在算力有限的情況下,使用高質量數據、更好的算法同樣能訓練出高性能大模型。

      此外, DeepSeek在MMLU、DROP、Codeforces、AIME等多個主流基準測試中,性能大幅度超過了GPT-4o、Claude-3.5-Sonnet、Qwen2.5-72B等著名開閉源模型,成為目前最強開源大模型之一。

      國外網友表示,看來限制對中國的芯片供應并沒有扼殺他們的進步,反而促進了技術創新。有趣的是,資源限制不僅僅是障礙,它們還能強有力地推動創造力。

      看了這個網友評論還是挺心酸的,國內被限制AI芯片,無法獲得更高的算力,我們靠著智慧、創新精神依然沖破封鎖——天行健 君子以自強不息!

      中國人得到“檸檬”后,會榨干它的每一滴汁,然后做出美味的檸檬水。希望美國那些資源受限的實驗室也能取得同樣的成就。

      中國即將成為超級人工智能大國。

      這個模型很出色,但實現這一成就的團隊更優秀,人類的創造力真是無窮無盡。

      DeepSeek為彌補較小模型限制,進行的改進是否也可以應用于更大的模型?我們能否期待在使用10萬個 GPU 的集群時也獲得類似11倍的能力提升?

      很想嘗試DeepSeek的API,但是從今早開始一直失敗的。

      非常喜歡開源模型,他們迫使西方世界不得不降低價格。

      Deepseek的團隊是一群超有才華的前量化分析師。量化分析師以榨取每一點性能提升而聞名。他們又一次成功了,只是這次是在不同的領域。高智商的人真是世界的福音。

      他們的訓練效率非常瘋狂。

      使用的訓練數據與 Llama3405B 大致相同,約為15萬億。但在相同的訓練數據下,算力卻減少了10倍。

      哇塞,終于有人破解了訓練效率難題。當其他人都在用數十億美元計算他們的AI預算時,DeepSeek僅用他們的零頭就能開發出前沿大模型?磥恚瑑H僅投入更多的GPU并不總是解決問題的辦法。

      這位老哥直接上圖片,DeepSeek直接打跑OpenAI、Meta~

      Deep Seek v3模型簡單介紹

      Deep Seek V3的架構延續了第二代的高效推理和低成本訓練策略,主要包括多頭潛在注意力(MLA)和混合專家(MoE)兩大塊。

      MLA是V3的核心創新之一,主要用于減少推理過程中的內存占用。MLA將鍵和值壓縮為一個潛在向量,并在推理過程中僅緩存該向量,而不是完整的鍵和值矩陣。

      MLA的壓縮過程通過下投影矩陣和上投影矩陣實現。下投影矩陣將輸入向量壓縮為潛在向量,上投影矩陣將潛在向量還原為鍵和值。通過這種方式,MLA在推理過程中僅需緩存潛在向量和分離的鍵,從而顯著減少了內存占用。

      MLA還對查詢進行了低秩壓縮,進一步減少了訓練過程中的激活內存。所以,MLA是V3極大降低算力的主要原因之一。

      傳統的MoE架構,面對大規模的數據處理任務時,容易出現專家負載不均衡的情況。這種不均衡會導致嚴重的后果,其中最為突出的就是路由崩潰問題。當某些專家承擔了過多的負載,而其他專家則相對空閑時,路由機制可能會因為無法有效分配任務而陷入混亂,進而導致模型無法正常工作。

      由于專家負載的不平衡,計算資源無法得到合理分配,使得整體計算過程變得緩慢且低效。在處理復雜的語言任務時,需要大量的算力來支持模型的推理和決策過程。

      而V3對MoE進行了改良,引入了一套先進的動態調整機制,專門用于優化專家負載。在訓練過程中,使得MoE會實時監測每個專家的負載情況,通過一系列復雜而精確的算法,根據實際負載動態地調整任務分配。這種動態調整并非簡單的平均分配,而是根據專家的實時處理能力和當前任務的特點進行智能分配。

      例如,當某個專家的負載過高時,模型會自動將一部分任務轉移到負載較輕的專家上,確保每個專家都能在合理的負載范圍內工作。

      此外,V3的MoE 還使用了特殊的方法,會為每個專家設置一個動態的負載閾值,當負載超過該閾值時,觸發負載調整機制。在調整過程中,模型會綜合考慮多個因素,例如,專家的歷史處理效率、當前任務的緊急程度以及整個系統的負載均衡情況等,所以,V3的 MoE 既解讀了路由崩潰的難題,還將算力發揮到了極致。

      其實寫到這里心里有一個疑問,Deep Seek要是有10萬張***,能開發出像o3那樣的超強大模型嗎?

      Deep Seek除了開源最新模型之外,他們還提供了免費的在線服務,想嘗試的小伙伴可以去體驗一下。值得一提的是,還可以使用像o1模型那樣的深度思考模式,并且會把整個推理過程全部寫出來。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    亚洲成av人片在线| 亚洲激情图片qvod| 日韩一区二区电影在线| 亚洲国产精品一区在线观看不卡| 欧美日韩精品在线一区| 日韩一区网站| 91麻豆免费看| 深夜精品寂寞黄网站在线观看| 国产三级一区| 亚洲一区二区三区无吗| 欧美综合第一页| 成人免费无遮挡| 国产伦精品一区二区三区免| 欧美成aaa人片在线观看蜜臀| 久久久久国产视频| 国产黄色免费在线观看| 妖精一区二区三区精品视频| 久久亚洲春色中文字幕久久久| 麻豆久久一区二区| 日韩av最新在线观看| 秋霞影院一区| 国产97在线观看| 国产视频在线观看一区二区| 久久99蜜桃综合影院免费观看| 日韩精品乱码免费| 欧美性大战久久| 成人黄色片网站| 91免费视频网| 亚洲国产成人久久| 欧美韩日一区二区三区四区| 成人97在线观看视频| 悠悠资源网久久精品| 日韩国产在线看| 精品国产99久久久久久| 午夜午夜精品一区二区三区文| 婷婷精品在线| 欧美日韩经典丝袜| 日本午夜精品一区二区三区电影| 亚洲区小说区图片区qvod按摩| av影院在线免费观看| 亚洲精品98久久久久久中文字幕| 欧美日韩精品一区二区| 无码日韩精品一区二区免费| 亚洲精品国产成人| 不卡电影一区二区三区| 久久精品国产秦先生| 884aa四虎影成人精品一区| 精品一区日韩成人| 欧美日韩免费观看一区| 国产欧美精品一区二区| 日韩综合中文字幕| 日本欧美国产在线| 日本欧美一区| 国产乱码精品一区二区三区中文| 欧美性大战久久久久久久| 亚洲人成精品久久久| 免费日韩电影| 丝袜足脚交91精品| 亚洲小视频在线| 亚洲最大激情中文字幕| 国产玖玖精品视频| 日韩激情av在线播放| 色999韩欧美国产综合俺来也| 中文久久乱码一区二区| 91超碰碰碰碰久久久久久综合| 草草视频在线一区二区| 高清国产午夜精品久久久久久| 91超碰碰碰碰久久久久久综合| 6699嫩草久久久精品影院| 国产传媒在线| 欧美与亚洲与日本直播| 99免费精品在线观看| 都市激情一区| 青青视频一区二区| 亚洲综合免费观看高清在线观看| 久久密一区二区三区| 国产福利一区二区| 麻豆免费看一区二区三区| 欧美一区二区三区在线播放| 欧美中文字幕一二三区视频| 亚洲天堂av一区| 天天综合天天做天天综合| 色哟哟入口国产精品| 欧美一区二区福利在线| 婷婷久久综合九色综合绿巨人| 911精品美国片911久久久| 超碰在线caoporn| 24小时免费看片在线观看| 久久国产精品久久w女人spa| 国产欧美精品日韩精品| 成人妖精视频yjsp地址| xvideos亚洲人网站| 69av在线播放| 亚洲精选视频免费看| 国产福利一区二区三区在线视频| 伊人天天综合| 97超碰资源站在线观看| 东热在线免费视频| 欧美特黄色片| 欧美精品播放| 日韩成人av电影在线| 日韩国产在线一区| 亚洲第一激情av| 在线一区二区三区四区| 国产网站欧美日韩免费精品在线观看| 在线免费观看羞羞视频一区二区| 性8sex亚洲区入口| 一区二区三区视频免费| 色一情一乱一伦一区二区三区| 国产成人精品免高潮在线观看| 久久国产欧美日韩精品| 日韩最新免费不卡| 91久久精品国产91久久| 国产精品爽爽爽爽爽爽在线观看| 国产亚洲精久久久久久| 日韩在线影视| 3344国产永久在线观看视频| 欧美www视频在线观看| 欧美日韩一区二区国产| 精品久久久久久综合日本欧美| 精品久久久av| 欧美性资源免费| 日韩精品中午字幕| 最新欧美精品一区二区三区| 另类视频一区二区三区| 久久久精品一区二区| a级片在线免费| 精品国产欧美| 福利一区二区在线| 99视频这里有精品| 欧美福利在线播放网址导航| 国产一区二区在线免费视频| √新版天堂资源在线资源| 五月天丁香综合久久国产| 在线中文字幕日韩| 秋霞午夜av一区二区三区| 国产亚洲精品美女久久久久久久久久| 中文字幕资源网在线观看免费| 日韩一级二级三级精品视频| 一个人www视频在线免费观看| 都市激情亚洲| 搡老女人一区二区三区视频tv| 亚洲美女视频在线免费观看| 亚洲va欧美va国产综合剧情| 亚洲国产欧美一区二区三区久久| 夜夜躁狠狠躁日日躁2021日韩| 99视频一区二区三区| 欧洲在线视频| 免费一二一二在线视频| 成人免费电影网址| 亚洲第一天堂无码专区| av在线官网| 清纯唯美亚洲综合| 91麻豆国产福利在线观看宅福利| 久久久成人av毛片免费观看| 韩国av一区二区| 视频一区视频二区国产精品| 国产蜜臀av在线播放| 欧美777四色影| 日韩电影免费观看中文字幕| 国产秀色在线www免费观看| 国产日韩综合av| 成人免费91在线看| 韩日av一区二区|