国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

擔心寬帶速度縮水 來京東免費預約“寬帶測速”服務 專家上門解決網絡難題京東MALL現場直擊多款多噴頭3D打印機實操評測 消費級3D打印機迎來新突破里程碑時刻!縱橫第100家體驗中心榮耀啟幕,筑牢中國豪華越野品類生態根基惡意利用“七無天無理由退貨”政策法律不予支持!央視曝光“摸摸黨”拼多多聯席董事長趙佳臻:Temu將All In中國供應鏈以科技守味非遺!卡薩帝冰箱冬至將全國啟幕「好好吃」餃子館字節TRAE,正悄悄“解放”600萬工程師酷開再獲國家級“信任牌照”:數據安全彰顯戰略定力ThinkPad 2025黑FUN禮——了不起的offer,企業采購專享狂歡來襲!拼多多宣布實行聯席董事長制度 下一個三年爭取再造一個拼多多菜鳥將入股九識智能 無人車業務有望大整合抖音上線“長輩防走失模式”同程旅行發布2025年度旅行榜:長線出行北上廣至川藏航線熱度居首XR專利首案在歐洲落地,中國智造出海風險與機遇并行超能小度,賦能生長,小度全屋智能舉辦年終核心服務商成長特訓營破“內卷”、立標準、向未來 光伏行業領袖共話行業生態重塑之道AI重構2026年線上帶貨新生態:零庫存爆單、小紅書月銷百萬,開啟AI小店副業新時代人形機器人租賃市場大幅降溫 行業商業化路徑仍待探索阿里云AI Landing Zone正式發布,助力企業從“上好云”到“用好AI”的戰略升級118家標桿企業脫穎而出,定義AI時代的雇主標桿!2025NFuture最佳雇主AI榜單重磅發布
  • 首頁 > 云計算頻道 > 大模型

    OPPO大模型,主打非自研

    2023年11月01日 16:41:08 來源:解碼

      今年5月9日,發布僅3天的訊飛星火大模型就在一個評測榜單上拿了個國服第一,力壓清華智譜、復旦MOSS以及百度文心一言等國產大模型,僅次于GPT-4和GPT-3.5。

      本來外界對訊飛稱王并無異議,但這份榜單將文心一言列在最后一名,熱心網友就不樂意了。

      隨后發布榜單的評測機構SuperCLUE被曝光,一個仿照GLUE的國內民間組織,權威度和影響力與GLUE相去甚遠,其微信賬號主體屬性為個人,被網友戲稱為AI版李逵和李鬼。

      就連訊飛的稱王都被挖出來貓膩。

      評測榜單發布當天,SuperCLUE官網顯示信息,其測評顧問中排名第一的是崔一鳴,身份為學術顧問委員會主任,哈工大訊飛聯合實驗室(HFL)資深級研究員,而第二天官網就刪除了此條顧問信息。

      至于這個榜單本身,也被業內人士質疑其合理性,理由是沒有公布評估數據以及具體的評估方式。不過SuperCLUE在8月份進行了一次評測體系、方法及變動說明的解讀,算是變相回應,只不過3700道的測試題還是較SuperGLUE的2萬道相去甚遠。

      但SuperCLUE卻搖身一變,成為各種大模型PR稿里的救世主,堪稱大模型界的安兔兔和魯大師,個中內涵懂得都懂。

      手機廠商也順理成章成為了SuperCLUE的榜單?。比如OPPO和vivo,前者登上了9月的基礎能力排行榜,后者則拿下了10月的國服第一。

      在搞機圈跑分作弊早已不算秘密,2013年三星Galaxy S4就曾被曝跑分作弊,事后三星不得不向每位Galaxy S4購買者賠償10美元。

      到2018年,跑分作弊儼然已成一種行業亂象:各大手機廠商費盡心思優化跑分項目,有的甚至專門開設一個白名單,當檢測到是跑分軟件時,手機各方面的資源就全速運行,以此開啟芯片的極限性能模式。Anandtech就曾公開點名榮耀Play跑分作弊,跑分監測機制開啟和關閉的情況下,得分相差一倍。

      跑分作弊映射出的一個道理是,這種人為極限性能下的分數,設備根本不可能長時間保持這樣的水平,因此顯得毫無意義。

      而這種毫無意義的極限性能跑分,隱隱有傳到大模型的跡象。

      比如OPPO這次拿出來的SuperCLUE成績,還不是總榜單,而是十大基礎能力排行榜的“知識與百科”能力。

      在SuperCLUE的評測方案中,“知識與百科”屬于專業知識技能,包含歷史地理、科學技術、文化娛樂、社會人文等眾多任務。

      相對來說,“知識與百科”傾向于是有標準答案的問答評測,不過即便如此后期有用戶在測試OPPO大模型時,還是出現了魯迅和周樹人不是同一人的錯誤。

      拋開這種低級失誤,對于這種有針對性的評測,小米AI實驗室大模型團隊負責人欒劍此前在接受媒體采訪時就給過定論,目前這些榜單絕大部分都是學科問題,而且是選擇題為主,所以用它們對評估大模型的能力是有局限性的。

      “如果把這些學科的知識、這些學科搜集到的試題,都拿來對大模型做增強學習,它的效果一定可以達到很好。”界面新聞就曾曝光過兩種C-Eval“刷榜”方式:

      一種是找數據標注員把題目做一遍,第二種是用GPT-4把題做一遍,再把答案扣下來訓練大模型,這樣都能在相應學科測試中獲得滿分。

      問題的關鍵還在于,做這樣的訓練對大模型其它方面的能力可能會帶來負面影響。

      目前有一些開源的大模型迭代了版本之后,打榜的分數提高得很明顯,但如果測試它的生成能力,比如寫作水平,發現其實是有下降的。

      還有一點存疑的是,大模型評測榜單的合理性。

      比如今年5月SuperCLUE的榜單,文心一言在這個測評的評分是明顯偏低的,甚至連一些不知名的國產小型開源模型都比不過,測試結果與實際使用體驗不符。

      根源在于當時SuperCLUE的測試手段是讓大模型做選擇題(據稱是100道),而這是用來針對BERT時代的判別式AI模型,不適用于現在的這些生成式大模型。

      這倒也不是SuperCLUE一家的問題。華泰證券前資深算法工程師邱震宇此前曾深入探究了市面上大模型的各類評測集,綜合比較了各家榜單結果,得出的結論是現在并不存在一個公認有效的評測方式。

      大模型是一個新的范式,其實一個范式除了對底層邏輯的解釋,也需要有一整套的訓練方法及評估方法。對大模型來說,這一整套合理的評估方法,大家還在探索中,沒有公認的標準。

      事實上,大模型很難去實現沒有偏頗的測試,所謂的AI模型排名沒有什么值得參考的實際價值,評價大模型的唯一標準就是能不能幫助用戶去解決實際的問題。

      看待打榜,只是從一個側面驗證一個基座大模型是不是能在某個領域里做到極致,但不代表說它就一定能給用戶帶來最好的應用體驗。

      在OPPO之前,已經有三家國內手機廠商公開了大模型進度,分別是華為、小米和vivo,均以語音助手的形式。而且各家像是打過商量一樣,幾乎是在同一時間對外吹風,再加上高通、谷歌、聯發科的頻頻官宣,上馬大模型儼然成為手機廠商的必選項。

      在這種你追我趕的態勢下,就很容易發生“有條件要上,沒有條件也要硬上”的老套情節。

      2019年OPPO推出小布助手,最初通過調用搜索引擎完成擴展問答,但整個體驗不暢,促使后來OPPO開始做知識圖譜和海量語料數據,相當于建了一個問答庫。

      這種機械的“檢索式回答”常見于當時的語音助手,優點是成本低上馬快,缺點則是周期長成本高,而且要面對長尾問題語音助手無法回答的尷尬。舉個例子,長江長還是黃河長這類問題,如果數據庫中沒有答案,語音助手就無法回答。

      為了解決問題,2021年OPPO找到了北京智源人工智能研究院,借悟道大模型推出了“生成式問答系統”,一定程度上彌補了自己的技術短板。

      彼時的OPPO屬于兩條腿走路,一邊從外面引入大模型,一邊在背后埋頭自研。

      2022年6月推出的預訓練模型OBERT,就是OPPO從發布前兩年開始探索的,共有一億、三億和十億參數三個版本。同年11月,OPPO語音語義研究部又推出參數量為30億的中文預訓練大模型CHAOS。

      但這兩個模型在網上能查到的資料很少,除了官宣的新聞稿外幾乎沒有其它消息。倒是今年4月,在阿里云峰會上,阿里云官方發布的「企業專屬大模型」合作名單里,OPPO卻位列第一。

      據阿里云CTO周靖人介紹,以上這一系列模型已經和阿里的行業模型形成了層次化、模塊化結構,行業模型可以在阿里預訓練模型之上進行定制,可以解決當下多達200個業務場景。

      換言之,這些AI模型本質上都是基于阿里云通義大模型完成的能力構建。這似乎意味著,OPPO的自研大模型或是火候不到,不得不暫時放棄自研,再轉向外部合作。

      坊間也有傳言稱vivo的大模型用的是開源的Llama2,雖不知真假,但也從側面反映出,手機廠商做大模型的一個被動:無論宣傳上多么高調,總令人懷疑沒這個技術實力。

      至于是自研好還是外部合作好,就各有論調了。

      自研的難點在于,從0開始基礎大模型的預訓練,資金投入需要非常大,除此以外,數據、算力、know-how、維護等也是一道道門檻,但優勢也十分巨大,企業能夠掌握自己定制模型結構的能力。

      在各種設備終端上,使用的芯片不同,就會對模型提出各種各樣的要求,這些要求可能細節到一些算子不支持,或者某種結構運行起來效率不高。手機廠商必須根據硬件提出的要求,對模型結構做一些調整。

      如果想修改模型結構的話,就一定需要具備從頭開始訓練的能力。因為開源模型的結構是固定的,沒有辦法調整,就不能滿足需求。

      而外部合作的優勢正是自研的難點,百度、阿里等平臺型企業幾乎提供了一條龍服務,不僅省下了成本,還有性能/中文增強、數據集、應用范式等系列服務,幾乎一鍵開發大模型。

      尾聲

      今年2月,高通在一部沒有聯網的Android手機上使用了Stable Diffusion 來生成AI圖像,整個生成時間不超過15秒,過程全部在手機上進行。剛剛發布的驍龍8 Gen3,已經可以支持運行100億參數的生成式AI模型。

      今年5月的谷歌I/O大會上,谷歌一口氣發布了四個新一代大語言模型 PaLM 2。其中最小的“壁虎”大模型,可以適配手機運行。

      到今天,手機大模型已經是一個無可爭議的趨勢。但擺在手機廠商面前的問題似乎都被它們忽視了:大模型究竟能為用戶帶來什么?

      至少在當前,無論是華為、小米還是vivo、OPPO,其內嵌大模型的語音助手還沒有“涌現”的跡象,提供的功能也沒有超出通用大模型的范疇。

      而按照手機廠商的慣用套路,新技術是否驅動了新需求尚未可知,但驅動新價格幾乎是毫無疑問的。

      參考資料

      [1] 國內大模型爭霸賽,這是你心目中的大模型排名嗎?機器學習

      [2] 跑的高能賣錢?手機廠商為啥要跑分作弊,威鋒網

      [3] 小米的大模型“野心”,始于端側,騰訊科技

      [4] 誰在評價大模型?AI大模型評測榜單亂象調查,界面新聞

      [5] 手機跑分突破110萬!跑分到底是娛樂還是有可信度?中關村在線

      [6] 登頂CLUE與MUGE,OPPO語音語義研究部推出中文預訓練大模型CHAOS, 新聞助手

      [7] 登頂KgCLUE,OPPO小布推出預訓練大模型OBERT,OPPO小布團隊

      [8] 全球最大智能模型“悟道”首次落地:數字人+終端AI助手,支持NVIDIA GTX單卡機運行百億大模型,雷鋒網

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    国产成人亚洲综合a∨婷婷| 欧美成人a视频| 国产在线国偷精品产拍免费yy| 91高跟黑色丝袜呻吟在线观看| 日韩电影在线看| 国产九色在线| 久久久久久亚洲| 久久狠狠婷婷| 欧美激情精品久久久六区热门| 色噜噜色狠狠狠狠狠综合色一| 国产精品一香蕉国产线看观看| 国产成人在线观看免费网站| 涩涩日韩在线| 精品国产一区二| 日韩欧美一区二区不卡| 亚洲人成电影在线播放| yourporn在线观看视频| 色欧美日韩亚洲| 91美女片黄在线观| 亚洲精品视频免费| 电影一区电影二区| 中文字幕视频一区二区在线有码| 国产精品av一区二区三区| 精品国产伦一区二区三区免费| 动漫3d精品一区二区三区乱码| 中文在线观看免费| 精品一区日韩成人| 欧美日韩一级视频| 日本一区二区三区在线播放| 国产999精品久久久久久绿帽| 日韩欧美四区| 四虎影院观看视频在线观看| 99成人在线视频| 国产精品久久久久久久久免费看| 国产理论电影在线| 不卡av免费观看| 欧美一级电影久久| 国产 欧美在线| 午夜一区二区三视频在线观看| av在线不卡精品| 久久久久久97| 午夜欧美理论片| 91久色国产| 日韩精品高清不卡| 日韩一区二区中文| 精品国产老师黑色丝袜高跟鞋| 欧美一区二区高清在线观看| 亚洲精品免费一二三区| 国产精品亚洲综合| 老牛影视一区二区三区| 亚洲黄色av女优在线观看| 亚洲一级电影视频| 欧美激情一区三区| 精品一区二区三区在线观看| 国产精品色在线网站| 7m第一福利500精品视频| 国产精品久久网| 欧美一级电影免费在线观看| 欧美日韩在线精品一区二区三区激情综合| 国产高清欧美| 欧美中文字幕在线播放| 68精品国产免费久久久久久婷婷| 综合av第一页| 国产精品白丝jk黑袜喷水| 亚洲国产伊人| 97aⅴ精品视频一二三区| 精品国产一区二区三区四区精华| 四虎亚洲精品| 懂色av一区二区三区| 国产一卡不卡| 欧美深夜福利| 5月丁香婷婷综合| 国产欧美欧洲在线观看| 经典三级一区二区| 一区二区三区在线免费播放| 欧美亚洲一区二区三区四区| 色久优优欧美色久优优| 欧美网站在线| 日本一区二区精品视频| 亚洲黄色性网站| 日韩av观看网址| 日韩第一区第二区| 久本草在线中文字幕亚洲| 日韩欧美在线视频观看| 久久久久久国产精品免费免费| 欧美一区日本一区韩国一区| 国产精选久久| 色婷婷av一区二区三区gif| 国产精品中文字幕久久久| 国产综合久久久久久| 国产综合久久久久| 91麻豆国产自产在线观看| 91超碰rencao97精品| 亚洲免费观看高清完整版在线观看熊| 成人黄色小视频在线观看| 国产精品久久久久久一区二区| 一区二区成人在线观看| 国产精品精品国产色婷婷| 成人精品电影在线观看| 欧美日韩另类丝袜其他| 国产69精品久久| 99国产精品99久久久久久粉嫩| 欧美在线激情网| 久久不射热爱视频精品| 国产精品久久久久久模特| 久久精品国产亚洲精品2020| 色在线视频观看| 一区二区三区| 精品中文字幕一区二区小辣椒| 亚洲男人的天堂一区二区| 亚洲精品一区二区在线观看| 91在线精品播放| 日韩电影中文字幕在线| 欧美激情图片区| 国产精品视频麻豆| 欧美午夜激情在线| 美女尤物久久精品| 一区二区三区精品在线| 欧美变态凌虐bdsm| 久久久天堂av| 国产精品欧美大片| 成人影院在线免费观看| 羞羞色国产精品| 亚洲免费观看在线视频| 九九热这里只有精品6| 91老司机在线| 亚洲欧美日韩一区在线| 成人影院在线免费观看| 亚洲国产网站| 久久久精品国产免费观看同学| 91精品国产视频| 亚洲精品456在线播放狼人| 亚洲女人天堂网| 香蕉成人啪国产精品视频综合网| 国产午夜精品福利| 狠狠做深爱婷婷综合一区| 欧美福利精品| 久久久久综合一区二区三区| 国产精品成人久久久久| 中文字幕乱码中文乱码51精品| 91精品国产91久久久久久久久| 一本色道69色精品综合久久| 亚洲成人精品一区| 狠狠色伊人亚洲综合成人| 一个人看的www久久| 国产精品美女久久久久久久久久久| 色青青草原桃花久久综合| 亚洲欧美一区二区三区在线| 国产精品久久久久久久久久三级| 国产麻豆成人精品| 亚洲精品菠萝久久久久久久| 成人性生交大片免费看视频在线| 97成人在线视频| 国产福利在线免费观看| 亚洲欧美中日韩| 日韩福利一区| 亚洲少妇最新在线视频| 激情久久久久久久久久久久久久久久| 久久国产一区| 久久精品主播| 夜夜躁狠狠躁日日躁2021日韩| 都市激情亚洲欧美| 久草在线成人| 中文字幕免费精品|