国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

京東MALL現場直擊多款多噴頭3D打印機實操評測 消費級3D打印機迎來新突破里程碑時刻!縱橫第100家體驗中心榮耀啟幕,筑牢中國豪華越野品類生態根基惡意利用“七無天無理由退貨”政策法律不予支持!央視曝光“摸摸黨”拼多多聯席董事長趙佳臻:Temu將All In中國供應鏈以科技守味非遺!卡薩帝冰箱冬至將全國啟幕「好好吃」餃子館字節TRAE,正悄悄“解放”600萬工程師酷開再獲國家級“信任牌照”:數據安全彰顯戰略定力ThinkPad 2025黑FUN禮——了不起的offer,企業采購專享狂歡來襲!拼多多宣布實行聯席董事長制度 下一個三年爭取再造一個拼多多菜鳥將入股九識智能 無人車業務有望大整合抖音上線“長輩防走失模式”同程旅行發布2025年度旅行榜:長線出行北上廣至川藏航線熱度居首XR專利首案在歐洲落地,中國智造出海風險與機遇并行超能小度,賦能生長,小度全屋智能舉辦年終核心服務商成長特訓營破“內卷”、立標準、向未來 光伏行業領袖共話行業生態重塑之道AI重構2026年線上帶貨新生態:零庫存爆單、小紅書月銷百萬,開啟AI小店副業新時代人形機器人租賃市場大幅降溫 行業商業化路徑仍待探索阿里云AI Landing Zone正式發布,助力企業從“上好云”到“用好AI”的戰略升級118家標桿企業脫穎而出,定義AI時代的雇主標桿!2025NFuture最佳雇主AI榜單重磅發布昇思人工智能框架峰會 | MindSpore Lite混合精度推理,實現內存節省30%,助力鴻蒙翻譯模型輕量化部署
  • 首頁 > 云計算頻道 > 大模型

    誰在成為大模型的「AI運營」

    2024年01月15日 21:08:38 來源:產業網

      在過去的一段時間里,“AI-native”成為所有工具的一個顯著探索趨勢,不論是算力集群的智算中心,還是數據庫側的向量數據庫,再或者是不斷進化的算法,都在以一種更適配大模型架構的方式被推演出來。

      那么,大模型時代,數據應該如何訓練?或者說,如何把數據在大模型側做更好的表達?

      “大模型如何落地?”

      在近一年的時間以來,關于這個問題的討論正在愈演愈烈。如果說市場對于大模型最開始的關注點更多的在參數、算力、開源,那么如今越來越多人的視線開始向更核心的環節轉移——數據。

      相較于算力等更簡單粗暴的命題,數據要更為復雜。從某種層面來說,它對應的是模型的知識質量。

      在10月底的一個關于大模型的閉門會上,這個問題更是被鮮明地提出。參會的人不乏底層通用大模型產品負責人,而更多地則是已經開始嘗試將大模型進行落地的企業從業者,其中模型接入方法有自研,也更有開源,但作為*批將大模型內嵌到企業場景的人,他們的共同反饋是:不能用,不好用。

      “我們很難把模型訓練成能嵌入場景或應用的樣子,不知道是哪里出了問題,是通用大模型本身能力不行,還是我們自己的數據訓練、標注不到位。”一位企業創始人表示。

      實際上,在大模型被越發高頻嘗試的當下,這正在成為越來越多企業面臨的問題。即在市面上即見即得的模型之外,如何將其轉化成企業自身能自己使用的大模型?

      “我們剛開始訓練了三輪,但越到后面越不好訓練,中間不僅花費算力,更花費的是人力。”上述創始人告訴產業家。

      在過去的一段時間里,“AI-native”成為所有工具的一個顯著探索趨勢,不論是算力集群的智算中心,還是數據庫側的向量數據庫,再或者是不斷進化的算法,都在以一種更適配大模型架構的方式被推演出來。

      但在最核心環節之一的數據側,進度卻始終緩慢。這種“緩慢”甚至成為著大模型在大規模場景落地的最關鍵掣肘之一。

      那么,大模型時代,數據應該如何訓練?或者說,如何把數據在大模型側做更好的表達?在即將到來的2024年,這個被擺到臺面上的問題已經不僅是這一步應該怎么邁,更升級的挑戰是這一步應該怎樣邁好。

      誰能先答好這個命題,誰就能快人一步。

      一、大模型的“關鍵一道門”,應該如何推開?

      “我們現在是把一些大模型的數據標注交給外包團隊。”這是在9月份和一位金融方向的IT負責人交流中他和我們的講述,主要面向方向是基于線下網點的客服和營銷。

      如何把數據“挪移”到大模型中來?在當下的大模型潮流里,數據標注和訓練幾乎是所有大模型企業必須經歷的一個環節。

      數據標注,對其固有的標簽是對數據進行知識型標注,在過去多年的發展里其更多的以拖、拉、勾、畫等方式存在包括自動駕駛等需要大量數據標注的行業,從業人員畫像較為復雜,標注任務相較簡單。

      但如今的大模型標注不同。“我們替換了兩個標注團隊,最終才經過訓練,有了不錯的門店服務和引導效果。”上述負責人告訴產業家。

      更具體的情況是,其采用的是國內某互聯網大廠的開源模型,基于開源的框架進行自己模型的搭建,整體進度較快,但在數據訓練環節,時間卻被大大放緩。

      他表示,最開始選擇的外包團隊也是市面上的某標注企業,但從最開始提出需求到最后的效果驗收,不僅時間較長,而且最終的準確率也不高;而第二次選擇的團隊盡管同樣花費時間長,但最終效果還算滿意。

      這正在成為越來越多企業的縮影。即伴隨著國內底層大模型的逐步低門檻化,越來越多的挑戰已然不聚焦在模型算法本身,更多的在于數據,也就是如何把模型從“可用變得好用”。

      實際上,做好大模型的數據標注不是一件容易的事情。

      首先從數據本身而言,和之前的標注相比,大模型需要的數據量級更大,而且數據結構更為復合,除了單個數據標簽之外,不少大模型的訓練需要用到合成數據(即用AI產生的數據),這也就意味著數據本身的標注模型和標注方法與之前不再相同。

      此外,在單純的標注環節,相較于過往的托拉拽的客觀標注,現在的更多標注需要人工的主動判斷和主動干預,如排序、改寫、生成等,而在更專業具體的問題上,甚至需要專業的人士來接入,配合整體標注規則的建立和部分問題的拆解訓練。

      更有標注人員團隊上的不同,如果說之前固有的標注需要的僅是簡單的質檢和輕微干預,那么如今在如今大模型的標注人員團隊建設上,需要對團隊進行定向的培訓,其中更包括不同專業知識以及安全合規等多方面能力的學習。

      在過去的一段時間里,市面上的大模型企業有不少都采取自建標注棧的模式,即專門招聘人員成立標注團隊,同時研發自身的標注工具,但一個更為真實的現狀是:由于缺乏固有的標注體系和流程積累,在數據工具層面和人員層面始終存在短板,不論是標注,還是中間的模型訓練、評估環節,效果始終無法達到*。

      具體來看,即相較于數據存儲側的向量數據庫等更加適配大模型的產品,在數據訓練和應用側市面上大模型企業大部分采取的是傳統的標注工具和標注方法,因而帶來的是巨大的人力和精力投入,同時也對應的是不夠高效的訓練方法。

      這種短板也更在影響著大模型的實際落地。

      即伴隨著產業和應用成為大模型的主戰場,對特定產業或場景數據的標注和訓練也更在成為大模型落地的必行之道,但由于固有的標注方法和標注工具存在限制,一定程度上延緩了大模型能力的成型和在實際場景的應用落地。

      大模型的“關鍵一道門”,應該怎么邁?

      二、如何做好“AI運營”?

      “優質的大模型的數據標注更像是一套成型的AI數據運營。”一位相關人士表示。

      以百度智能云為例,其目前對外提供的是一系列圍繞大模型全生命開發周期的數據服務,其中包括預訓練、監督微調、RLHF、評估等,其覆蓋了大模型中數據訓練的方方面面,不論是前期的數據標注還是微調等等。

      這一系列的數據標注工作恰似大模型的“AI數據運營”。據了解,在百度智能云的交付過程中,其部分項目會尋找代碼、教育、法律、等領域專業人員,一起進行需求的規則制定和數據訓練,進而保證數據的真實性和準確性。

      此外,在標注工具側,和其它大模型廠商不同的是,百度智能云也更研發了自身專有的大模型標注平臺工具,針對不同場景、不同需要以及不同的數據量可以按照不同的方式進行訓練,比如其可覆蓋大語言模型、多模態大模型及代碼等專項標注場景多種數據標注需求。

      同時,結合輔助標注算法可以全流程助力標注師提升標注質量和效率。而在標注能力之外,其也具備著更為靈活的項目管理機制,可以更好地適配嚴苛的交付周期及復雜多變的標注規則,進而滿足不同賽道企業的大模型訓練需求。

      據了解,盡管目前市面上的大模型廠商會在內部進行自我模型的AI訓練,但效果往往沒辦法達到*,最終還是會找到像百度智能云這樣的擁有專門標注工具的企業進行訓練標注。

      被優化的大模型訓練模塊還不僅于工具,更在團隊。比如在標注人員團隊培訓上,百度智能云在?诮ㄔO了全國*大模型數據標注基地,常駐數百名數據標注師,本科學歷達到100%,覆蓋漢語言文學、計算機、法學等學科專業。

      在服務過程中,除了固有的一體化的模型訓練能力,對不少大模型企業而言,其還有部分專項能力的需求,比如安全能力的強化。

      “大模型的輸入是可控的,但是輸出是不可控的,甚至很多時候會因為幻覺等原因,有不良或者不合規的信息出現。”一位國內頭部AI大模型負責人告訴我們。這也造成了對大模型訓練而言,安全必須是其中要核心把控的指標,而百度智能云基于自身的“AI數據運營”能力,則是可以幫助企業的大模型迅速強化這項專有能力。

      實際上,百度智能云的模式也恰在成為國內大模型訓練的*進路徑縮影。即不論是在預訓練,還是中間的監督微調,抑或是后期的模型評估優化等,更為高效的方式恰是這種“AI-native”的標注模式。

      而基于百度智能云這套“AI-native”的標注模式,企業恰等同于裝備了一個足夠專業的“AI數據運營”工具箱,其可以幫助企業實現從大模型數據到效果的整體運作。這其中不僅有被“刷新”的數據標注團隊,也更囊括了一系列包括從預訓練到模型評估,再到能力強化等全部流程在內的大模型訓練閉環,進而更高效、更低成本地構建好自身可用、安全的大模型。

      三、從模型到應用:數據在產業要如何表達?

      在能更快更好地訓練出大模型之外,數據訓練的下一步是什么?實際上,更為真實的答案是:應用和場景。

      誠然如此。如果說*階段的挑戰更多的在模型參數量級,即在一定范圍內模型本身伴隨著數據量越發凸顯的能力,那么在當下的階段,更大的競爭點則是來自于實際場景的應用和業務表達。這種表達或在金融,或在工業制造,或在教育、電商等等。

      就當下而言,產業或場景大模型的*難點不是算力和算法,而更大的卡點恰是數據表達。

      相較于通用大模型的訓練,這種基于特定場景的訓練對標注能力的要求更高。即在大量的數據中,其不僅包含無數結構化、非結構化的數據,更對參與的人員團隊有足夠專業的要求,此外,在特定的行業數據服務上,其對于具體的流程模型也更有特殊的要求。

      此外,給數據服務帶來難度的不僅是場景,更有如今討論日漸增多的應用。即隨著如今越來越多的AI應用,如Agent、文生圖軟件等被推出,往往更需要在通用大模型能力的基礎上收束某項或者某些方面的特有能力,將其加持到軟件內部,對應到數據服務側則是在應用需求之上的某些專項能力的強化和不斷評估訓練。

      也更可以說,大模型的數據訓練和標注,正在伴隨著產業模型和AI應用時代的到來進入深水區。

      這也恰是百度智能云等深耕過數據服務行業的企業價值。伴隨著大模型載體的到來,它們正基于自己對數據的多年理解和沉淀,成為推動數據到業務表達的最核心力量。

      從幕后走到臺前,從數據標注到數據運營,從初始的模型訓練到細致的模型調優,肉眼可見的是,如百度智能云這樣具備數據資源整合和強大研發能力的科技巨頭企業,正重塑著行業市場格局。而伴隨著大模型向深水區的延展,它們的價值也更在愈發凸顯。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    国产精品久久波多野结衣| 日韩欧美天堂| 国产精品蜜芽在线观看| 国产精品一区专区| 国产精品美女一区二区在线观看| 中文字幕一区二区三区中文字幕| 日韩av电影在线免费播放| 国产精品美女久久久久人| 亚洲日本在线a| 精品国产导航| 欧美在线一级va免费观看| 视频二区欧美| 污视频免费在线观看| 欧美日韩在线一二三| 在线观看日韩av电影| 国产欧美日韩精品一区二区三区| 91pron在线| 午夜国产不卡在线观看视频| 91精品国产91久久久久久青草| 国产精品1区2区3区| 久久高清视频免费| 日韩网站在线看片你懂的| a级片免费在线观看| 99久久香蕉| 国产亚洲毛片在线| 国产欧美精品一区二区色综合| 日韩avvvv在线播放| 中文字幕国产日韩| 午夜电影一区| wwwww亚洲| 亚洲国产精品ⅴa在线观看| 97久久综合区小说区图片区| 日韩网站中文字幕| 高潮白浆女日韩av免费看| 亚洲精品一区二区在线看| 成人高潮a毛片免费观看网站| 99国产在线视频| 亚洲精品一区三区三区在线观看| 久久99视频免费| 亚洲欧美国产精品专区久久| 亚洲人成绝费网站色www| 性欧美大战久久久久久久免费观看| а√资源新版在线天堂| 午夜激情一区二区三区| 免费的黄网站在线观看| 久久久www成人免费无遮挡大片| 老司机午夜精品99久久| 天天射成人网| 日韩一区二区三区免费看| 妞干网免费在线视频| 国产女主播视频一区二区| 国产精品亚洲一区二区三区妖精| 欧美日韩日日摸| 亚洲免费网址| 日韩国产一区| 欧美日韩一区二区三| 久久国产精品99久久久久久丝袜| 日韩av一区二区三区| 欧美成人精品一区二区男人小说| 精品一区二区久久| 暧暧视频在线免费观看| 欧美午夜不卡视频| 激情成人中文字幕| 国内精品在线一区| 亚洲精品中文字幕乱码三区不卡| 国产美女高潮在线观看| 影音先锋在线视频| 久cao在线| 久久福利电影| 欧美高清视频看片在线观看| 美女脱光内衣内裤视频久久网站| 精品一区电影国产| 久久久久免费观看| 在线视频观看国产| 自拍视频亚洲| 日韩欧美一区二区三区免费看| 亚洲精品久久7777777| 久久综合狠狠综合久久综合88| 9999国产精品| av香蕉成人| 大片免费在线观看| 菠萝菠萝蜜在线观看| 最近中文字幕一区二区三区| 粉嫩一区二区三区国产精品| 成人av网址在线| 2019国产精品| 亚洲激情综合| 国产精品一卡二卡三卡| 在线视频你懂得一区二区三区| 56国语精品自产拍在线观看| 欧美夫妻性生活视频| 精品国产18久久久久久二百| 色综合天天综合网天天狠天天| 国产精品美女在线| 狠色狠色综合久久| 日韩码欧中文字| 亚洲欧洲精品一区二区三区不卡| 91超碰在线播放| 亚洲精品免费视频| 一区二区三区中文| 久久久久国色av免费看影院| 伊人情人综合网| 国产精品13p| 亚洲精品黄色| 日韩欧美国产综合在线一区二区三区| 91精品国产免费久久久久久| 精品黑人一区二区三区久久| 欧美美女视频在线观看| 日韩有码中文字幕在线| 最新国产精品久久久| 欧美成人激情视频免费观看| 日韩欧美高清| 麻豆传媒在线观看| 亚洲国产精品一区| 国产一区二区三区久久久久久久久| 久久影院资源网| 国内小视频在线看| 91久久在线观看| 99久免费精品视频在线观看| 欧美777四色影| 亚洲一区二区三区国产| 国产精品夜夜爽| 欧美色图麻豆| 欧美午夜一区二区三区免费大片| 97精品国产99久久久久久免费| 久久久在线视频| 亚洲欧美大片| 欧美午夜女人视频在线| 亚洲精品自产拍| 综合毛片免费视频| 国产精品91视频| 91丨九色丨国产丨porny| 亚洲区综合中文字幕日日| 国产欧美日韩一区| 亚洲人成啪啪网站| www999久久| 麻豆一区二区三区| 黄网站在线免费看| 91精品国产免费久久久久久| 成人黄色中文字幕| 成人av动漫在线| 一区二区影院| 亚洲一区亚洲二区亚洲三区| 国产精品综合不卡av| 亚洲va欧美va人人爽成人影院| 国产免费av在线| 女生影院久久| 8x8ⅹ拨牐拨牐拨牐在线观看| 久久久久青草大香线综合精品| 色妞一区二区三区| 亚洲乱码国产乱码精品精| 久久婷婷久久| 日韩在线麻豆| 国产精品精品软件视频| 亚洲精品中文字| 黄视频免费在线看| 五月天亚洲婷婷| 亚洲一区资源| 亚洲天堂电影| 日本亚洲欧洲精品| 日韩一区二区三区视频在线观看| 久久久久久99久久久精品网站| 国产日韩欧美在线一区| 日韩视频在线你懂得|