国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

  • 首頁 > 企業IT頻道 > 大數據

    當貨拉拉面臨 AI 轉型,該如何做大數據存儲?

    2025年07月10日 14:20:18 來源:光錐智能

      當月活千萬的APP面臨AI轉型,該怎么做數據存儲?

      2013年成立于大灣區的貨運物流App貨拉拉,目前所積累的數據量已達40PB+,在整個行業中屬于中等規模,“我們現在數據量增速也非常快,每一年還會增加幾PB。”貨拉拉大數據專家章嘯說道。

      如此龐大數據量,需要一個既能夠穩定、安全,又能夠提高讀寫能力的數據存儲設施。

      “自建的穩定性跟云的穩定性相比,還是差一些。”章嘯說道,“所以我們現在基本99%的數據都存儲在云上,不過也保留了一些自建的基礎設施,屬于自建+云服務的混合架構體系。”

      混合架構增加了管理難度,所以找到一朵適合自己業務的云,更加關鍵。

      一年多前,貨拉拉將40PB+數據,進行了一次大規模云上遷移,最終遷移目的地,是騰訊云。

      用章嘯的話說,這次遷移可謂是“開著飛機換引擎”,但最終結果是好的,0故障完成了40PB+的大數據基建搬遷。

      數據遷移一年后,依托騰訊云Data Platform數據平臺解決方案,貨拉拉實現貨運報表產出提前40分鐘,讓任務提速10%。

      而這離不開騰訊云Data Platform數據平臺解決方案旗下的兩個拳頭產品:對象存儲 COS、元數據加速器Metadata Accelerator。

      隨著AI大模型時代的到來,貨拉拉也在積極擁抱AI,但又面臨著新的難題——AI大模型所需要的海量數據頻繁訪問,拉低了整個數據訪問的速度。

      那么,AI大模型時代,貨拉拉該如何面對海量數據爆炸式增長的挑戰?這也是所有面臨AI轉型的公司們,共同的難題。

      40PB+數據的云上遷移,開著飛機換引擎

      12年時間積攢的數據量,貨拉拉將其一次全部遷移到了騰訊云存儲系統架構中,如此大規模的數據遷移,挑戰相當大。

      業內皆知,企業積累的海量數據,就是一座尚未被挖掘的“金礦”,數據不光要存起來,更重要的還要能用,才能夠真正發揮數據的價值。

      但往往在使用數據的過程中,一方面存在著數據誤刪、數據勒索、機房災難等導致核心數據丟失的情況,另一方面,海量且持續增長的視頻、圖片等非結構化數據,也面臨著存儲成本增加、傳統存儲架構響應慢,難以滿足企業實時調用等需求。

      事實上,當前貨拉拉業務規模已經達到超億級文件數量規模,在此規模下,數據存儲需要保障數據可靠性滿足不丟失需求的同時,還需要實現業務高可用,滿足任務執行期間業務不受損。

      針對這些問題,貨拉拉已經形成了自建+混合云服務的大數據存儲架構。

      在其大數據存儲架構中,底層接入層是采集用戶數據層,將數據采集之后針對不同時效性要求,會經過批處理和流處理等方式,寫入到在線存儲或提供給業務使用。

      其中,批計算主要是處理永久存儲在存儲系統中的數據,流計算則處理實時生成的數據,“批處理的部分我們是部署在騰訊云上,其他的板塊則在其他云上。”章嘯說道。

      另外,針對數據災備可能出現的核心數據丟失問題,貨拉拉打造了兩套體系化的數據災備架構:

      一是元初-元數據管理平臺,針對七天內被誤刪的數據,能夠通過多層防護,快速恢復數據;

      二是自研災備系統Kirk,針對數據勒索和機房災難,可實現PB級數據災備,并全鏈路災備;

      基于這兩套系統的能力,貨拉拉可以實現數據誤刪的100%召回,核心數據 100%災備。

      “隨著我們與騰訊云的深入合作,最終決定將整個40PB+規模數據都遷移到了騰訊云上。”章嘯說道,“騰訊云Data Platform數據平臺解決方案能夠提供多種能力和服務,不過我們現階段主要使用了底層存儲和元數據加速能力。”

      據章嘯介紹,整個數據遷移大概分為幾個步驟:

      首先是基于Kirk系統和數據離線開發平臺做數據遷移和任務遷移,會同時在兩朵云中跑任務,跑完之后會自動進行數據對比,防止數據出錯。對比的結果完成后給到業務做驗收。

      當整個數據驗收能持續驗收成功,會對整個開發平臺做封網,在當天把整個鏈路跑完后,再次對比數據準確性,確保準確之后,再將所有系統全部切換,從而完成整個云的遷移。

      “我們將數據遷移過來一年多,目前沒有出現由于COS這種存儲所導致的問題,真正做到了0故障率,整體的建立過程也非常平穩。”章嘯說道。

      AI時代數據大爆炸,存儲的難題怎么解?

      企業面臨AI業務的轉型,帶來了許多對數據的新需求。

      最近兩年,貨拉拉落地了許多新的AI業務板塊。

      “我們現在AI業務主要有ChatBI、AI客服等相關的內容,在AI方面目前跟騰訊合作的很深入。”章嘯說道。

      AI應用在進行模型訓練時,對數據的調用需要有高吞吐、低延時。

      這就帶來了新的問題——AI數據和傳統大數據混合。

      “我們的數據都在騰訊云上,現在存在一些模型訓練的任務,會把整個桶的下行帶寬持續拉滿,這樣會對我們整個離線鏈路的穩定性有很大影響。”章嘯說道。

      企業傳統業務的大數據存儲計算需要高穩定性,而AI大模型的數據訓練卻需要高吞吐、大帶寬,兩個數據存儲需求相互搶占資源,又該如何在一個系統架構中實現共存?

      “針對這些問題,我們也跟騰訊交流分享了幾次,最后提出了分桶而治,專項優化的解決方案。”章嘯說道,基于騰訊云對象存儲COS,是在底層做了兩個存儲集群,即COS桶1和COS桶2:

      COS桶1,專做大數據存儲,上層支撐整個大數據市場相關業務;

      COS桶2,則寫入專做AI大模型訓練的數據,上層對應整個AI項目;

      基于此,“存儲層按照應用拆分不同桶,僅遷移單個模型下行帶寬下降8%。”章嘯說道,“不過,我們也明顯感受到AI業務對帶寬吞吐的訴求要比大數據大的多,后續也會逐步把AI業務通過這樣的方式遷移過來,再進行專項優化。”

      在底層COS存儲設立兩個桶,雖然緩解了大數據和AI大模型數據在使用時對帶寬需求的壓力,但AI大模型數據存儲桶自身,也仍面臨著需要非常高的帶寬吞吐能力。

      針對這一問題,貨拉拉正與騰訊云基于數據加速器GooseFS進行探索。

      據介紹,騰訊云數據湖存儲GooseFS可支持Tbps級吞吐、千億級元數據規模、單鏈接速度輕松達到 GBps 級別,相比于行業內百兆級規模提升10倍,大模型分發效率10倍躍升。

      而實現數據高速調用的背后,GooseFS主要是通過對數據的親和力調度能力,將數據調度到跟計算相關節點更近的本地磁盤上,提供Tbps級的吞吐性能。

      “我們用起來體驗感最好的,就是GooseFS的元數據加速能力。”章嘯坦言。

      最后,針對跨云的問題,章嘯也表示,目前基于COS的模式進行訓練,可以實現按需配置,“數據將持久化存儲在COS Data Lake中,訓練數據按需通過GooseFS拉取到云上或者IDC計算端,做到一份Dataset,多地訓練。”

      可以看到,COS作為云存儲底座,為貨拉拉40PB+的數據提供統一存儲池,能夠提供安全穩定的數據存儲能力,在大幅度提升系統可用性、可靠性等性能的同時,也還可以大幅降低存儲成本。

      而GooseFS則提供元數據的數據緩存加速服務,能夠滿足大規模數據處理和訓練對高性能存儲的需求,幫助貨拉拉落地AI應用業務。

      數據萬象助力企業,釋放數據價值

      隨著企業非結構化數據不斷增長,帶來了AI識別難,處理速度慢等新難題。

      為了讓數據的價值能夠釋放,需要在存儲端就開始做預處理。

      而騰訊云數據萬象,能夠有效幫助企業解決這一問題。數據萬象,主要包含兩個功能,一個是數據管理Metalnsight,一個是數據處理Data Engine。

      Data Engine,就是數據處理,把計算下沉到存儲端,提供大量標準化的圖片、音視頻的處理能力。比如小紅書用戶上傳圖片,它能在數據層就把圖片進行壓縮+裁剪+上水印,在圖片質量不受損的情況,提升圖片訪問性能,保護知識產權。

      MetaInsight,通過智能檢索能力為客戶提供一種高效的數據管理服務,它能讓用戶使用自然語言快速檢索海量非結構化數據(圖片、音視頻等)。比如網盤、手機相冊中的“以文搜圖”,之前找照片只能按時間一張張找,現在可以輸入關鍵字直接搜到。

      舉個例子,在電商商品搜索中,基于MetaInsight的以圖搜圖功能,用戶在上傳商品圖片后,系統通過特征提取與索引庫中的商品圖進行相似度對比,快速返回同款或相似款商品信息,解決傳統關鍵詞檢索的局限性。

      而在AI大模型訓練場景中,MetaInsight 可對海量非結構化數據進行智能預分類,通過語義檢索(如輸入“雨天”“行人穿行”)快速篩選特定場景數據。相比人工標注,該方案能減少70%以上的預處理時間,同時支持跨模態檢索(如圖像+文本描述),幫助企業在數據清洗階段高效構建高質量訓練集。

      “因為非結構化數據的日益增長,云存儲平臺一定要有向量化的能力。”章嘯說道,“數據萬象CI,就可以很好的提升對非結構化數據的管控。”

      可以看到,AI大模型時代,存儲不再是之前只做數據的倉庫,而是結合一系列數據處理和計算的能力,成為了數據加速運轉的新引擎。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    色综合蜜月久久综合网| 91网页在线观看| 亚洲网址在线观看| 日韩西西人体444www| 老司机精品视频在线观看6| 在线观看欧美黄色| 日韩欧美国产精品一区| 青草成人免费视频| 成人教育av在线| 国产激情偷乱视频一区二区三区| av片在线观看网站| 欧美黄色网视频| 亚洲欧美一区二区在线观看| ...av二区三区久久精品| 欧美一区视频| 日本亚洲三级在线| 国产精品入口夜色视频大尺度| 午夜一级在线看亚洲| 成人精品久久一区二区三区| 99麻豆久久久国产精品免费| 黄色影院在线看| 成人免费看黄网站| 国产三级精品三级在线专区| 婷婷精品在线| 欧美好骚综合网| 成人av电影天堂| 欧美黄色网页| 欧美日本一区二区在线观看| 午夜精品福利一区二区三区av| 成人激情视频小说免费下载| 欧美日韩你懂的| 欧洲性视频在线播放| 日韩欧美一区二区视频在线播放| 色多多国产成人永久免费网站| 欧美情侣在线播放| 在线一区二区三区| 综合国产视频| 亚洲a∨精品一区二区三区导航| 午夜精品理论片| 亚洲女人天堂网| 成人av.网址在线网站| 91久久夜色精品国产按摩| 91小视频在线观看| 久久伊人91精品综合网站| 精品国产欧美一区二区| 91在线精品一区二区| 日韩美女视频免费看| 色综合中文字幕| 国产精品视频在线播放| 亚州精品天堂中文字幕| 国产乱妇乱子在线播视频播放网站| 亚洲欧美另类图片小说| 一本色道久久综合亚洲精品小说| 国产精品一国产精品| 欧美精品97| 免费看美女视频在线网站| 成人免费福利| 牛人盗摄一区二区三区视频| 日韩高清欧美高清| 欧美性生交xxxxx久久久| 9765激情中文在线| 欧美日韩成人高清| 国产91精品入口17c| 欧美一区二区视频在线| 久久精品国产亚洲5555| 青草在线视频在线观看| 欧美大奶一区二区| 999精品在线| 综合干狼人综合首页| 日韩欧美精品| 国产传媒一区在线| 性欧美大战久久久久久久久| 91精品国产综合久久小美女| 深夜福利91大全| av在线不卡免费看| 欧美精品一线| 99麻豆久久久国产精品免费| 国产aⅴ精品一区二区三区色成熟| 欧美一区二区三区视频免费| 好吊妞国产欧美日韩免费观看网站| 国产精品福利在线观看| 欧美不卡一区二区三区四区| 91精品国产一区二区在线观看| 亚洲精品第1页| 亚洲蜜臀av乱码久久精品蜜桃| 成人成人成人在线视频| 国产精品一级在线| 91深夜福利视频| 一区2区3区在线看| 777午夜精品免费视频| 丁香六月久久综合狠狠色| 国产精品理伦片| 日日噜噜噜夜夜爽亚洲精品| 亚洲精品动漫久久久久| 影音先锋一区| 国产91色在线| 亚洲精品福利视频网站| 日韩在线二区| 丁香一区二区三区| 亚洲免费中文字幕| 国产精品嫩草影院一区二区| 亚洲综合免费观看高清完整版| 国产精品精品| 欧美极品美女电影一区| 盗摄精品av一区二区三区| 精品视频久久久| 不卡影院免费观看| 日韩和欧美一区二区| 国产成人亚洲一区二区三区| 精品剧情在线观看| 日产日韩在线亚洲欧美| 国产一区二区三区国产精品| 欧美精品一区视频| www视频在线看| 国产高清美女一级毛片久久| 国产亚洲网站| 欧美久久一区| 亚洲日本欧美日韩高观看| 在线观看国产一区二区| 一本色道88久久加勒比精品| 午夜精品一区二区三区在线视频| 欧美精品高清视频| 中文字幕一区二区三区视频| 日韩电影天堂视频一区二区| 无码少妇一区二区三区| 欧美激情久久久久久| 久久伊人蜜桃av一区二区| 国产高清不卡一区| 久久精品久久久久| 中文字幕亚洲欧美在线不卡| 蜜臀精品一区二区三区在线观看| yellow字幕网在线| 欧美裸身视频免费观看| 精品国产一区二区三区久久狼黑人| 国产日韩在线看| 最近2019中文字幕一页二页| 国产亚洲一区在线播放| 超鹏97在线| 午夜亚洲影视| 国产精品久久久久久久久久白浆| 精品国产麻豆| 色综合中文网| 色橹橹欧美在线观看视频高清| 久久精品电影一区二区| 久久久国产亚洲精品| 亚洲激情影院| 色多多在线观看| 色香欲www7777综合网| 欧美午夜性色大片在线观看| 亚洲午夜久久久久久尤物| 国产精品毛片在线看| 992tv免费直播在线观看| 17c精品麻豆一区二区免费| 欧美精品在线第一页| 毛片网站在线免费观看| 成人精品国产一区二区4080| 久久久久久久香蕉网| 欧美另类高清videos| 97人澡人人添人人爽欧美| av在线一区二区| 日韩精品中文字幕吗一区二区| 国产精品入口免费视| 免费成人网www| 69av亚洲|