過去幾個月,行業用戶對大模型的關注經歷了從天馬行空的想象,到組建團隊尋找場景。大模型企業也從百模大戰,到競相落地布局。
文|周路平 徐鑫
編|石兆
國內大模型戰場的比拼正在進入新的階段。
過去2個月,大模型市場上異常熱鬧,不同參數級別和能力類型的大模型紛紛內測。如何降低大模型使用門檻,讓大模型真正在行業里用起來,是企業用戶和大模型提供商關注的焦點。
5月9日,國內最早開始大模型產品內測的百度,公布了企業級大模型平臺“文心千帆”內測的消息。在推動大模型落地行業上,百度邁出了關鍵一步。
01
大模型競爭進入新階段
最近兩個月,百度集團副總裁侯震宇感受到了大模型賽道的有趣變化。之前過來接觸的人,級別都非常高,大多是CEO,交流的內容也以科普為主。大家都覺得大模型很重要,害怕掉隊。但現在,來的大部分是企業內部具體做事的人,他們希望盡快將大模型在業務中落地,以獲取競爭優勢。
“這是個好事,說明大模型已經逐步邁向實際落地階段。”侯震宇說,外界對大模型的關注經歷了從天馬行空的想象到探討如何落地的階段。
從國外廠商的動作來看,這一趨勢的轉變已經越來越明顯。阿里云此前內測通義千問大模型時,就同步推出了企業和行業大模型,并聯合7家行業伙伴探索大模型在油氣、電力、交通、金融等多個行業的應用。商湯、第四范式等人工智能廠商也在智能汽車領域、醫療、企服軟件開發摸索大模型的場景。
海外最受關注的是微軟的路徑。由于與OpenAI在資金、技術和應用落地場景有深度合作,微軟步子邁得大。在C端產品如搜索引擎Bing上,大模型讓應用從工具向智能助手轉變,目前Bing的活躍用戶增加到了1億水平。在微軟能力強項ToB領域,“智能副駕”Copilot已經與微軟已有的低代碼開發工具、Office辦公軟件、CRM、ERP軟件以及網絡安全等多款產品結合,完成產品的智能化升級。
其中代碼生成平臺Github和office產品的智能智能助手推出在行業里引起了不小的轟動。
國內企業服務市場幾位行業人士不同程度向數智前線表達過焦慮情緒。隨著大模型能力引入相關賽道,企服產品服務客戶的方式和競爭點可能也會發生變化,他們需要密切關注。
國內最早推出大模型產品內測的百度此前也一直與大量企業探索應用場景。百度公布的數據,有超過300家生態伙伴參與內測,在400多個企業內部場景取得測試成效。大模型內測后,百度開了3場面向企業客戶的大模型技術交流會,每場都人員爆滿。這也反映了當下企業們迫切想了解大模型在細分場景里的方案。但也有用戶反映,希望看到更有確定性的機會。
最新的消息是,文心大模型技術交流日上,百度披露了正在聯合企業客戶、生態合作伙伴內測的“文心千帆大模型平臺”,以未來滿足企業客戶研發和使用大模型的需求。
文心千帆大模型平臺不但提供包括文心一言在內的大模型服務,還提供大模型開發和應用的整套可視化工具鏈,包括數據生成、標注、回流的數據閉環管理功能。客戶以少量數據即可發起模型微調,最快幾分鐘就可獲得自己的專屬大模型。
目前,百度自身已有的相關產品已率先開始基于文心千帆大模型平臺進行智能化升級。同時,基于大量用戶交流與反饋,百度將大模型應用的場景提煉成了通用應用和行業應用兩類。
通用類包含了智能創作平臺、數字人技術和生成、知識管理和檢索、對話系統以及智能客服等適用于所有行業的場景。在此之上,金融、政務、工業、媒體、電商零售等多個行業,是百度智能云所覆蓋的重要戰略場景。
為了能更好的在行業落地,百度也在積極打造合作伙伴生態。5月9日的交流會上,百度與聯想集團、用友、寶蘭德等14家文心千帆生態伙伴簽約,繼續推進大模型的行業場景落地。
業界觀察,這些生態伙伴在企業服務的細分市場,有大量數據積累和行業實踐沉淀,對百度在細分行業場景里形成能力補充。
例如,老牌企業服務提供商用友,在企業數智化轉型領域積累了數百萬企業客戶的人財物項、產供銷研等10大領域和眾多行業的應用實踐;寶蘭德是國內電信行業國產中間件市場的頭部廠商,在中間件、智能運維等行業通用軟件及數智化產品解決方案有豐富經驗。
業內認為,豐富的實踐和碰撞,能幫助大模型實現產品、技術和應用場景間的良性互動。
“真正能夠把大模型在垂直行業做好,是目前各個企業都要考慮的問題。”智能運維企業寶蘭德董事長說,讓大模型的能力落地是接下來大模型發展的一個非常關鍵的步驟。
02
大模型ToB的兩條腿
作為企業級大模型生產平臺,百度給文心千帆的定位是大模型生產和分發的集散地。文心千帆平臺上,不但提供包括文心一言在內的大模型服務及第三方大模型服務,還提供大模型開發和應用的整套工具鏈。
企業既可以直接用百度預訓練的文心大模型,還可以基于平臺訓練自己專屬的大模型,百度文心千帆大模型平臺提供的兩種不同商業模式,也契合了當前企業對大模型的不同需求。
百度內部形象地將兩者比作為“操作系統模式”和“臺積電模式”。所謂操作系統,是指文心一言大模型扮演了AI時代操作系統的角色,企業只需要在文心一言大模型的基礎上,注入少量行業知識數據進行微調,用很小成本就能得到自己的專屬大模型,就像開發者在安卓開發App一樣。
臺積電模式指的是百度提供高效穩定的全套基礎設施和豐富的工具鏈,讓客戶到文心千帆大模型平臺來訓練他們自己的大模型,訓練出來之后再交付給客戶,就好比芯片設計企業,拿著設計好的圖紙,交給臺積電流片制造。
但這兩種模式,都非常考驗平臺能否提供一套簡單易用的工具鏈。
“中國企業關注大模型的落地能力。”用友副總裁、研究院院長呂建偉說,外界雖然演示了很多大模型的應用場景,但背后的加工過程非常復雜,比如需要做提示詞,需要做模板,有很多的工作需要去做,“如何能把這些很復雜的,像微調、提示調優、指令調優、強化學習的功能,從工具層面再降低一個層級(非常重要)”。
以大模型訓練和應用最常見的微調為例,它能低成本地對模型進行修正,用于改進預訓練模型的性能,以適應新的任務。
呂建偉直言,當下訓練大模型經常遇到兩個極端:要么是不能進行很好地微調和性能調優,大模型跑起來就沒法停下來;要么需要花費上千萬元,去重新訓練。
技術交流日當天,百度智能云AI與大數據平臺總經理昕舟在百度智能云BI產品sugar上,現場演示了文心大模型的微調全過程。sugar主要提供數據可視化,幫助客戶做商業分析和決策,已接入了文心一言的能力。
“展示一下各個地區的銷售額”,第一個指令通過輸入框下達,全程不需要任何專業的技能,很快系統就反饋出一個餅狀圖,有對應的百分比和銷售額。
“統計華北地區2019年3月到5月的銷售額,用折線圖來表示。”需求開始變得復雜,而系統也沒有返回結果。
這也是很多通用大模型會遇到的問題:如何通過小樣本數據的投喂,讓大模型變得更加聰明和強大。很快,昕舟將準備好的100條高質量精標數據,投喂給大模型。在小樣本的微調下,系統很快掌握了技能,準確返回了結果。
微調教會了大模型在特定的應用中學會特定的指令和要求,并且還能具備一定的泛化能力。這也是業內訓練大模型的常見做法。
除了微調,目前,文心千帆大模型平臺包含了大模型生產和應用的完整生命周期要具備的功能和工具,從底層的AI異構算力、高性能文件系統、高速網絡和AI調度增強,到海量的數據處理、高質量的數據標注、強化學習,再到大模型的評估、高效的壓縮、自動化的Prompt工程和快速的應用編排。千帆大模型平臺考慮到了大模型從開發、應用到調優的每一個環節。
另外,文心千帆大平臺也支持插件。ChatGPT在推出Plugins(插件)功能時,外界一片驚呼,它能將ChatGPT連接到第三方應用程序。
除了訓練和應用大模型,不同的業務需求對大模型的部署方式也提出了要求。當下,外界普遍認為公有云是一個非常高效的應用方式,但不少企業尤其是政企客戶,出于數據安全和合規考慮,都會要求私有化部署。
“中國ToB市場,很多大企業要求私有化部署,但大模型的私有化部署其實很復雜,有很多局限性。”呂建偉說,如果要把大模型分發給中國上萬家的大型企業,如何很容易地分發部署,部署的工具在哪里都是業內所關注的問題。
目前,包括百度、華為和阿里在內的廠商都在提供公有云服務和私有化部署兩種交付模式。
以百度文心千帆為例,它的部署方式則更加靈活,對外將提供了“3+3”的交付方式。公有云服務上提供推理(直接調用大模型的推理能力)、微調(通過高質量精標業務數據,高效訓練出特定行業的大模型)、托管(將模型發布在百度智能云,以實現更加穩定高效的運行)三種服務。
私有化部署上,文心千帆大模型平臺也提供了三種部署方式:包括支持軟件授權(提供在企業環境中運行的大模型服務)、軟硬一體(提供整套大模型服務及對應的硬件基礎設施)、租賃服務(提供機器和平臺的租賃滿足客戶低頻需求)。
據數智前線獲悉,租賃服務是百度智能云最新增加的部署方式,目的是滿足部分客戶對模型訓練的低頻需求,相比于去采購大量的資源和機器,租賃會更劃算。
公有云和私有化結合的靈活多樣的部署方式,將加快大模型在企業業務中的應用。
03
成本壓力下,全棧底座的優勢
隨著業界普遍將通用人工智能視為歷史性的機遇。不少企業紛紛開始訓練自己的大模型,被業內稱為“百模大戰”。但并不是每一家企業都要從零到一去訓練大模型,一般企業既沒有這個能力,也沒這個必要,“我想開車,不需要自己去造車”。
“我們不應該自己去做大模型,我們把自己定位在大模型的最佳應用方。”金山辦公助理總裁田然直言,文心一言發布后的第一時間,金山辦公就聯系了百度,開啟了內測。
這是一個非,F實的考量。金山辦公CEO章慶元此前在接受采訪時也提到,“我的核心競爭力還在Office本身。所以我一定要跟進最好的大模型,誰好我就用誰。我就做大模型的應用者。”
其實,無論是自己去訓練大模型,還是接入大廠提供的大模型服務,成本都是其中非常重要的考量。
華為此前透露,大模型開發和訓練一次的成本高達1200萬美元,背后是大量資源和算力的消耗。而即便是調用類似ChatGPT的方式,GPT-3.5模型的API價格為0.002美元/千token,GPT-4在請求方面的API價格為0.06美元/千token。對于很多企業而言,這也是一筆難以承受的成本。
田然提到,金山辦公有數億用戶,如果這些用戶都用上大模型的能力,將會帶來巨大的成本壓力。所以,成本也是金山辦公在使用大模型時非常關注的地方。“百度大模型的推理性能和推理的成本是有一些優勢的。”田然說。
侯震宇表示:”最終能夠讓大模型服務推廣開的只有兩個原因:第一個是模型效果,第二個是成本。”
事實上,百度大模型的調用和訓練成本一直在下降。文心一言開啟內測后,一個月就迭代了四次。根據百度之前披露的數據,文心一言的推理成本如今只有發布之初的十分之一,而3個月內的推理效率提升10倍,模型推理性能提升50%,模型算力利用率提升1倍。
侯震宇透露,除了推理成本下降,在接下來幾個月,不管是在模型使用,還是在模型微調甚至在模型再訓練方面,“價格應該不會成為大家使用或者擁抱大模型的瓶頸”。
這得益于百度打造的國內首個全棧自研的AI基礎設施“百度AI大底座”,它面向企業AI開發提供端到端的解決方案,從芯片、框架、模型和應用進行了全棧布局。
正如侯震宇所言,大模型時代下,企業不但需要智能的算力、靈活的框架平臺、豐富的大模型體系以及優質的應用方案,還需要這四層技術架構之間的適配與優化,這是一個“既要、又要、還要”的端到端創新工程。
這是百度AI大底座在大模型訓練上的優勢所在:芯片層的昆侖芯、框架層的飛槳和模型層的文心大模型家族。每一層均有行業領先的產品,可以形成一個高效的反饋閉環,幫助大模型不斷去調優迭代。尤其在框架層和模型層之間,AI大底座有很強的協同作用,可以幫助企業構建更高效的模型,持續調優性能,并顯著降低成本。
“大家可能會覺得堆積算力、寫好代碼、然后進行模型訓練,把它跑起來就行了。實際上在訓練過程中會遇到各種各樣的挑戰,很少有人能夠使得一個大模型訓練過程能夠在連續一兩天內不出問題。”百度智能云云計算產品解決方案和運營部總經理宋飛說,“百度AI大底座可以為大模型提供高效、穩定的訓練和有效的收斂。”
根據百度披露的數據,百度AI大底座的千卡加速比達到90%,資源利用率達到70%,開發效率提升100%。如果不是全棧布局,很難獲得這樣的效果。
除了效率和成本,安全合規也是企業選擇大模型的一大前提。田然提到,金山辦公與百度大模型團隊對接后,討論的第一個問題就是安全合規。
而國內企業對國產化自主可控也有很高的要求。“雖然中國有很多個機器學習的框架,他們也都是支持國產化的系統,軟硬件,也都是開源,但飛槳的開源知識社區,是我們評估來做得最好的一個。”呂建偉坦言。
大模型被認為是AI發展的分水嶺,已經在等政務、工業、金融、傳媒等領域的辦公協同、智能客服、文案生成、工業質檢等場景下展現出了威力,無論是對現有產品的改造,還是創新場景的探索,大模型都在打開全新的想象空間。需求已經涌現,只不過,市場的需求注定是碎片化的,企業的大規模應用還有待時日。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。