文 | 董二千
編輯 | 楊旭然
2006年,亞馬遜推出云計算服務彈性計算云EC2(Elastic Compute Cloud)。同年8月,在搜索引擎大會上,谷歌前CEO埃里克·施密特提出了“云計算”的概念,正式宣告了現代云計算的到來。
云計算從 AWS 起步時的牛刀小試,到如今已成長為一個巨大的生態體系。比如云計算興起后,SaaS服務成為諸多企業的標配,Salesforce、Shopify等頭部企業均踩中了風口,成為生態鏈中不可或缺的部分。
十余年后,我們又站在了人工智能原生產品的新起點。正如云計算在過去帶來了技術生態系統的巨大變革,重構了軟件價值鏈,人工智能也將成為未來應用的核心組建,而基礎大模型正是其核心推動力。
可喜的是,已有一批新興玩家投身于此。
零假設能夠幫助用戶將醫學文獻檢索、篩選過濾、內容提取、編輯整理等步驟中設計到的時間成本從數天甚至數周縮短至1天甚至幾個小時;幻量科技使得新材料研發速度實現了倍速提升,,使研究人員無需編程經驗便輕松應用先進的算法和計算及實驗平臺進行材料設計與優化;ChatDOC重新定義了閱讀方式,用戶只需上傳文檔,和AI進行交互對話,就能立即得到有依據的回答……
為了促進大模型生態的健康發展,百度等龍頭企業已率先作出表率。
今年5月百度創始人、董事長兼首席執行官李彥宏宣布,百度將設立10億元人民幣的百度文心投資基金,旨在推動大模型生態繁榮,同時啟動"文心杯"創業大賽,最高獎項為價值1000萬元早期投資。
9月5日,李彥宏在百度云智大會中表示,AI原生應用要能解決過去解決不了、解決不好的問題,應用才是大模型存在的意義。“模型本身是不直接產生價值的,基于基礎大模型開發出來的應用才是模型存在的意義,對于創業者來說,卷大模型沒有意義,卷應用機會更大。”
01 萬億金礦
OpenAI創始人山姆·阿爾特曼在《萬物摩爾定律》一文中暢想了AGI(Artificial General Intelligence,通用人工智能)如何改造人類社會,核心就是將人的成本從邊際成本變成固定成本,而固定成本則意味著每18個月成本就會減半,最終將無處不在。
舉個簡單的例子,過去培養一名醫生需要大量的學習進修以及臨床經驗,但AGI可以將醫生代碼化,讓技術頂尖的醫生能夠服務更多人,且成本也能大幅降低。而這也被稱為范式轉移,即新的科學革命導致原有科學體系的基本假設被改變甚至顛覆。
創新工場創始人李開復在沙龍上,指著分析師估算的AIGC行業規模2000億美元,稱這個數字“太保守”,就是因為“沒有考慮到范式轉移”。
先行者們已經走出了AI改造社會的第一步。
2019年,顧飛看了創新藥市場的蓬勃發展,于是創辦了零假設,定位于打造醫藥專業知識平臺,連接企業和醫生的共同需求。成立初期,零假設的知識平臺更偏專業領域,主要面向醫生和藥企內部的專業人員,而非營銷人員。
這是由于過去在醫學領域,產品的準確性和易用性是無法兩全的。醫生往往通過專業的論文搜索引擎、數據庫等,查詢專業知識,但是這往往有較強的門檻;用戶能否問一句話就能找到想找的東西,這在大模型出現之前完全做不到。
正是看到了這樣的機會,零假設成為了第一批擁抱大模型的企業,其主要調用大模型的語言表達能力,英文部分使用GPT,中文部分使用百度千川大模型平臺。如今,零假設的產品易用性已得到大規模提升。
對于大模型平臺而言,與不同行業合作伙伴合作,結合各自所擁有的大量豐富的場景,提高模型在行業上的適配性,這也是大模型落地的機制。
02 App Store時刻
2022年底推出的ChatGPT一夜爆火,成為有史以來增長最快的應用。英偉達CEO黃仁勛為此感嘆道:“我們正處于 AI 的iPhone 時刻。”
但鮮少被關注的是,蘋果于2008年推出的App Store在某種程度上的重要性甚至高于iPhone,因為它重新定義了手機應用的裝載邏輯。只有在吸引海量軟件供應商入駐后,iPhone才從一個稍微有點用的電子設備變成革命性的智能手機。
大模型同樣如此。
一方面,當前的大模型基本是基于廣泛的公開文獻與網絡信息來訓練的,數據“噪音”過大,導致大模型的行業針對性與精準性不足。因而,需要零假設等應用層企業做數據訓練或精調,才能打造實用性更高的場景服務。
另一方面,大模型的行業落地更在于深入產業的進程,即在具體的產業應用中,需要深層次的行業know-how能力。如在生產管理中,需要將原料特性、排產規則、資源分配規則等數據“喂養”給大模型,這才能使其具備工廠計劃員類似的能力。而這同樣也需要應用層企業的努力。
如今,百度正驅動著AI的App Store時刻到來。
今年3月,為了降低企業使用大模型的門檻,百度推出“百度智能云千帆大模型平臺”,滿足不同行業、不同規模、不同開發能力的企業用大模型的需求。
5月,“文心杯”大賽啟動,短短時間內就吸引了近1000個項目激烈角逐,超8成項目聚焦大模型應用層落地,創業者積極探索醫療、教育、金融、法律等行業應用的重構與改造,應用場景趨于多元化。百度為決賽入營團隊提供了穩定可用的文心大模型API和百度智能云資源。
9月,百度智能云發布千帆大模型平臺2.0。升級之后的千帆擁有“四個最”:預置最多的大模型和數據集、有最豐富最全面的工具鏈、最佳算力效能、最完備的大模型安全方案。
對于“文心杯”的優勝者,李彥宏表示,百度將拿出數千萬元投資上述團隊,并在技術、產品、發展戰略、資本合作等方面長期支持,“我相信文心大模型將成為AI創業者、開發者的首選,越來越多的應用會建立在模型之上,整個生態系統將充滿活力。”
03 基礎設施
8月31日,首批通過《生成式人工智能服務管理暫行辦法》備案的大模型百度文心一言、百川智能等宣布向全社會開放服務。這意味著大模型已經從技術層面進入應用環節,大規?蓮椭频漠a業落地或已近在咫尺。
當AI的智力成為未來必備的生產要素時,相應的供應公共產品和服務的企業就一定會出現,而大模型也必將出現基礎設施服務商。
然而,大模型的訓練成本相當高昂。英偉達曾披露訓練一次1750億參數的GPT-3需要34天,使用1024張A100 GPU芯片,單次訓練成本高達1200萬美元。為了訓練超大規模的AI模型,微軟甚至為OpenAI構建的一臺排名世界前五的超級計算機。
而大模型一旦商用后,運營成本同樣會居高不下。谷歌母公司Alphabet的董事長約翰·漢尼斯表示,基于大型語言模型的搜索的成本可能是標準關鍵詞搜索的10倍。
因此,未來大模型領域勢必出現贏家通吃的局面。如李彥宏所判斷的那樣:“中國會出現至少一個、也可能是兩個或三個基礎大模型,可以支持人們開發各種AI原生應用。”
百度在這一方面顯然有著天然的優勢。“百度文心一言應該是目前效果國內效果最好的大模型”, ChatDOC CEO林得苗評價道。
多年以來的積累使得百度的技術能力毋庸置疑。在IDC發布的《AI大模型技術能力評估報告2023》中,百度文心大模型拿下12項指標的7個滿分,綜合評分第一,尤其是算法模型、通用能力等基礎技術領跑全行業,算法模型獲得唯一一個滿分。
與此同時,百度在數據搜集層面也有著天然的優勢。作為第一批向社會開放的大模型。據百度官方數據,文心一言全面放開后的 24 小時內,共計回復網友超 3342 萬個問題。
我們除了看到大眾沉浸在生成式 AI 的熱潮之中,也看到,文心一言的放開全面引領著自然語言處理技術的潮流,更多創業者、開發者深刻意識到生成式 AI 的廣闊發展前景。
李彥宏也曾指出:“無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理,需要多年的堅持和積累,沒法速成。”
同時,躬身入局、打造生態也是百度發力的重點。截至目前,百度智能云千帆大模型平臺上月活企業數已近萬家,覆蓋金融、制造、能源、政務、交通等行業的400多個場景。
03 寫在最后
雖然早在2006年,云計算就已然出現,但其真正賦能產業卻在多年以后,早期擁抱云計算最知名的案例Netflix也在2010年才將業務全面遷移到 AWS。
相較于此,大模型產業融合的覺醒時間已然大幅提前,大模型只是第一步,AI與產業的融合才是更具想象力的未來。AI原生應用要能解決過去解決不了、或解決不好的問題,而絕不僅僅是對移動互聯網APP和PC軟件的簡單重復。
技術奇點時刻或許已然到來。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。