DeepSeek 越來越火爆,但與此同時,DeepSeek“服務繁忙”的狀況不僅沒有好轉,還在進一步加劇。
據字母榜(ID:wujicaijing)實際測試,目前如果選擇深度思考和聯網搜索模式,DeepSeek會直接以彈窗形式發送一條“服務器繁忙,請稍后重試”的提醒,而不再像以往那樣在對話框中給予回復。
因服務“繁忙”而無法使用DeepSeek的用戶,也由此越來越多地外溢到了接入DeepSeek 的其他廠商平臺上。
國內,阿里云、騰訊云、火山引擎、百度云等云廠商陸續宣布接入DeepSeek模型,三大運營商云也沒放過接入DeepSeek的機會;國產AI芯片公司壁仞科技、海光信息、摩爾線程、沐曦等,也第一時間開始適配DeepSeek模型;兼具算力輸出能力的大模型廠商,如科大訊飛,也開始將DeepSeek接入自家的開放平臺;還有越來越多新能源汽車和智能手機廠商,正在趕往接入DeepSeek的路上。
堪稱一夜爆紅全球的DeepSeek,其所造成的流量奇觀,無疑讓上述一眾廠商,都想從擁抱DeepSeek模型中吃到這波紅利。
近期,QuestMobile給出的數據顯示,DeepSeek日活躍用戶(DAU)在1月28日首次超越豆包(約1695萬),隨后在2月1日突破3000萬大關,成為國內DAU最高的AI 對話產品。做到這一切,DeepSeek只用了20天。
DeepSeek想要在短期內進一步擴張,除了找到一個算力合作伙伴支撐更大規模用戶涌入之外,如果對方還能兼備C端、B端和G端的落地經驗,無疑將是DeepSeek眼下最合適的盟友之一。
A
兼備C端、B端和G端落地經驗的科大訊飛,成了接入DeepSeek的又一家AI廠商。
2月10日,科大訊飛宣布全面接入包括“滿血版”DeepSeek-V3、DeepSeek-R1在內的DeepSeek全系大模型。不同于其他平臺一般的API接入,目前科大訊飛是第一家推出DeepSeek大模型精調服務的平臺。
精調,意味著在訊飛開放平臺,開發者可以根據自身所在的行業領域場景,對DeepSeek進行行業數據訓練,做完應用開發對接底層大模型的幾乎所有流程。即使不對模型進行復雜修改,開發者也能以低成本的方式,快速定制自己的專屬DeepSeek模型。
“精調是從能力到落地的必經之路,推出精調服務這個動作特別訊飛,他們非常知道AI應用落地需要什么。”有AI開發者向字母榜表示。
誰能服務好開發者,誰就有望在這場大模型之爭中搶占先機,因為前者已經被視為當前大模型落地應用“最后一公里”的橋梁。
根據IDC發布的2024行研報告,科大訊飛在大模型開發者規模方面已處于國內第一。作為首批人工智能“國家隊”,訊飛開放平臺已聚集了超過812萬開發者團隊,大模型直接相關的開發者數量超過109.3萬。領先的開發者生態,讓訊飛在國內實現大模型的規模落地應用上成了最有力的競爭者。
事實上,AI落地一直是科大訊飛的長板,其落地應用廣泛覆蓋工業、教育、醫療、金融、智慧城市等眾多行業,F在,有了當紅炸子雞DeepSeek的加持,科大訊飛在服務政企客戶、外部開發者和C端消費者方面,都有了更多的施展空間。
通過接入DeepSeek,不論是央國企客戶資源,還是那些曾經因成本高昂而猶豫是否采購大模型方案的中小企業,也開始在引入AI的態度上有所改變。首發的精調服務,讓科大訊飛領先競爭對手,滿足開發者與企業定制更懂需求場景的DeepSeek模型的需求,從而實現效果、效率與成本的均衡優化。
值得注意的是,目前DeepSeek尚未支持文生圖和語音輸入等多模態功能。在一眾接入DeepSeek的AI廠商中,誰能提供DeepSeek尚不具備的多模態能力,誰無疑就將吸引到更多開發者和普通用戶的青睞,從而提前一步構建起更豐富的大模型生態。
截至目前,科大訊飛獨立自研的訊飛星火APP,在支持常規的文字輸入之外,還支持圖片生成、語音交互等多模態能力。僅僅在過去一年,訊飛星火就完成了五次迭代升級,其最新模型訊飛星火4.0 Turbo,在七大能力上超過GPT-4 Turbo,代碼能力和數學能力超越 GPT-4o。
整合DepSeek開源模型與訊飛已有優勢技術,科大訊飛不僅有望構建具備多模態能力的全新版本DeepSeek,激活全新的競爭優勢,而且也將是在DeepSeek紅利之下的新利好因素。
B
在低成本大模型訓練策略被DeepSeek驗證成功后,外界一度擔憂算力需求是否會遭遇暴跌。但包括微軟在內的科技大廠依然保持樂觀。
微軟CEO納德拉在DeepSeek R1發布后說道,“杰文斯悖論再次應驗!隨著AI變得更高效、更容易獲取,它的使用量將火箭般躥升,成為我們用不夠的商品。”
在經濟學領域,杰文斯悖論指的是當技術進步提高了效率,資源消耗不僅沒有減少,反而激增。
具體到大模型賽道,納德拉所謂的AI需求使用量激增,即將通過B端、G端的政企客戶開發和AI應用的爆發來共同完成,這一趨勢也是DeepSeek爆火之后行業形成的兩大新共識。
既要有底座大模型的研發能力,又要兼備大眾市場和政企市場的落地經驗,能夠集齊這些標簽的大模型廠商,眼下唯有AI大廠。
招投標市場的公開信息也佐證著這一點。根據第三方機構智能超參數最新發布的《中國大模型中標項目監測報告(2024)》,2024 年,在通用大模型廠商中標排行榜中,前五名幾乎全部來自AI大廠。其中,科大訊飛更是以91個中標項目、披露中標金額84780.8萬元排名第一,成為2024年度標王。
政企市場快速發展的一大行業背景在于,經過兩年發展的國內大模型領域,正在轉換出一套新的評判標準:對大模型廠商的綜合實力打分,不再僅僅圍繞它出了多少論文、刷了多少排行榜,更加開始看重它是否能獲得規;杖耄螘r能摸到盈利的門檻。
拿下大模型領域政企合作客戶標王的科大訊飛,有望摸著DeepSeek進一步擴張。
DeepSeek的低成本策略,使得政企客戶在部署大模型中的成本憂慮開始減弱,從而有利于推動大模型在政企市場的新增長。
如今,在AI大廠們相繼接入DeepSeek模型,站上同一起跑線后,比拼的核心因素再次回到了科大訊飛的優勢區,即模型的性能強弱和對客戶的服務能力。
負責訊飛星火政企業務的王剛曾談過兩大阻礙政企客戶選擇大模型的因素,“一個是場景,一個是數據。”其中,數據指向如何對行業客戶的海量原始數據進行語料清理、收集,場景則考驗著大模型企業對細分行業的理解程度。
為此,科大訊飛總結了一整套可復制的方法論,構建起從“建算力、理數據、訓模型”,到“落場景、保安全、精運營”的全套解決方案。
“為什么我們中標數量第一,而且中標比例越來越高?因為很多企業只能做到第三步即訓練模型,后面的幾步與我們差距很大,即使能做到,他們實際上整理數據和訓練模型的能力,與我們差距也很大。”科大訊飛創始人劉慶峰進一步解釋道。
C
對于仍在沖擊AGI(通用人工智能)的大模型玩家而言,資金和信心之外,受限于政策風險,高端算力芯片對大模型的技術迭代影響正無限放大。
DeepSeek創始人梁文鋒就曾在接受36氪采訪時提到,DeepSeek面臨的主要制約因素不是資金,而是高端算力的使用權,這些芯片對于訓練先進AI模型至關重要。
從2023年10月開始,英偉達因為美國商務部的要求,不再對中國售賣最新最強的高端算力芯片,轉而推出僅供中國市場的閹割版芯片。
但隨著近期DeepSeek的崛起,即便是這些閹割版芯片,也將再次面臨被美國封禁的危險。
Scale AI創始人亞歷山大·王(Alexandr Wang)在點評DeepSeek時談到,“他們將受到芯片控制和出口管制的限制。”
來自美國另一家AI初創巨頭Anthropic創始人達里奧·阿莫迪 (Dario Amodei)的聲明,則將硅谷對DeepSeek的擔憂進一步放大。
在阿莫迪于1月底發布的萬字長文中,其認為DeepSeek的突破,更加印證了美國對華芯片出口管制政策的必要性和緊迫性。
在他看來,最快到2026或者2027年,人類就將制造出在幾乎所有事情上,都比幾乎所有人類更智能的人工智能,前提是需要至少投入數百萬塊芯片和數百億美元。
“有效執行的出口管制是唯一能夠阻止中國獲得數百萬塊芯片的手段。”這也是阿莫迪認為阻止中國在AI大模型領域趕超美國的最重要決定因素。
硅谷的態度,無疑讓國產算力替代方案,正從備選項,逐漸向必選項過渡。這方面,科大訊飛率先摸著石頭過河。
2023年,科大訊飛便聯合華為做了第一個全國產萬卡算力集群“飛星一號”,在昇騰910B的基礎上,使得大模型訓練從對標A100/A800的20%-30%提升到了90%以上,訊飛星火也由此成為中國第一個基于國產算力訓練出來的全民開放的大模型。
為了追逐AGI,科大訊飛還在布局更大的國產算力集群。去年10月,科大訊飛再度聯手華為、合肥市大數據資產運營有限公司,打造了國產超大規模智算平臺“飛星二號”。劉慶峰曾說,“到底有沒有自主可控的國產底座能力做支撐,這決定了我們在這條路上到底能走多遠。”
開放平臺、政企端落地、國產算力適配經驗成為科大訊飛承接DeepSeek流量外溢的三大抓手,在眾多大模型廠商中,也許訊飛最有機會被DeepSeek“帶飛”。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。