6月1日,螞蟻科技集團自主研發的分布式OceanBase數據庫宣布正式開源,并成立OceanBase開源社區。而就在兩天前,阿里云剛剛宣布對外開放關系型數據庫PolarDB數據庫for PostgreSQL的源代碼。日前,華為的openGause、浪潮的ZNBase等也先后宣布開源。大廠們不約而同的躬身入局似乎透露出一個重要信號:開源數據庫正在以前所未有的強勢之姿挺進國內、乃至全球數據庫市場。
為什么是現在?
隨著國內的開放原子開源基金會掛牌成立、工信部等部門聯合 Gitee 建設中國獨立的開源托管平臺、TiDB 開發商 PingCAP 完成 D 輪 2.7 億美元融資等一系列大事件的發生,行業對開源的熱情高漲。而“十四五”規劃首次將“開源”列入其中,并從底層基礎設施方面進行了規劃,明確指出應完善開源知識產權和法律體系,更是讓業界對開源的信心大振。
DB-Engines 今年5月份數據庫排名顯示,傳統數據庫霸主Oracle依然居于榜首,但當月得分下降4.98。知名開源數據庫MySQL較上月得分增長15.69,位列第二。再看國內市場,墨天輪5月國產數據庫排行榜中,位列前三甲的TiDB、OceanBase、PolarDB皆為開源數據庫。業內普遍觀點認為,眼下數據庫已經到了變革的重要關口,最直觀的表現就是傳統數據庫持續衰落和云原生數據庫、開源數據庫等新一代數據庫加速崛起。
對于廠商而言,搶占生態才是核心目的。神州數碼數據戰略咨詢部總經理李盛在接受《中國電子報》記者采訪時指出:“所有的應用、服務都‘生長’在數據庫之上,所以它的‘綁定效應’非常強,遷移成本極高。大廠們真正在博弈的其實是生態,開源是為了吸引更多的用戶來拓展自身生態。” Oracle曾在國內數據庫市場一家獨大,占有40%的份額,F在本土化替代呼聲漸起,這讓國內廠商們看到了機會。
“擁抱開源將有助于合作伙伴和開發者了解和熟悉其數據庫特性。應用廠商可以做到更好原生的適配。合作伙伴可以圍繞其產品進行運維工具的開發。同時,開源社區將有助于經驗分享,為實施和研發提供便利。” Forrester分析師盧冠男對《中國電子報》記者說道。開源不僅僅是一種選擇,也代表了一種態度,代表了“多方協同、合作共贏、未來共享”的開放生態趨勢。
在國內,數據庫開源的道路并非一番風順。“學術界、產業界、科研界,到領導層,對開源的態度其實經歷了幾個階段的變化,從一開始覺得開源與否好像無關緊要,到現在認為開源可能會是國家在基礎軟件層面的必經之路。” 阿里云數據庫負責人、達摩院數據庫首席科學家李飛飛表示,“像PG、MySQL這種主流的開源數據庫生態目前主要還是在海外,以美國為主導,我們希望能夠一點一點的把社區的話語權和主導權轉移到中國。”
開源時代,國內科技企業迎來了“彎道超車”的機會。如今數據成為數字化核心資產,擁抱開源有助于打破技術壁壘,擺脫對海外商業數據庫公司的依賴,進一步提升國內企業在開源社區的影響力與話語權。
是“內卷”,還是共生?
OceanBase最大的亮點是100%全自研,承擔螞蟻金服核心鏈路支撐如“雙十一”、支付寶等,并在中國工商銀行、山東移動、福建移動、數字江西、中華保險、人保健康等上百家機構落地,經過了十余年不同場景的嚴苛打磨,強一致性,高吞吐量、高并發等優點毋庸置疑。
同為阿里系,阿里云推出的PolarDB主打“云原生“這張技術牌。云原生的好處是從一開始就能讓用戶充分享受到云計算可以靈活擴展的技術紅利,支持更為海量數據,且靈活伸縮、性價比高。據介紹,此次開源的版本可以高度兼容現有的PG 和MySQL生態,適用于中大型企業核心業務場景。
有觀點質疑,PolarDB和OceanBase同為阿里系的關系型數據庫產品,現在又都開源了,會不會導致“內卷”消耗?業內資深人士評論稱,相較之下,Oceanbase更為聲勢浩大,它有取代Oracle的野心,目前主要還是在金融電信行業更受歡迎;PolarBD則更偏技術流,行業屬性沒有那么明顯。
此外,從開源平臺來看,OceanBase相對保守,選擇的木蘭公共協議 MulanPubL-2.0 版屬于傳染型,對開源軟件的分發條件有限制性要求,對云計算和SaaS等新興技術的分發也有條件限制。而PolarDB則更大膽,選擇了對開發者最友好的Apache Version 2.0協議,以全共享并尊重原作者著作權的模式開源,代碼可以修改和再發布。
二者到底是什么關系?李飛飛曾在此前的采訪中公開回應過:“PolarDB和OceanBase是良性的競爭關系。開源歡迎大家都來做,參與的人越多越好。只有競爭才能讓系統和技術不斷向前演進。”
這兩款開源的數據庫產品將進一步豐富阿里的軟件生態,也會在良性競爭關系中加速創新突破,帶動國產數據庫的開放共贏。從這個角度來看,雙方既是競爭者,也是友軍。
據不完全統計,國內市場僅2020年新成立的數據庫公司就有110家。主流玩家可被分為四大流派,分別是以南大通用、武漢達夢、人大金倉為代表的“學院派”,騰訊、阿里為代表的“互聯網派”,TiDB、巨杉、萬里開源、青云為代表的“創業派”和中興、亞信為代表的“企業派”。參與開源的已不在少數?梢哉f,國產開源數據庫賽道進入了百舸爭流的局面。
開源之后,真正的挑戰是運營
然而,開源只是第一步,OceanBase要做的還有很多。盧冠男談到:“通過開源加速完善生態,螞蟻會進一步提高市場覆蓋度,讓合作伙伴更專業,同時讓自身更專注于產品研發,最終實現更廣泛的滿足客戶需求并獲取市場的目標。但需要注意的是,客戶對數據庫的需求很大一部分來自對原有數據庫升級和替換,所以在規劃、應用適配、部署和維護環節對專家服務團隊的依賴度會很高,螞蟻需要處理好數據庫遷移的挑戰,構建廣泛的合作伙伴生態來做好服務環節。”
其實關于開源數據庫的爭議聲一直都有。“雖然開源數據庫沒有高昂的商業授權許可費用,但也會帶來不少問題。一些開源數據庫易用性差、配套能力也較弱,需要不斷地維護,而且一旦遇到數據丟失問題,很難快速恢復,造成的損失不可估量。”業內專家表示,“另外還得面臨維護升級、人力運維等各類成本支出,即便上云也很難滿足金融、政企等對數據安全、響應速度有嚴苛要求的大型企業。”
對此,李盛認為:“未來的生態一定是開源的,但國產數據庫正在蓬勃發展中,產品、技術、服務水平都還在持續提升的過程中。”從商業模式上來看,基于開源版本衍生出的商用版本比純商用版本更便宜、更靈活,同時還可以自己來進行二次開發,能夠更好的滿足業務需求。從安全性來看,數據庫本身就會部署在相對安全的內網環境,開源的主要是技術而不是數據本身,即使數據應用、分析環節可能面臨風險,但完全可以通過相關數據安全軟件去進行自我保護。“至于核心業務系統的開源還需更多技術論證,不可操之過急。”
據了解,阿里云內部也曾展開過激烈的討論,甚至“拍過桌子”,但最終還是決定開源。李飛飛表示:“開源是建立生態的一個關鍵抓手,它和商業化絕對不是天然矛盾的兩面。一定要處理好二者之間的平衡,這就需要有非常強的定力和判斷力。”他指出,開源并不是“靈丹妙藥”,不是開源了就能解決所有問題,關鍵還是要看后續的社區運營。“是不是真的在用心做社區,能不能貢獻出高質量的代碼,讓大家都能夠從中獲益,這才是開源之后要面對的真正挑戰。”
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。