在數(shù)據(jù)庫領(lǐng)域,如果問當(dāng)下誰最火,那Databricks一定排得上號(hào)。
去年8月,距離10億美元的G輪融資剛過去7個(gè)月,Databricks再次獲得16億美元H輪融資,身價(jià)搖身一變成380億美元,成為外界一致認(rèn)為的超級(jí)獨(dú)角獸。一直以來,數(shù)據(jù)領(lǐng)域備受關(guān)注,如果從2007年開始計(jì)算,全球的數(shù)據(jù)量至今已經(jīng)膨脹了近200倍,數(shù)字化被寫入戰(zhàn)略規(guī)劃成了各類行業(yè)的共識(shí)。
在數(shù)據(jù)量井噴的背景下,上云趨勢(shì)也越來越明確,以Snowflake、Databricks為代表的大數(shù)據(jù)公司應(yīng)運(yùn)而生,前者基于AmazonS3打造了云端的數(shù)據(jù)倉庫,后者除了推出Lakehouse(湖倉一體),現(xiàn)在又押寶機(jī)器學(xué)習(xí),試圖包管數(shù)據(jù)在抵達(dá)機(jī)器學(xué)習(xí)之前的所有流程。
不同的是,Databricks已經(jīng)從原來的infra向更廣泛場景延伸,和昔日的伙伴Snowflake同臺(tái)競技。與此同時(shí),以AWS為代表的云巨頭,也都曾戰(zhàn)略性投資過Databricks,但現(xiàn)在也都在自研數(shù)據(jù)分析套件,競合關(guān)系漸趨白熱化,讓數(shù)據(jù)基礎(chǔ)設(shè)施的戰(zhàn)火撲朔迷離。
01從0到1
企業(yè)的性格往往被它的創(chuàng)始人和技術(shù)背景所決定。
十幾年前在UC Berkley的AI實(shí)驗(yàn)室里,Ghodsi和伙伴發(fā)起Spark項(xiàng)目:做一個(gè)能夠更輕松處理大量數(shù)據(jù)和機(jī)器算法的引擎,并且開源了代碼。相比較多數(shù)開源項(xiàng)目,面向的都是底層技術(shù)性強(qiáng)要求的infra工程師,spark面向更廣泛的客戶群,同時(shí)在上層加了很多的新的API,降低了技術(shù)門檻。
因?yàn)闆]有優(yōu)秀的開發(fā)者社區(qū)運(yùn)營和推廣團(tuán)隊(duì),Spark變現(xiàn)比較難,之后團(tuán)隊(duì)成員決定成立Databricks,以商業(yè)化方式推動(dòng)Spark社區(qū)發(fā)展。即便Spark是過去硅谷的頂流產(chǎn)品,但這并沒有讓AWS等巨頭買賬,他們選擇繞過Databricks,直接將Spark集成到自己的產(chǎn)品里。在Databricks賣產(chǎn)品還不如辦Spark峰會(huì)收入高的時(shí)候,Amazon EMR已經(jīng)針對(duì)Spark實(shí)現(xiàn)了幾億營收。
Databricks創(chuàng)始團(tuán)隊(duì)走了一條不被大眾熟知的激進(jìn)的路:云。
雖然不管對(duì)公司還是客戶來說,云可以更快部署,也更容易維護(hù),但正如聯(lián)合創(chuàng)始人Reynold Xin所說,大部分的人知道云是未來,但絕不是現(xiàn)在。當(dāng)時(shí)只有小部分風(fēng)投注資這家初創(chuàng)企業(yè),New Enterprise Associates的投資者Pete Sonsini說:“我們?cè)贒atabricks的軟件收入為零時(shí)投資,認(rèn)為他們會(huì)在大流行中加速發(fā)展,也許是一兩個(gè)月,每個(gè)人都無法及時(shí)知道會(huì)發(fā)生什么”。和Databricks一樣,他們也在賭未來。
圖:Databricks年度融資及估值變動(dòng)
2013到2015這三年,雖然有硅谷風(fēng)投支持,Databricks也借力這些資金吸引人才,推出了基于云端的簡化大數(shù)據(jù)處理平臺(tái)Databricks Cloud,但不管是招主管、找融資還是見客戶,Databricks都會(huì)被質(zhì)疑:真的不支持on-prem嗎?
因?yàn)楸晨縎park,很多客戶甚至愿意年付幾千萬美金讓Databricks提供咨詢定制化項(xiàng)目,但Databricks做的是一個(gè)給數(shù)據(jù)工程師的平臺(tái),這是當(dāng)時(shí)大部分公司聞所未聞的玩法,也是前幾年商途不順的原因之一。值得一提的是,彼時(shí)的云界開源前輩Cloudera曾改名“Cloud Era”,可在當(dāng)時(shí)的市場情況下,最終還是轉(zhuǎn)向了on-prem做定制和售后支持才得以存活。
在這種邏輯下,云廠商把開源軟件拿來經(jīng)過簡單的封裝,再作為服務(wù)賣出去。由于這個(gè)過程只需要簡單的部署和調(diào)試,工程成本極低,定價(jià)也不高,巨頭從中賺走了大部分,這對(duì)Databricks來說相當(dāng)于吸血,怎樣和有錢有人的云巨頭對(duì)抗,是Databricks亟需在技術(shù)上打造的壁壘。
他們賭的另一條路,是不做數(shù)倉。
彼時(shí)數(shù)據(jù)倉庫競爭過于激烈,以亞馬遜為首的巨頭占據(jù)了大部分市場份額,Databricks繼續(xù)小眾打法:避開紅海,嘗試切入一個(gè)新興卻可能會(huì)有爆炸性增長的小市場,針對(duì)數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師和AI的方向做產(chǎn)品。
開源小公司的優(yōu)勢(shì)在于更懂項(xiàng)目,迭代更快,能夠聚焦、死磕產(chǎn)品性能,而公有云大廠很難在單一方向投入最好的工程師。隨著數(shù)據(jù)量的爆發(fā),云的生態(tài)優(yōu)勢(shì)逐漸被認(rèn)可,加上當(dāng)時(shí)市面上也沒有大量競品,這給Databricks的產(chǎn)品帶來了機(jī)會(huì)。
另一方面,在2019年微軟投資Databricks之前,正巧CEO納德拉推動(dòng)云為先的戰(zhàn)略,兩家合作的Azure Databricks進(jìn)入了微軟的企業(yè)許可協(xié)議。微軟從一個(gè)大數(shù)據(jù)競爭劣勢(shì)的云產(chǎn)品搖身成為業(yè)界領(lǐng)先,形成了云巨頭三足鼎立的局面;因?yàn)閹缀跛写笃髽I(yè)都和微軟有ELA,共生效應(yīng)之下,客戶原本買云買Office的預(yù)算自然流向了Databricks。
有人將Databricks創(chuàng)始團(tuán)隊(duì)比作一群幸運(yùn)的加州嬉皮士RD,他們信仰技術(shù),信仰來源,信仰共享和長期主義,這些也都成為了Databricks的底色。
02超級(jí)加倍
讓所有人感到意外的是,2019年后,Databricks以絕無僅有的加速度在增長。
截至2021年2月,公司已經(jīng)籌集了近20億美元資金,包括由富蘭克林鄧普頓領(lǐng)投的10億美元G輪融資,此時(shí)Databricks估值已經(jīng)達(dá)到280億美元;在經(jīng)過最新輪融資后,Databricks380億的身價(jià)與三年前的62億相比暴增了近13倍。
基本面決定價(jià)值,價(jià)值決定價(jià)格,如果將Databricks的成功僅歸結(jié)于對(duì)技術(shù)犀利的洞察,借助了巨人的肩膀和好運(yùn)氣,這還遠(yuǎn)遠(yuǎn)不夠。基于開源的創(chuàng)新是Databricks成長的關(guān)鍵,從大數(shù)據(jù)領(lǐng)域殺入云計(jì)算和AI,它的產(chǎn)品矩陣?yán)锇―eltaLake、MLflow、Koalas以及開源分析引擎Spark等殺傷利器。
其中,超過80%的用戶使用Delta Lake;MLFlow為數(shù)據(jù)科學(xué)家提供了標(biāo)準(zhǔn)化的開源框架,下載量以每月80萬的速度增長,擁有比Spark更多的用戶;而Koalas可以讓數(shù)據(jù)科學(xué)家在筆記本電腦上使用Pandas編程,調(diào)用幾個(gè)API就可以將工作部署到大型的分布式Spark集群上,把Pandas社區(qū)的數(shù)據(jù)科學(xué)創(chuàng)新帶給了Spark用戶。
幫助其他企業(yè)構(gòu)建自己的AI能力,透露出了Databricks的野心:從BI到AI,構(gòu)建一個(gè)企業(yè)AI平臺(tái),因?yàn)镚hodsi認(rèn)為,在企業(yè)計(jì)算領(lǐng)域,行業(yè)還沒有出現(xiàn)頭部的企業(yè)AI平臺(tái)。
除了軟件產(chǎn)品本身,Databricks的業(yè)務(wù)模式也有所不同。
傳統(tǒng)的開源商業(yè)模式是軟件免費(fèi),廠商收取支持和服務(wù)費(fèi)用,這在on-prem里或許可行,但在云的世界就不一定了。Databricks在開發(fā)、軟件運(yùn)行、運(yùn)營和托管方面向客戶收費(fèi),采用SaaS開源的盈利模式,客戶可以在本地開源平臺(tái)下載免費(fèi)的基礎(chǔ)軟件,同時(shí)也可以下載開源公司打造的其他付費(fèi)版本。
不高估開源,也不低估市場,Ghodsi說:“在云端托管開源項(xiàng)目并把它們租給用戶,客戶流失率更低,利潤增長更快”。SaaS租賃模式下,Databricks的核心知識(shí)產(chǎn)權(quán)沒有存放在它所贊助的開源軟件項(xiàng)目中,而是在它用來監(jiān)管云端軟件的工具中,這樣避免了泄露的風(fēng)險(xiǎn)。
根據(jù)報(bào)告,Databricks最新ARR (年度經(jīng)常性收入)達(dá)到6億美元,相當(dāng)于Snowflake同財(cái)年12億營業(yè)收入的一半,截至目前,后者市值近670億美元,如果按照兩倍之比來簡單預(yù)估,Databricks380億的估值也比較合理。以新估值計(jì)算,Databricks的價(jià)值是當(dāng)前ARR的63倍,相較于2020年的4.25億美元,ARR近30%的增長率讓投資者對(duì)它未來的收入十分看好。
圖:Snowflake與Databricks定價(jià)對(duì)比(來源:官網(wǎng))
另一方面,通過對(duì)比官網(wǎng)收費(fèi)方式發(fā)現(xiàn),雖然是平臺(tái)租出服務(wù)器的計(jì)算資源,但這些服務(wù)器整個(gè)系統(tǒng)都建立在主要的云廠商的基礎(chǔ)服務(wù)上。以Snowflake(左)為例,同樣是以每秒粒度使用的計(jì)算資源付費(fèi),Snowflake是平臺(tái)和云廠商打包收費(fèi)方式,客戶對(duì)底層服務(wù)界面(如EC2)和上游的Snowflake的成本花費(fèi)要一次性付清,但比例是怎樣無從得知,而打包之后Snowflake需要支付給云廠商另外成本,這在無形中增加了費(fèi)用風(fēng)險(xiǎn)。
Databricks(右)的玩法是分開收費(fèi),用戶的賬單主要分為兩部分:常規(guī)的底層云廠商服務(wù)器租用成本,以及Databricks在這些服務(wù)器上的功能費(fèi)用??蛻羰褂玫讓悠鲿r(shí),費(fèi)用單獨(dú)付給云廠商,并不算在Databricks的營收里。
所以如果對(duì)比營收,比如2020年的Snowflake營收近6億,但刨去付給云廠商的費(fèi)用,和Databricks4億多的營收相比,也差不了多少。而這既是Databricks毛利率比Snowflake高的原因,也是前者賺錢能力強(qiáng)的體現(xiàn)。有觀點(diǎn)猜測Databricks遲遲不上市的原因,如果根據(jù)Ghodsi的說法,是為了避免二級(jí)市場所帶來的波動(dòng),或許收費(fèi)方式被迫改變等不可預(yù)測因素也在里面。
03天時(shí)地利人和
根據(jù)官網(wǎng)顯示,除了為數(shù)據(jù)科學(xué)家、數(shù)據(jù)領(lǐng)導(dǎo)者與數(shù)據(jù)工程師提供角色解決方案,Databricks還利用大數(shù)據(jù)和AI為廣告和營銷、通訊服務(wù)商、教育、能源、聯(lián)邦政府、金融、醫(yī)療等13類行業(yè)提供服務(wù)。
從類別數(shù)量上,Databricks要多于Snowflake,此時(shí)全球已經(jīng)有7000 多家組織(包括荷蘭銀行、康泰納仕、H&M 集團(tuán)、再生元和殼牌)依靠 Databricks 實(shí)現(xiàn)大規(guī)模數(shù)據(jù)工程、協(xié)作數(shù)據(jù)科學(xué)、全生命周期機(jī)器學(xué)習(xí)和業(yè)務(wù)分析。
通常情況下,企業(yè)客戶在進(jìn)行數(shù)據(jù)架構(gòu)時(shí),第三方平臺(tái)提供數(shù)據(jù)湖方案,在數(shù)據(jù)湖中做一些常見的數(shù)據(jù)工程;同時(shí)會(huì)有一個(gè)數(shù)據(jù)倉庫,存放相當(dāng)于數(shù)據(jù)湖5%-10%的結(jié)構(gòu)化數(shù)據(jù),來做BI等簡單的數(shù)據(jù)分析。
但由于數(shù)據(jù)分裂在兩個(gè)系統(tǒng)上,針對(duì)同一個(gè)客戶問題分析,不同團(tuán)隊(duì)有不同權(quán)限,因而會(huì)看到不同版本的同一份數(shù)據(jù),當(dāng)?shù)贸霾煌Y(jié)論后,做商業(yè)決策的團(tuán)隊(duì)不相信數(shù)據(jù),進(jìn)而導(dǎo)致底層數(shù)據(jù)平臺(tái)失信,這是個(gè)很致命的問題。
將結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)結(jié)合到一個(gè)地方,讓客戶在不移動(dòng)底層數(shù)據(jù)的情況下執(zhí)行數(shù)據(jù)科學(xué)和商業(yè)智能工作,是大數(shù)據(jù)發(fā)展的一個(gè)關(guān)鍵變化。于是,Databricks決定力推Lakehouse,能夠直接在數(shù)據(jù)湖的低成本存儲(chǔ)上,實(shí)現(xiàn)類似于數(shù)據(jù)倉中的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)管理的功能,可支持BI到AI所有的工作流。
從Databricks的網(wǎng)頁介紹上看,無論是數(shù)據(jù)工程、數(shù)據(jù)科學(xué),還是機(jī)器學(xué)習(xí)都要依靠Lakehouse運(yùn)行,加上過去使用低成本對(duì)象存儲(chǔ)的數(shù)據(jù)湖的訪問速度很慢,如今DB SQL提高了分析質(zhì)量和性能,使數(shù)據(jù)湖在大數(shù)據(jù)集上的處理與數(shù)據(jù)倉庫相媲美。
“Lakehouse是一個(gè)新賽道,這是一場地盤爭奪戰(zhàn)”,H輪融資之后,Ghodsi表示,這筆資金將主要用于加速Lakehouse的產(chǎn)品創(chuàng)新和市場開拓。與此同時(shí),Databricks透露保留所有主要公共云的選擇和靈活性,并將Lakehouse發(fā)展成傳統(tǒng)數(shù)據(jù)倉庫的替代品。
越來越多的企業(yè)樂于看到Databricks的實(shí)力和發(fā)展?jié)摿?,這和它本身的商業(yè)邏輯有關(guān),業(yè)內(nèi)傳統(tǒng)企業(yè)如Teradata在營收額上雖高過Databricks好幾個(gè)身位,但市值仍徘徊在40多億美元。大劑量的資金注入后,Databricks選擇并購來填補(bǔ)產(chǎn)品路線圖中的空白或不足,重點(diǎn)是機(jī)器學(xué)習(xí)和數(shù)據(jù)初創(chuàng)公司,以及擴(kuò)大與云公司的合作伙伴關(guān)系。
“云、開源、機(jī)器學(xué)習(xí),這三個(gè)方面已成為每家企業(yè)戰(zhàn)略的核心。我們真的很幸運(yùn)能夠處在這三大趨勢(shì)的中心位置上。”Ghodsi在接受采訪時(shí)說到。如果說2019年前看好Databricks的小部分風(fēng)投是賭趨勢(shì),如今匆匆進(jìn)場的其他機(jī)構(gòu)也并沒有遲到,因?yàn)樵谒麄冄劾?,這家獨(dú)角獸仍具備難以估量的增長能力。
關(guān)鍵詞:
- 發(fā)力蛋制品 勁仔食品小蛋圓圓鵪鶉蛋入圍iSEE全球創(chuàng)新品牌百強(qiáng)榜
- 新捷途X70S顏值與實(shí)力全面升級(jí),將于4月29日發(fā)布預(yù)售
- 奶茶行業(yè)品牌多、競爭大 冰雪時(shí)光靠什么贏得掌聲?
- 千千惠生活全國上線“隨心退”功能,消費(fèi)者可無條件隨時(shí)退款
- 杭州臨平區(qū):創(chuàng)建市場疫情防控“三色”預(yù)警分類管理機(jī)制 動(dòng)態(tài)防控監(jiān)測預(yù)警
- 海南開展防止一次性不可降解塑料制品入島聯(lián)合執(zhí)法行動(dòng) 對(duì)當(dāng)事人立案調(diào)查
- 河北保定市場監(jiān)管局創(chuàng)新應(yīng)用信用分級(jí)分類監(jiān)管 提升監(jiān)管效能助力營商環(huán)境優(yōu)化
- 原料新鮮 用料扎實(shí) 冰雪時(shí)光穩(wěn)扎茶飲下沉市場
- 陜西省市場監(jiān)管局連續(xù)三年榮獲平安陜西建設(shè)先進(jìn)集體 充分發(fā)揮市場監(jiān)管職能優(yōu)勢(shì)
- 浙江杭州:西湖食品安全風(fēng)險(xiǎn)綜合治理中心掛牌成立 健全機(jī)制規(guī)范運(yùn)行為
- 湖北恩施州鶴峰縣市場監(jiān)管局開展進(jìn)口水果排查專項(xiàng)行動(dòng) 加強(qiáng)宣傳引導(dǎo)
- 寧夏青銅峽市場監(jiān)管局:擰緊節(jié)日食藥“安全閥” 確保節(jié)日期間市場安全穩(wěn)定
- 北京東城對(duì)轄區(qū)旅游客運(yùn)企業(yè)開展專項(xiàng)聯(lián)合檢 營造和諧市場環(huán)境
- 安徽開展專項(xiàng)執(zhí)法查處濫用行政權(quán)力行為 共同營造公平競爭良好社會(huì)環(huán)境
- 安徽啟動(dòng)2022年春茶地理標(biāo)志保護(hù)專項(xiàng)行動(dòng) 促進(jìn)茶產(chǎn)業(yè)高質(zhì)量發(fā)展
- 吉林:開展知識(shí)產(chǎn)權(quán)代理行業(yè)“藍(lán)天”專項(xiàng)整治行動(dòng) 促進(jìn)知識(shí)產(chǎn)權(quán)服務(wù)業(yè)健康發(fā)展
- 福建福州:宣傳知識(shí)產(chǎn)權(quán)法律知識(shí) 全方位推進(jìn)地方高質(zhì)量發(fā)展超越
- 遼寧撫順積極建設(shè)知識(shí)產(chǎn)權(quán)強(qiáng)市 建設(shè)知識(shí)產(chǎn)權(quán)強(qiáng)市為目標(biāo)
- 2021年全國公共服務(wù)質(zhì)量監(jiān)測情況發(fā)布 南京以總體滿意度?排名第一
- 立案20件!安徽嚴(yán)查哄抬物價(jià)等價(jià)格違法行為 督促經(jīng)營者守法經(jīng)營

- 杭州臨平區(qū):創(chuàng)建市場疫情防控“三色”預(yù)警分類管理
- 海南開展防止一次性不可降解塑料制品入島聯(lián)合執(zhí)法行
- 河北保定市場監(jiān)管局創(chuàng)新應(yīng)用信用分級(jí)分類監(jiān)管 提
- 陜西省市場監(jiān)管局連續(xù)三年榮獲平安陜西建設(shè)先進(jìn)集體
- 浙江杭州:西湖食品安全風(fēng)險(xiǎn)綜合治理中心掛牌成立
- 湖北恩施州鶴峰縣市場監(jiān)管局開展進(jìn)口水果排查專項(xiàng)行
- 寧夏青銅峽市場監(jiān)管局:擰緊節(jié)日食藥“安全閥” 確
- 北京東城對(duì)轄區(qū)旅游客運(yùn)企業(yè)開展專項(xiàng)聯(lián)合檢 營造和
- 安徽開展專項(xiàng)執(zhí)法查處濫用行政權(quán)力行為 共同營造公
- 安徽啟動(dòng)2022年春茶地理標(biāo)志保護(hù)專項(xiàng)行動(dòng) 促進(jìn)茶產(chǎn)
- 1 發(fā)力蛋制品 勁仔食品小蛋圓圓鵪鶉蛋入圍iSEE全球創(chuàng)
- 2 新捷途X70S顏值與實(shí)力全面升級(jí),將于4月29日發(fā)布預(yù)售
- 3 奶茶行業(yè)品牌多、競爭大 冰雪時(shí)光靠什么贏得掌聲?
- 4 千千惠生活全國上線“隨心退”功能,消費(fèi)者可無條件
- 5 杭州臨平區(qū):創(chuàng)建市場疫情防控“三色”預(yù)警分類管理
- 6 海南開展防止一次性不可降解塑料制品入島聯(lián)合執(zhí)法行
- 7 河北保定市場監(jiān)管局創(chuàng)新應(yīng)用信用分級(jí)分類監(jiān)管 提
- 8 原料新鮮 用料扎實(shí) 冰雪時(shí)光穩(wěn)扎茶飲下沉市場
- 9 陜西省市場監(jiān)管局連續(xù)三年榮獲平安陜西建設(shè)先進(jìn)集體
- 10 浙江杭州:西湖食品安全風(fēng)險(xiǎn)綜合治理中心掛牌成立