調(diào)研| 李喆 王琦
撰寫| 李喆
即使將范圍從大數(shù)據(jù)縮小到數(shù)據(jù)庫這個(gè)細(xì)分領(lǐng)域,PingCAP 依然是家非常特殊的公司,其產(chǎn)品 TiDB 是市面上為數(shù)不多面向 HTAP 場景的數(shù)據(jù)庫。
傳統(tǒng)意義上,數(shù)據(jù)庫分成事務(wù)性數(shù)據(jù)庫(TP)和分析性數(shù)據(jù)庫(AP)。
近幾年興起的NoSQL 數(shù)據(jù)庫、如 MongoDB、基于 Hadoop 的 Hbase,更多都是分析性數(shù)據(jù)庫,通過分布式架構(gòu)解決大規(guī)模的數(shù)據(jù)查詢、分析問題。
然而,承載生產(chǎn)系統(tǒng)的事務(wù)性數(shù)據(jù)庫卻始終被傳統(tǒng)數(shù)據(jù)庫廠商所把持,Oracle、IBM 等占據(jù)傳統(tǒng)大型企業(yè)市場,中小企業(yè)及互聯(lián)網(wǎng)公司則大多數(shù)采用開源技術(shù) MySQL,鮮有新技術(shù)、新公司能夠進(jìn)入這個(gè)市場。
2012 年,Google 的 Spanner 橫空出世,這是一款基于分布式架構(gòu)的事務(wù)性數(shù)據(jù)庫。受到 Google 的啟發(fā),國外出現(xiàn)了 CockroachDB(蟑螂數(shù)據(jù)庫)等一系列解決 TP 問題的新興數(shù)據(jù)庫廠商,但國內(nèi)市場幾乎還是空白,找不到研發(fā)這類數(shù)據(jù)庫的創(chuàng)業(yè)公司。
2015 年,PingCAP 成立,填補(bǔ)了國內(nèi)的空白。
互聯(lián)網(wǎng)背景的團(tuán)隊(duì),用開源模式做數(shù)據(jù)庫
與市面上其他數(shù)據(jù)庫廠商不同的是,PingCAP 創(chuàng)始團(tuán)隊(duì)大多數(shù)來自大型互聯(lián)網(wǎng)公司,如豌豆莢、京東等,幾乎沒有來自傳統(tǒng)IT或者數(shù)據(jù)庫廠商。
互聯(lián)網(wǎng)的背景,創(chuàng)始團(tuán)隊(duì)每名成員都經(jīng)歷過數(shù)據(jù)指數(shù)級(jí)增長的時(shí)期,具備處理海量數(shù)據(jù)的經(jīng)驗(yàn),做數(shù)據(jù)庫產(chǎn)品會(huì)優(yōu)先考慮擴(kuò)展性。
同時(shí),因?yàn)榛ヂ?lián)網(wǎng)公司大多會(huì)采取MySQL 技術(shù),因此 TiDB 最先兼容的是 MySQL 協(xié)議,這使得 PingCAP 更容易獲取客戶。
互聯(lián)網(wǎng)還有個(gè)特點(diǎn)是開源為先,PingCAP 從第一天就確立了用開源方式做數(shù)據(jù)庫的打法。但與其他團(tuán)隊(duì)不同的是,PingCAP 的創(chuàng)始人劉奇等人,曾經(jīng)是分布式緩存項(xiàng)目 Codis 的作者,具備開源社區(qū)運(yùn)營的能力,懂得如何借助社區(qū)力量發(fā)展產(chǎn)品。
開源社區(qū)一方面會(huì)擴(kuò)大PingCAP 產(chǎn)品的覆蓋面,帶來潛在的客戶;另一方面,通過開源社區(qū)的運(yùn)營,PingCAP 將更多精力放在核心產(chǎn)品 TiDB 的研發(fā),其他功能可以一部分由開源社區(qū)用戶來實(shí)現(xiàn)。
此外,通過用戶反饋,PingCAP 可以了解用戶的潛在需求,作為 TiDB 研發(fā)的一個(gè)參考。
產(chǎn)品同時(shí)支持TP 和 AP,強(qiáng)一致性和擴(kuò)展性是主要特點(diǎn)
最初,TiDB 只是解決 TP 問題,但在實(shí)際應(yīng)用過程中,直接讓客戶用新數(shù)據(jù)庫替代原先的 MySQL 數(shù)據(jù)庫難度很大,尤其當(dāng)數(shù)據(jù)庫廠商是一家名不見經(jīng)傳的初創(chuàng)公司。
多數(shù)企業(yè)客戶的做法是前端仍然保留傳統(tǒng)MySQL 數(shù)據(jù)庫,將 TiDB 數(shù)據(jù)庫作為背后的數(shù)據(jù)集市,與前端數(shù)據(jù)庫相連,但這個(gè)數(shù)據(jù)集市的實(shí)時(shí)性要遠(yuǎn)好于 Hadoop 架構(gòu)的數(shù)據(jù)集市,可以運(yùn)行在實(shí)際生產(chǎn)系統(tǒng)。
當(dāng)按照這種方式運(yùn)行一段時(shí)間,客戶認(rèn)可PingCAP 的產(chǎn)品后,會(huì)逐步替換掉 MySQL 數(shù)據(jù)庫,將 TiDB 作為前端數(shù)據(jù)庫。
當(dāng)客戶將TiDB 數(shù)據(jù)庫作為數(shù)據(jù)集市來使用時(shí),因?yàn)榍岸藬?shù)據(jù)庫要從這個(gè)數(shù)據(jù)集市中查詢數(shù)據(jù),因此,對(duì) TiDB 數(shù)據(jù)庫的查詢功能提出更高要求。TiDB 調(diào)整了自己的數(shù)據(jù)庫執(zhí)行器,進(jìn)行 AP 功能的拓展。
這樣一來,TiDB 同時(shí)支持 TP 和 AP 功能,成為分布式 HTAP(Hybrid Transactional/Analytical Processing)數(shù)據(jù)庫產(chǎn)品。
TP 場景下,TiDB 具備強(qiáng)一致性的特點(diǎn),可以承載金融等對(duì)數(shù)據(jù)一致性敏感度很高的行業(yè)。與傳統(tǒng)數(shù)據(jù)庫相比,TiDB 可擴(kuò)展性是最大優(yōu)勢(shì)。TiDB 可以通過不斷增加機(jī)器來提升性能。
AP 場景下,與 Hbase 等相比,PingCAP 的實(shí)時(shí)性更好,處理數(shù)據(jù)的速度更快。
現(xiàn)階段主要覆蓋互聯(lián)網(wǎng)金融、游戲等互聯(lián)網(wǎng)領(lǐng)域,銷售線索主要來自開源社區(qū)
與傳統(tǒng)企業(yè)相比,互聯(lián)網(wǎng)公司更加容易嘗試新技術(shù),互聯(lián)網(wǎng)背景出身的團(tuán)隊(duì)也更加能夠清楚互聯(lián)網(wǎng)公司的業(yè)務(wù)特點(diǎn)。
同時(shí),互聯(lián)網(wǎng)公司的發(fā)展速度大多遠(yuǎn)超傳統(tǒng)企業(yè),數(shù)據(jù)量增長速度極快,對(duì)改善底層技術(shù)架構(gòu)、提升數(shù)據(jù)庫性能的需求更加強(qiáng)烈,特別是在游戲行業(yè)、互聯(lián)網(wǎng)金融行業(yè)。
這些因素促使PingCAP 早期客戶大多數(shù)來自互聯(lián)網(wǎng)企業(yè),同程旅游、360 金融、摩拜單車等都陸續(xù)成為 PingCAP 的客戶。
截至2017 年底,PingCAP 整體團(tuán)隊(duì)規(guī)模達(dá)到 100 人左右,其中超過 80% 是研發(fā),只有一名全職銷售。
一名銷售的獲客能力非常有限,PingCAP 主要還是通過開源社區(qū)的方式獲客,銷售人員只負(fù)責(zé)跟進(jìn)有意向的企業(yè)。2017 年,應(yīng)用在實(shí)際生產(chǎn)環(huán)境的用戶達(dá)到 200 家,最終產(chǎn)生十幾家付費(fèi)客戶。
現(xiàn)階段,PingCAP 重點(diǎn)仍然放在產(chǎn)品打磨和社區(qū)運(yùn)營上,尚未進(jìn)入到產(chǎn)品大范圍推廣階段,因此,2018 年 PingCAP 會(huì)考慮進(jìn)入金融、醫(yī)療、物流等傳統(tǒng)行業(yè),但不會(huì)大范圍增加銷售團(tuán)隊(duì),仍然會(huì)采取較為謹(jǐn)慎的市場策略。
近期,愛分析對(duì)PingCAP 創(chuàng)始人劉奇進(jìn)行訪談,他對(duì) PingCAP 的業(yè)務(wù)模式、未來戰(zhàn)略,以及數(shù)據(jù)庫行業(yè)未來發(fā)展趨勢(shì)等方面,進(jìn)行闡述,現(xiàn)將部分訪談內(nèi)容分享。
基于解決數(shù)據(jù)庫擴(kuò)展性問題的初衷,產(chǎn)品可同時(shí)滿足TP 和 AP 業(yè)務(wù)需求
愛分析:您創(chuàng)立PingCAP 的初衷是什么?
劉奇:我在京東工作的時(shí)候就已經(jīng)有這個(gè)想法,當(dāng)時(shí)沒有一個(gè)可以很好實(shí)現(xiàn)擴(kuò)展的數(shù)據(jù)庫,最普遍的做法是分庫分表。但這種方式存在缺點(diǎn),第一它的彈性擴(kuò)展能力比較差,第二是易用性比較差,第三是編程的心智負(fù)擔(dān)比較大,第四是表達(dá)力比較弱。
當(dāng)時(shí)我在做一個(gè)項(xiàng)目,也需要分布式數(shù)據(jù)庫,但是市面上沒有令人滿意的產(chǎn)品。
所以,最開始的定位是想解決自己的問題,中間我們還開發(fā)了一個(gè)分布式緩存,之后我們開始著手解決數(shù)據(jù)庫擴(kuò)展性的問題,就出來創(chuàng)業(yè)了。
愛分析:數(shù)據(jù)庫作為底層技術(shù),客戶選擇供應(yīng)商會(huì)非常謹(jǐn)慎,最初是如何獲取客戶的?
劉奇:2016 年,我們拿到了云啟資本的 A 輪融資之后,開始考慮怎么去獲取第一批用戶。的確,用戶將一個(gè)新的數(shù)據(jù)庫應(yīng)用到線上是存在風(fēng)險(xiǎn)的,誰愿意拿自己線上的業(yè)務(wù)去冒險(xiǎn)嘗試一個(gè)全新的數(shù)據(jù)庫?
蓋婭互娛是我們第一個(gè)用戶。那個(gè)時(shí)候,他們的MySQL 數(shù)據(jù)庫出現(xiàn)了問題,線上查詢速度特別慢,整個(gè)系統(tǒng)已經(jīng)卡頓到無法使用,不嘗試使用新的技術(shù)已經(jīng)很難開展業(yè)務(wù)。我們當(dāng)時(shí)的產(chǎn)品還在測(cè)試階段,他們就開始推動(dòng)這個(gè)數(shù)據(jù)庫上線。
因?yàn)椴捎眯碌臄?shù)據(jù)庫到線上確實(shí)是存在風(fēng)險(xiǎn)的,因此很多用戶采用另一個(gè)方式來做。線上有一堆MySQL 在運(yùn)行,他們?cè)诤竺娲罱ㄒ粋€(gè)大的數(shù)據(jù)集群,把所有的數(shù)據(jù)全部匯到這里,看起來有點(diǎn)像數(shù)倉。因?yàn)槲覀儽旧硎羌嫒輩f(xié)議的,我們可以把數(shù)據(jù)復(fù)制過來,他們來進(jìn)行實(shí)時(shí)查詢。
在游戲行業(yè)或者是實(shí)時(shí)性要求比較高的風(fēng)控管理,他們就急需要這種技術(shù)來解決問題。
我們目前披露了很多金融案例,有相當(dāng)一部分都是用在實(shí)時(shí)風(fēng)控這個(gè)場景。好處是不直接針對(duì)線上業(yè)務(wù),風(fēng)險(xiǎn)相比線上MySQL 要小,而又剛好解決了他們的痛點(diǎn)。
這個(gè)階段之后,客戶如果覺得技術(shù)足夠穩(wěn)定,他會(huì)把線上撤下來,再把我們的產(chǎn)品推到最前面去,來支撐所有業(yè)務(wù)。
當(dāng)客戶把我們的數(shù)據(jù)庫當(dāng)作數(shù)倉的時(shí)候,其實(shí)查詢的復(fù)雜程度很高,我們的數(shù)據(jù)庫能幫助客戶做一些以前不敢做的事情,一個(gè)SQL 查詢語句甚至好幾頁紙那么長。
那么問題來了,我們的設(shè)計(jì)本身并不是為了AP 業(yè)務(wù),而查詢這個(gè)功能是側(cè)重 AP 的,因此我們?cè)趦?yōu)化執(zhí)行器的時(shí)候,也做了相應(yīng)的調(diào)整,做了 AP 功能的拓展。
這樣一來,我們的產(chǎn)品能同時(shí)支持線上TP 和 AP 業(yè)務(wù),我們的產(chǎn)品就變成 HTAP。
當(dāng)把這個(gè)產(chǎn)品做好之后,我們發(fā)現(xiàn)產(chǎn)品的特點(diǎn)十分明顯,在這個(gè)領(lǐng)域沒有一個(gè)強(qiáng)有力的競爭對(duì)手,而且這個(gè)產(chǎn)品是滿足用戶需求的。很多時(shí)候用戶的需求并不能簡單的分為TP 還是 AP,實(shí)際上是沒有明確定義的,甚至客戶并不關(guān)心這些,只希望能夠解決自身的問題。
愛分析:從數(shù)據(jù)寫入和查詢上看,存在行與列的差別,TiDB 如何在一個(gè)表里實(shí)現(xiàn)的?
劉奇:行列只是一個(gè)存儲(chǔ)的形式,從技術(shù)角度來講還是可以做行列變化的。
比如說把冷數(shù)據(jù)慢慢的后臺(tái)轉(zhuǎn)成列存,然后最新寫入的數(shù)據(jù)仍然使用行存。前臺(tái)還是一個(gè)標(biāo)準(zhǔn)的行存,根據(jù)數(shù)據(jù)的冷熱,轉(zhuǎn)換成行存還是列存。
其實(shí),最新的論文已經(jīng)提出了新的觀點(diǎn),數(shù)據(jù)的存儲(chǔ)并不純粹的是行存或者列存,而是根據(jù)訪問頻率,經(jīng)常訪問的數(shù)據(jù)使用行存,并不需要掃整個(gè)表,實(shí)現(xiàn)的方式還是很多樣的。
愛分析:谷歌在做Spanner 的時(shí)候強(qiáng)調(diào)其擴(kuò)展性,在算力上要求是不是比較低?
劉奇:這是以前谷歌的一個(gè)理念,但這樣的話,如果去做一些相對(duì)比較復(fù)雜的運(yùn)算的時(shí)候,數(shù)據(jù)庫的反應(yīng)時(shí)間會(huì)比較長,這是存儲(chǔ)格式?jīng)Q定的。
不過,谷歌2017 年的論文當(dāng)中,已經(jīng)把存儲(chǔ)格式改成了偏混存的形式。我們跟谷歌的迭代路線是一樣的,而且我們的存儲(chǔ)格式改的更早,因?yàn)槲覀兏绲挠龅搅擞脩舻膶?shí)際需求。
愛分析:算法和擴(kuò)展性是否存在一定的矛盾,復(fù)雜的算法會(huì)不會(huì)影響其擴(kuò)展性能?
劉奇:算法和擴(kuò)展性沒有什么關(guān)系,算法主要影響執(zhí)行的效率。
比如,如果是列存的話,執(zhí)行效率更高,比如說銀行對(duì)所有賬戶的金額進(jìn)行求和,如果是列存的話會(huì)很簡單,但是行存的話要掃描每一行中的金額數(shù)據(jù),執(zhí)行效率很低,但在下層的計(jì)算層面并不會(huì)有太大的差別。
愛分析:在推到前臺(tái)的時(shí)候,數(shù)據(jù)庫要做哪方面的調(diào)整?
劉奇:要根據(jù)整個(gè)系統(tǒng)的負(fù)載,來決定使用多少并發(fā)度,會(huì)做一些優(yōu)化。
假設(shè)有100 臺(tái)機(jī)器,有這樣一個(gè)數(shù)據(jù)集群,均勻地推到每一臺(tái)機(jī)器上計(jì)算,并發(fā)度很高的情況下,每臺(tái)機(jī)器人可能都很忙,這個(gè)時(shí)候再給它增加任務(wù)是沒有用的,機(jī)器會(huì)崩潰的。
但如果有一個(gè)“聰明”的調(diào)度器,對(duì)指令進(jìn)行控制,在保持高并發(fā)的狀態(tài)下,調(diào)度不同的機(jī)器進(jìn)行不同運(yùn)算,這樣機(jī)器不至于很忙,不過帶來的問題是,會(huì)帶來比較長的延遲。
當(dāng)然,同樣的數(shù)據(jù)可能不一定要運(yùn)用CPU 來運(yùn)算,可以用 GPU 或者 FPGA,這對(duì)調(diào)度器的要求就更高了,按照發(fā)展趨勢(shì)來看,調(diào)度器的能力是衡量一個(gè)數(shù)據(jù)庫性能的重要指標(biāo)。
愛分析:TiDB 是如何實(shí)現(xiàn)實(shí)時(shí)性的?
劉奇:因?yàn)樗旧砭褪且粋€(gè)分布式的結(jié)構(gòu),性能是可以繼續(xù)擴(kuò)展的,前面有多少數(shù)據(jù)的輸入都無所謂。如果現(xiàn)在覺得算的不夠快,通過加機(jī)器就可以實(shí)現(xiàn)計(jì)算。
速度的快慢還跟計(jì)算有關(guān)系,有的計(jì)算是推不到所有的節(jié)點(diǎn)上去的。比如,我要把所有的數(shù)據(jù)拿回來做排序,這就沒有辦法讓所有節(jié)點(diǎn)來做。
這種情況,優(yōu)化器的作用比較重要,它會(huì)識(shí)別哪些計(jì)算需要推到下面做并行運(yùn)算,哪些只要做出決定就可以。
愛分析:MySQL 構(gòu)架,數(shù)據(jù)遷移到 TiDB 能否做到無感遷移?
劉奇:我們從一開始設(shè)計(jì)的時(shí)候就考慮到了這個(gè)問題,針對(duì)MySQL 可以做到無感遷移,如果是 Oracle 或者 DB2 的其它協(xié)議的話,可能涉及到改代碼的問題。
愛分析:面向其它協(xié)議,遷移的周期有多長?
劉奇:這個(gè)還要考慮業(yè)務(wù)的復(fù)雜度,比如,原來的業(yè)務(wù)有10 萬條 SQL,只要都要驗(yàn)證一遍,如果本身業(yè)務(wù)比較復(fù)雜,那就會(huì)比較快。MySQL 協(xié)議這邊,我們很快就可以做 POC。
愛分析:下一步有沒有考慮去支持Oracle 或 DB2 的快速遷移?
劉奇:我們沒有這方面的打算,因?yàn)樾碌臉I(yè)務(wù)已經(jīng)不用這些技術(shù)了。如果考慮這些的話,目的就是切入老項(xiàng)目。在切入老項(xiàng)目時(shí)兼容性存在一個(gè)問題,用戶需要知道新技術(shù)的兼容性到底是多少?我能不能放心的使用新技術(shù)替換?
兼容性不僅是功能的兼容,Bug 也要兼容,真正做到 100% 兼容是很難的,企業(yè)原來的程序員可能也離職了,如果去替換老的業(yè)務(wù),工作量、風(fēng)險(xiǎn)都會(huì)很大。
現(xiàn)階段互聯(lián)網(wǎng)金融、游戲等偏互聯(lián)網(wǎng)行業(yè)是重點(diǎn)行業(yè),適用于數(shù)據(jù)量大、業(yè)務(wù)復(fù)雜性高的場景
愛分析:產(chǎn)品主要針對(duì)哪些行業(yè)的客戶?
劉奇:我們?cè)谏虡I(yè)化的過程中,最重要的是把產(chǎn)品做出來,然后根據(jù)客戶的需求去完善它的功能。
另外,我們的產(chǎn)品是開源的。開源的好處是當(dāng)用戶在使用過程中會(huì)及時(shí)反饋他們的使用體驗(yàn)和遇到的問題,在這個(gè)過程中會(huì)發(fā)現(xiàn)我們的潛在用戶是誰。
我們的第一個(gè)用戶是游戲公司,這其實(shí)是超出了我們的預(yù)計(jì)的,我們認(rèn)為可能是互聯(lián)網(wǎng)優(yōu)先,因?yàn)榛ヂ?lián)網(wǎng)對(duì)新技術(shù)比較激進(jìn)。
游戲行業(yè)也有其特點(diǎn),游戲公司最賺錢的肯定是爆款游戲的運(yùn)營,一天的流水可能就有幾千萬。他們希望自己的基礎(chǔ)設(shè)施是足夠穩(wěn)定、強(qiáng)大的,一旦遇到瓶頸再去停機(jī)改造,那造成的損失就會(huì)很大,因此,他們也希望通過新的技術(shù)來解決問題。
再一個(gè)就是互聯(lián)網(wǎng)以及傳統(tǒng)行業(yè),互聯(lián)網(wǎng)企業(yè)在使用我們的新產(chǎn)品的時(shí)候,表現(xiàn)得還是很保守的,因?yàn)榍懊嬉呀?jīng)有那么多的MySQL 在使用,突然換新的技術(shù)他們會(huì)覺得風(fēng)險(xiǎn)很高。
不過,像互聯(lián)網(wǎng)金融這類企業(yè)對(duì)實(shí)時(shí)性要求還是很高的,要通過實(shí)時(shí)的信息進(jìn)行風(fēng)控管理,以前的方案是無法滿足的,所以會(huì)選擇使用我們的產(chǎn)品。
愛分析:TiDB 的應(yīng)用場景有哪些?
劉奇:我們的數(shù)據(jù)庫通用性比較強(qiáng),一般是面向新的業(yè)務(wù)需求,我們自身并沒有將數(shù)據(jù)庫設(shè)計(jì)成面向某一行業(yè)的產(chǎn)品。
說到我們產(chǎn)品的優(yōu)勢(shì),客戶的數(shù)據(jù)量必須達(dá)到億級(jí)別以上,如果數(shù)據(jù)量比較小,就沒有必要上分布式數(shù)據(jù)庫;另外,就是業(yè)務(wù)的復(fù)雜性要比較高,這樣我們的優(yōu)勢(shì)更加明顯。
愛分析:下一步會(huì)重點(diǎn)側(cè)重哪幾個(gè)行業(yè)?
劉奇:從營收的角度來講,金融應(yīng)該會(huì)是我們重點(diǎn)布局的一個(gè)行業(yè),像物流、醫(yī)療等其他領(lǐng)域數(shù)據(jù)增速也比較快。
團(tuán)隊(duì)主要來自互聯(lián)網(wǎng)公司,銷售人員極少
愛分析:2017 年 PingCAP 的用戶推廣進(jìn)展?
劉奇:我們?cè)?017 年運(yùn)行在生產(chǎn)環(huán)境的用戶達(dá)到 200 個(gè),產(chǎn)品客單價(jià)比較高,付費(fèi)用戶要少一些。
愛分析:TiDB 是一個(gè)開源技術(shù),在提供企業(yè)級(jí)產(chǎn)品時(shí)會(huì)做哪些強(qiáng)化?
劉奇:雖然我們提供一個(gè)開源技術(shù),但還是有部分是閉源的,比如監(jiān)控運(yùn)維組件,備份工具,安全性工具等。
對(duì)于企業(yè)應(yīng)用來說,它必須具備很漂亮的用戶界面、很方面的操作工具,這是我們企業(yè)版提供的方式。
還有一部分,我們叫做Database & Service,我們提供的不僅是一個(gè)數(shù)據(jù)庫,而是一個(gè)數(shù)據(jù)庫平臺(tái),企業(yè)用戶可以申請(qǐng) TiDB 數(shù)據(jù)集群。如果沒有這個(gè)東西,可能就需要管理員手動(dòng)處理,使用體驗(yàn)差別是很大的。
愛分析:TiDB 是如何收費(fèi)的?
劉奇:我們現(xiàn)在有兩方面考慮:一方面可以利用云部署,我們可以看到騰訊云的數(shù)據(jù)庫入口,這個(gè)商業(yè)模式比較簡單,與云上的其它產(chǎn)品一樣,按照租賃的方式進(jìn)行收費(fèi)。
另一方面,可以買我們的subscription,也可以買我們的 license,按照節(jié)點(diǎn)數(shù)來計(jì)算。
愛分析:公司的團(tuán)隊(duì)規(guī)模?
劉奇:現(xiàn)在公司大概100 個(gè)人,研發(fā)占比比較高,有 82 個(gè)。銷售人員只有 1 個(gè),銷售比較少是因?yàn)橛脩舳际亲约赫疫^來的,我們?cè)谶@方面沒有太大的投入。
我們對(duì)研發(fā)的要求還是很高的,包括研發(fā)人員對(duì)外面的支持、響應(yīng)的速度等。雖然看上去不會(huì)像Oracle 那么夸張,但有很多外部公司在給我們做貢獻(xiàn)。
比如,調(diào)度器方面的代碼很多是摩拜貢獻(xiàn)的,很多場景下的優(yōu)化是今日頭條貢獻(xiàn)的,包括韓國三星研究院等,還有很多人在幫我們做測(cè)試,這也體現(xiàn)了開源技術(shù)的一個(gè)好處。
愛分析:研發(fā)人員會(huì)承擔(dān)一部分售前的工作嗎?
劉奇:在17 年的時(shí)候還存在一些研發(fā)人員做售前工作的情況,但 18 年我們會(huì)做出一些調(diào)整,這也是我們一個(gè)很重要的任務(wù)。
人員結(jié)構(gòu)的建設(shè)要形成一個(gè)完整的體系,售前、實(shí)施、研發(fā)各司其職,根據(jù)不同階段的問題安排不同的人去解決。
愛分析:銷售人員比較少的情況下,是不是對(duì)社區(qū)的運(yùn)營提出更高的要求?
劉奇:我認(rèn)為研發(fā)人員比較多,跟社區(qū)的交流就會(huì)比較快。社區(qū)中最主要的用戶是開發(fā)者,與開發(fā)者的交流肯定是研發(fā)人員更加順暢,銷售人員沒法替代這個(gè)角色。比如,用戶提出有部分代碼存在問題,研發(fā)的響應(yīng)速度會(huì)很快。
像今日頭條、摩拜、同程這些規(guī)模比較大的用戶,都是因?yàn)榇嬖谕袋c(diǎn)主動(dòng)聯(lián)系到我們,不需要銷售去做額外的工作。
當(dāng)然,社區(qū)中還存在許多規(guī)模比較小的用戶,小的用戶雖然沒有那么大的付費(fèi)能力,但對(duì)社區(qū)來說也是有直接作用的。
他們會(huì)用自己的場景進(jìn)行測(cè)試,發(fā)現(xiàn)很多我們從來沒有遇見過的問題,他們所提供的這些信息對(duì)我們來說也是十分重要的,因此我們會(huì)花費(fèi)比較大的力氣來運(yùn)營社區(qū)。
愛分析:PingCAP 的團(tuán)隊(duì)背景以互聯(lián)網(wǎng)居多?
劉奇:對(duì),互聯(lián)網(wǎng)出身的多一些,都是規(guī)模比較大的互聯(lián)網(wǎng)公司,都體會(huì)過數(shù)據(jù)量大了之后帶來的痛苦。
另外,還有來自傳統(tǒng)行業(yè)的,售前有來自金融行業(yè)的,他對(duì)金融行業(yè)的使用場景更加清楚一些。
愛分析:切入傳統(tǒng)行業(yè)的話,是不是對(duì)人員結(jié)構(gòu)的要求有變化?
劉奇:目前我們還不是這么想的,我們希望通過產(chǎn)品就能夠直接拿下客戶,能夠體現(xiàn)我們產(chǎn)品的優(yōu)勢(shì)。如果是用誰的數(shù)據(jù)庫都一樣的客戶,我們是不會(huì)去爭取的,這也不是我們的強(qiáng)項(xiàng)。
愛分析:產(chǎn)品的研發(fā)和社區(qū)的維護(hù),精力如何平衡?
劉奇:我們肯定會(huì)先做好一個(gè)基礎(chǔ)版,才會(huì)在社區(qū)中推廣,當(dāng)遇到Bug 的時(shí)候一定要去修復(fù),不然會(huì)影響到很多人的使用,兩者共同推進(jìn),并不沖突。
內(nèi)部研發(fā)方面,我們會(huì)快速的開發(fā)很多新的功能,這些不會(huì)馬上就應(yīng)用到穩(wěn)定版本,而是先在社區(qū)發(fā)布一個(gè)Beta 版本,通過用戶測(cè)試發(fā)現(xiàn) Bug,我們來進(jìn)行修復(fù),在不斷的溝通之后,我們才會(huì)發(fā)布穩(wěn)定版。
在這個(gè)過程當(dāng)中,我們需要通過社區(qū)讓用戶不斷的進(jìn)行測(cè)試來跟我們反饋。因?yàn)楫a(chǎn)品行不行并不是我們自己說了算的,而是用戶來判斷的。
TP 和 AP 融合是未來趨勢(shì),數(shù)據(jù)庫市場未來會(huì)更加多樣化
愛分析:CAP 原理中的一致性和可用性存在一定的矛盾,怎么進(jìn)行優(yōu)化?
劉奇:我們?cè)谖磥頃?huì)提供一個(gè)選項(xiàng),用戶可以根據(jù)自己的需求自己選擇,高一致性或者高可用性。比如銀行的數(shù)據(jù)就要求高一致性,而互聯(lián)網(wǎng)應(yīng)用就更側(cè)重高可用性,我們會(huì)都提供給用戶,讓用戶來選。
愛分析:NewSQL 技術(shù)與之前的技術(shù)有什么不同?
劉奇:歷史上最開始應(yīng)用的是SQL,后來為什么會(huì)出現(xiàn) NoSQL,是因?yàn)?SQL 不能擴(kuò)展,雖然 NoSQL 具備了擴(kuò)展的能力,但表達(dá)力比較差,可能還不支持事務(wù)處理,不具備 SQL 的傳統(tǒng)優(yōu)勢(shì)。
NewSQL 就相當(dāng)于同時(shí)具備了兩個(gè)優(yōu)勢(shì),既能很好的擴(kuò)展,又能具備 SQL 的事務(wù)處理能力和表達(dá)力。
愛分析:下一步TP 和 AP 是有融合的趨勢(shì)嗎?
劉奇:我們認(rèn)為是這樣的,用戶是不關(guān)心是TP 還是 AP 的,解決問題就是硬道理,也不管是線上還是線下,能實(shí)時(shí)實(shí)現(xiàn)我肯定不愿意等一天。
TP 和 AP 分開這是歷史原因造成的,在數(shù)據(jù)庫剛誕生的時(shí)候并沒有去區(qū)分?,F(xiàn)在技術(shù)能做得到,肯定還是希望融合在一塊。數(shù)據(jù)分析比較復(fù)雜的情況可能還會(huì)存在單獨(dú)的 AP,但我們的產(chǎn)品還在快速的迭代,最后還是要看誰的性能更勝一籌。
愛分析:分布式數(shù)據(jù)庫平臺(tái)領(lǐng)域?qū)頃?huì)不會(huì)產(chǎn)生另一個(gè)Oracle?
劉奇:因?yàn)闅v史原因,短時(shí)間內(nèi)Oracle 的地位是不可替代的,但新的數(shù)據(jù)庫構(gòu)架興起的也很快,現(xiàn)在 Oracle 遇到了前所未有的挑戰(zhàn),我認(rèn)為在未來兩年,將會(huì)有 20% 的傳統(tǒng)數(shù)據(jù)庫被新的數(shù)據(jù)庫取代。
看現(xiàn)在我們的用戶增速,這個(gè)趨勢(shì)還是相當(dāng)明顯的。
愛分析:未來市場的格局會(huì)發(fā)生哪些變化?
劉奇:我覺得市場會(huì)變得更加多樣化。
首先,現(xiàn)在的需求非常碎片化,傳統(tǒng)數(shù)據(jù)庫不能很好的表達(dá),例如對(duì)Streaming 要求越來越高。
關(guān)系型數(shù)據(jù)庫的優(yōu)勢(shì)是通用性比較強(qiáng),也比較均衡。但有些場景用現(xiàn)在的數(shù)據(jù)庫框架是很難適應(yīng)的,肯定不會(huì)比專門的設(shè)計(jì)的數(shù)據(jù)庫用起來順暢,如圖數(shù)據(jù)庫等。
從發(fā)展趨勢(shì)來看,當(dāng)NoSQL 出來的時(shí)候,大家會(huì)考慮它能替代什么樣的場景,后來發(fā)現(xiàn) NoSQL 還是存在很多約束的。NewSQL 的出現(xiàn)確實(shí)會(huì)改變市場格局,應(yīng)該以后會(huì)有兩三家比較大體量的公司吃掉大部分市場,但小公司依然存在。
愛分析:開源技術(shù)的發(fā)展會(huì)不會(huì)影響到數(shù)據(jù)庫公司的業(yè)務(wù)?
劉奇:其實(shí)開源技術(shù)已經(jīng)存在很長時(shí)間了,像MySQL 已經(jīng)有二十幾年的歷史,但企業(yè)級(jí)應(yīng)用畢竟不是那么簡單,還存在很多問題需要團(tuán)隊(duì)去解決。
未來不會(huì)有完全免費(fèi)的數(shù)據(jù)庫,就算是開源的也是要收費(fèi)的。
愛分析:互聯(lián)網(wǎng)公司一般會(huì)自己開發(fā)基礎(chǔ)設(shè)施,會(huì)不會(huì)對(duì)PingCAP 造成影響?
劉奇:這個(gè)事情要分國內(nèi)和國外來看,國內(nèi)的公司喜歡建設(shè)私有云,國外差別就比較大,很多國外公司都把自己的私有云給拆掉了,原因也很簡單,自己部署私有云的效率并不如直接使用成熟的公有云。
現(xiàn)在很多互聯(lián)網(wǎng)公司不想再像過去那樣被Oracle 這樣的公司 Lock in,我既要用你的數(shù)據(jù)庫,又必須具備一定的掌控力。因?yàn)榛ヂ?lián)網(wǎng)公司成長是很快的,需求的變化也更加明顯,他們希望對(duì)數(shù)據(jù)庫具有一定的理解力和掌控力,以方便互聯(lián)網(wǎng)企業(yè)修改數(shù)據(jù)代碼,滿足自身定制化的需求。
愛分析:云廠商最后會(huì)不會(huì)成為數(shù)據(jù)庫企業(yè)的競爭對(duì)手?
劉奇:數(shù)據(jù)庫跟云的關(guān)系,有點(diǎn)像APP 和 APP Store 的關(guān)系。云廠商可能也會(huì)做數(shù)據(jù)庫,但更多的應(yīng)該是一種合作關(guān)系。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 為什么年輕人不愛換手機(jī)了
- 柔宇科技未履行金額近億元被曝已6個(gè)月發(fā)不出工資
- 柔宇科技被曝已6個(gè)月發(fā)不出工資 公司回應(yīng)欠薪有補(bǔ)償方案
- 第六座“綠動(dòng)未來”環(huán)保公益圖書館落地貴州山區(qū)小學(xué)
- 窺見“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機(jī)打造全新一代屏幕壓感
- 清潔家電新老玩家市場定位清晰,攜手共進(jìn),核心技術(shù)決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達(dá)成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。