從一組社區調研看數據庫選型標準
近期留意到某社區(www.talkwithtrend.com)的一篇調查,關于中小銀行非核心交易系統國產數據庫選型評估框架。調查梳理一些銀行選型維度,并針對國內排名靠前的國產數據庫,由社區用戶選擇各維度排名前幾名。個人覺得,這篇調查還是很有指導意義的。當前很多用戶正在進行數據庫選型,不同企業的選型標準也有所差異,如何進行科學的選擇,對于甲方很有意義;同時也可以指導乙方企業發展。下面就是針對這篇調查,自己的一點觀感。詳情參考:www.talkwithtrend.com/Article/267563
1、選型評估對比維度
(1)企業實力
企業實力評估方面,主要是從人、財、智三個方面。
- 人的方面
主要是在研發、服務及合作伙伴數量,其對應于產品研發能力、服務質量保證及上下游生態。從研發角度來看,目前國內企業大部分還處于數十人的規模,單一產品超百人的屈指可數。這主要受到人力成本過高及人才培養供給不足的限制。從用戶來講,是希望從這個維度考察產品技術兜底的能力。但這一維度對很多中小型企業來講,是不太有利的,這里更希望在考察時不僅從“量”也要從“質”的角度去考慮。從服務角度來看,一個產品能否自用戶處使用的好,不僅僅取決于產品本身,還取決于服務質量。由于國內數據庫廠商發展相對較短及在生態上的不足,目前服務還多是以原廠為主,因此充足的服務人員對用戶來說很重要。甚至在某些情況下,是會成為有限考量因素,特別是對于傳統企業,更希望得到貼心的管家式服務。第三個的合作伙伴,一方面是產品服務合作來看,正如前面所談,這方面還都比較薄弱;但更多是從上下游生態來看。數據庫產品不是孤立的,是需要跟上下游產品聯動起來。從近幾年來看,國內廠商正開始重視這方面的建設,特別是幾個老牌企業,優勢明顯。
- 財的方面
是從企業資產規模來說。數據庫作為一款基礎軟件,是需要很大投入的。這方面部分大廠或云廠商是很有優勢的,借助內部輸血可以長期持續發展。對于初創型公司,相對壓力會大些,一般是通過融資方式解決,近兩年也看到不少好的數據庫項目拿到了投資、甚至走向海外。從用戶來講,最為關心的是可持續性,因此很關注這一指標。
- 智的方面
主要是專利和論文及代碼自主可控方面。針對前者,衡量企業的技術能力,可從專利、論文、軟著等方面來體現。雖然很難通過量化的指標直接反饋,但更為重視技術輸出的廠商無疑技術應該是不差的。這方面國內的企業也開始紛紛重視,特別是云廠商開始頻繁參加如OLDB\SIGMOD\ICDE大會,可見一般。在國內第三方的墨天輪社區,也將上述指標作為流行度評分的參與因素之一。針對后者,代碼自主可控率,相對來說不太好衡量,特別是一些基于開源增強的產品。國內是有代碼自主可控評測,但參與的廠商還很少。
(2)市場認可度
從市場認可度來看,調研從同業調研和同業案例兩個角度去考慮。這里感覺還可以增加如三方評估等角度。
- 同業調研
金融行業有其鮮明的行業屬性,通過同行業其他用戶的選型,對自己來說參考意義很大。因此,很多金融用戶將同業調研作為重要的評估參考。筆者之前在某大行工作期間,就接待過多次同行上門交流,也參與線下閉門的金融用戶會議。往往在這些渠道,用戶可以得到很多“干貨”。
- 同業案例
同行業案例來說,往往具有更加實際參考意義,甚至有些實施方法都可以直接拿來復用。因此,用戶會很關注同業案例,特別是在頭部用戶的案例。正因為如此,現在很多廠商也開始重視與 ISV 等的合作,正是希望可以規模化復制在某領域的成功實踐經驗。
- 三方評估
除了參考同業調研及案例外,這里也建議可補充些其他三方的評估。例如國際上比較權威的評估機構,如 Gartner、Forrester、IDC等;中立的第三方評估網站,如 db-engines.com、國內的墨天輪社區等。上述評估雖然不如前者那么直接,但往往也可以對被調研公司產品在行業內橫向對比情況做一參考。
(3)生態環境
從生態環境來看,包括的內容比較繁雜,這里既有上下游生態鏈情況,也有企業自身在培訓認證及文檔等方面,還有在上下游數據打通等。
- 生態工具
在生態工具層面,包括從數據庫設計、研發、測試、管理、備份、優化等全方位的支持。這部分國產數據庫產品存在一定劣勢,之前國外數據庫及開源產品構建了較為完善的生態,培養了一大批上下游生態企業。這里有條捷徑,就是通過兼容性能力復用其他產品的生態。因此,很多國產數據庫都提供了對MySQL、PostgreSQL、Oracle的兼容。這也成為很多企業選擇的參考因素之一。此外,國內很多數據庫生態廠商,也紛紛加大了支持國內數據庫力度。
- 國產化適配
受到地緣政治等多因素影響,為了保證軟件供應鏈安全,國內很多企業都在完成或正在計劃完成信創改造工作。其對應IT全技術棧需采用國產產品。作為基礎軟件之一的數據庫,則需要對接各種國產軟硬件平臺。從用戶角度來講,國產化適配是“剛性”需求,也是對選擇產品的重要考慮因素。目前國內很多數據庫企業也都紛紛加大了適配力度,加速在信創改造中落地。
- 文檔
廠商交付給用戶的不僅包括產品本身,還需包括相關文檔。好的文檔,是幫助用戶使用好產品的有力抓手。之前這方面國內廠商做的不是很好,經常用戶面臨出現問題后無從下手的窘境。隨著國產數據庫在更多企業中落地,對于文檔的要求愈發強烈。這個感覺這方面,國內廠商還有很長的路要走,可以參考如 Oracle 等國外成熟產品的實踐做法。建議用戶在考察產品之初,就可以先從文檔入手,可以說“文檔是產品的門面”。
- 培訓認證
培訓認證體系,是快速積累人才的捷徑,特別是在產品還不是很完善的情況,如何用好產品,發揮產品的最大價值的同時,避免很多潛在風險是很重要的。目前國內 TOP 的廠商都紛紛推出了自己的認證體系,甚至有的將這一工作都做到高校。回想其當年考 Oracle 認證的盛況,希望國產數據庫也能有這樣的一天。好的培訓認證體系,會幫助用戶快速形成自主維護能力。
- 社區
生態是需要有“人”來參與的,社區則是提供了人與人交流的舞臺。好的社區可以大大加速產品的迭代發展,幫助產品快速成熟發展。國內很多廠商通過構建自有社區或借助第三方社區,來加快生態建設速度。這方面國內廠商可以多跟國外產品,特別是開源產品學習。在建設上更可細分為開發者、使用者、行業用戶等細分社區,按各自特點進行建設。在用戶的選型上,具有成熟社區的產品,無疑會減低其引入的風險與成本。
- 數據安全
數據安全,正受到越來越多企業的重視,國家也出臺了一系列法律法規來規范數據的使用。作為數據的載體,數據庫的安全首當其沖。這其中包括數據傳輸、數據存儲、數據使用、數據歸檔等一系列安全相關能力。這些也是用戶考察的要素之一。
(4)其他維度
除了上述評估維度外,還包括以下一些維度。
- 架構先進性
很多用戶領導會比較關心先進性問題,個人覺得這里存在一個誤區。經常有用戶認為某種架構比另外一種架構要先進,如常見的“分布式架構要優于單體式架構”。造成這一現象的原因,是被某些宣傳輿論所誘導所致。其實,每種架構都有其優缺點,不存在完美架構,這里用戶更多的是現實業務需求及未來技術演進,而非盲目追新。
- 語法兼容性
兼容性,如前面所談,是可以降低用戶在開發、管理上的成本的,也是重要考慮因素。
- 軟件成本及維護成本
成本是個繞不開的話題,這里不單指采購成本,還包括維護成本、機會成本等,需要綜合考慮。有的產品,可能商務采購是比較便宜的,但后續成本反而較高。但后面談到的成本很難評估,用戶能做的只能是做些事前考慮,簡單分析,但無法完全量化。
- 性能
性能,個人覺得是最不重要的。目前廠商能提供的都為標準測試的結果,如TPC-C、TPC-H等。這些標準測試是不能代表用戶場景,用戶在實際使用中的性能無法以此為依據進行評估。比較可行的做法,是用戶采用自己的業務做性能測試,還能做下參考。外部的評測數據,簡單看看即可。
2、社區問卷調查情況
此次問卷調查是 twt 社區,針對國產數據庫做的調查。主要挑選了 17 款占有率相對較高的國產數據庫,由各位企業同行進行推薦評選,初選出符合要求的數據庫。通過總共 13 個維度的初選,集思廣益,最終根據企業用戶的大眾意見,評選出在中小金融行業國產數據庫選型上心儀之品。本次投票由企業IT應用趨勢項目創新聯盟數據庫自主可控項目課題組委會主導、多名行業專家協助組織。下文先就此次初選出的國產數據庫,做些情況收集;然后我們再看看從“用戶”視角看看,誰才是優選之作。
(1)國產數據庫概況
下面這些數據來自廠商官網、墨天輪、企查查等公開信息,部分數據未收集到會有空缺。此外,有些數據口徑不完全一致,如資本規模存在非獨立數據庫廠商資產規模很大。
(2)社區問卷情況匯總
根據社區問卷結果,做了個簡圖,可通過顏色深淺判斷用戶選擇傾向。特別說明,下述結果僅限于此次調研結果,不代表廠商及產品實力,僅供參考。