主流NoSQL數(shù)據(jù)庫評測之Tokyo Cabinet
本篇要評測的NoSQL產(chǎn)品是Tokyo Cabinet和Tokyo Tyrant,Tokyo Cabinet是一個性能優(yōu)秀的數(shù)據(jù)存儲引擎,而Tokyo Tyrant則提供了訪問Tokyo Cabinet數(shù)據(jù)的網(wǎng)絡(luò)接口。這是一個很成熟的產(chǎn)品,在國內(nèi)外也有眾多的成功案例。
一、Tokyo Cabinet和Tokyo Tyrant簡介
Tokyo Cabinet(簡稱TC)和Tokyo Tyrant(簡稱TT),顧名思義,是源自日本的開源項目。由FAL Labs維護,主要的開發(fā)人員是Mikio Hirabayashi。最早應(yīng)用在日本最大的SNS網(wǎng)站mixi.jp上成功后而聲名鵲起。
TC是一個用C寫的數(shù)據(jù)存儲引擎,以key-value的方式存儲數(shù)據(jù),支持Hash、B+ tree、Hash Table等多種數(shù)據(jù)結(jié)構(gòu)。同時提供了C、 Perl、 Ruby、Java和Lua等多種語言的API支持,但是如果通過網(wǎng)絡(luò)來訪問,就需要用TT。TT同樣是用C寫的,支持從網(wǎng)絡(luò)端高并發(fā)、多線程的訪問TC。另外TC/TT支持master/slave架構(gòu),可以通過配置實現(xiàn)高可用性,這也是很不錯的一個特性。
TC因為支持靈活的數(shù)據(jù)結(jié)構(gòu)而倍受歡迎,特別是Hash Table類型,很像傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,只是每條存儲記錄的列是自由定義的,可以通過列作為條件來查詢,十分方便。這是很多key-value結(jié)構(gòu)的NoSQL產(chǎn)品所不具備的特性。當然,Hash Table類型和Hash、B+ tree相比存取效率會低一些,任何事物都是有兩面性的,在帶來高度靈活度的同時,必然要犧牲部分的效率。
TC/TT是一個久經(jīng)考驗的很穩(wěn)定的產(chǎn)品,在千萬及以下數(shù)據(jù)量級別表現(xiàn)出色。但是開發(fā)者由于種種原因,已經(jīng)很長時間沒有更新版本了,而是推出了對應(yīng)升級產(chǎn)品,叫做Kyoto Cabinet和Kyoto Tycoon,這也給TC/TT的前景帶來了不明朗的因素,很明顯作者是鼓勵人們使用升級的產(chǎn)品,但是由于新產(chǎn)品沒有更多的成功案例,在業(yè)界的影響力反而不如TC/TT,因此在現(xiàn)階段,TC/TT仍然是一個不錯的NoSQL選擇。
二、測試說明
1、測試環(huán)境
TC/TT部署在一臺PC 服務(wù)器上,配置如下:
CPU為Xeon 2.80GHz *4
內(nèi)存為4G
硬盤為一塊400G SATA盤
操作系統(tǒng)為64位CentOS 5.3版本
2、測試方法
這里仍然采用第三方實現(xiàn)的PHP客戶端進行測試,網(wǎng)址為http://pecl.php.net/package/tokyo_tyrant,這是一個標準的PHP擴展程序,可以編譯到PHP運行環(huán)境中。要說明的是,這個PHP客戶端實現(xiàn)的是TT接口,肯定比使TT自帶的tcrtest效率要低一些,但是我們的測試要盡量模擬實際的生產(chǎn)環(huán)境,所以這里使用了第三方的PHP客戶端。
為了不對測試服務(wù)器產(chǎn)生額外的影響,測試客戶端部署在另外一臺獨立的服務(wù)器上,運行的PHP的版本是5.3.5,web server是Nginx 0.8.54,通過fastcgi的方式調(diào)用PHP服務(wù)。使用apache ab工具實現(xiàn)多個請求和并發(fā)操作。
為了更全面的反應(yīng)TC/TT的性能,我對B+ tree和Hash Table兩種數(shù)據(jù)庫類型分別進行了測試,就使用上文提到的ttserver示例語句來建立測試數(shù)據(jù)庫,每個類型的測試又分為兩個步驟,首先是寫操作,通過500個請求,每個請求寫入10000條記錄,并發(fā)度為2來共寫入500萬條數(shù)據(jù),數(shù)據(jù)的key為數(shù)字1到5000000,value大小為100個字節(jié)。然后是讀操作,也是用500個請求,每個請求隨機根據(jù)key值讀出10000條記錄,并發(fā)度為10共讀出500萬條記錄,評測的重點是寫入和讀出數(shù)據(jù)的時間,以及在此過程中服務(wù)器的資源使用情況。
三、安裝和使用
1、下載相關(guān)軟件的最新版本(TC、TT和TC的lua擴展):
- [root@localhost tctt]# wget http://fallabs.com/tokyocabinet/tokyocabinet-1.4.47.tar.gz
- [root@localhost tctt]# wget http://fallabs.com/tokyotyrant/tokyotyrant-1.1.41.tar.gz
- [root@localhost tctt]# wget http://fallabs.com/tokyocabinet/luapkg/tokyocabinet-lua-1.9.tar.gz
注意這里的lua擴展是可選的,如果不需要使用lua接口,可以不必安裝。
2、安裝lua腳本,注意這里不能通過yum的方式安裝,否則后面裝tt時會提示找不到lua.h文件:
- wget http://www.lua.org/ftp/lua-5.1.4.tar.gz
- make linux
- make install
安裝過程中一般會報錯如下:
- luaconf.h:275:31: error: readline/readline.h: No such file or directory
- luaconf.h:276:30: error: readline/history.h: No such file or directory
通過yum安裝readline-devel即可:
- yum install readline-devel
3、安裝TC、TT和TC的lua擴展,注意的是如果要使用LUA接口,那么編譯TT的時候要加--enable-lua參數(shù):
- [root@localhost tctt]# tar zxvf tokyocabinet-1.4.47.tar.gz
- [root@localhost tctt]# cd tokyocabinet-1.4.47
- [root@localhost tokyocabinet-1.4.47]# ./configure
- [root@localhost tokyocabinet-1.4.47]# make
- [root@localhost tokyocabinet-1.4.47]# make install
- [root@localhost tctt]# tar zxvf tokyocabinet-lua-1.9.tar.gz
- [root@localhost tokyocabinet-lua-1.9]# make
- [root@localhost tokyocabinet-lua-1.9]# make install
- [root@localhost tctt]# tar zxvf tokyotyrant-1.1.41.tar.gz
- [root@localhost tctt]# cd tokyotyrant-1.1.41
- [root@localhost tokyotyrant-1.1.41]# ./configure --enable-lua
- [root@localhost tokyotyrant-1.1.41]# make
- [root@localhost tokyotyrant-1.1.41]# make install
至此就安裝完成了,整個過程很簡單,當然安裝過程可能需要一些其他的程序包,可以根據(jù)提示進行安裝即可。
TT提供了很多命令行工具來管理數(shù)據(jù)庫,比較常用的兩個是ttserver和tcrmgr。
Ttserver的用法如下:
- ttserver [-host name] [-port num] [-thnum num] [-tout num]
- [-dmn] [-pid path] [-kl] [-log path] [-ld|-le] [-ulog path]
- [-ulim num] [-uas] [-sid num] [-mhost name] [-mport num]
- [-rts path] [-rcc] [-skel name] [-mul num] [-ext path]
- [-extpc name period] [-mask expr] [-unmask expr] [dbname]
各個參數(shù)的說明可查看官方文檔,這里就不一一列舉了。我們可以建立一個hash table類型和一個B+ tree類型的數(shù)據(jù)庫:
- ttserver -host 192.168.0.35 -port 11301 -thnum 8 -dmn
- -pid /home/tc/test_data/test_data_b.pid
- -log /home/tc/test_data/test_data_b.log -le
- -ulog /home/tc/test_data/ -ulim 128m -sid 1 -rts /home/tc/test_data/test_data_b.rts /home/tc/test_data/test_data.tcb
- ttserver -host 192.168.0.35 -port 11302 -thnum 8 -dmn
- -pid /home/tc/test_data/test_data_t.pid
- -log /home/tc/test_data/test_data_t.log -le
- -ulog /home/tc/test_data/ -ulim 128m -sid 1 -rts /home/tc/test_data/test_data_t.rts /home/tc/test_data/test_data.tct
注意最后一個參數(shù)的擴展名tcb和tct決定了數(shù)據(jù)庫的類型分別是B+ tree和table。
通過tcrmgr命令行工具可以管理遠程數(shù)據(jù)庫,比如我們要查看key為1的記錄可以這樣操作:
- [root@localhost tc]# tcrmgr get -port 11301 192.168.0.35 1
要了解更詳細的信息,讀者可以參看官方文檔。
#p#
四、測試結(jié)果
1、B+tree類型寫操作
成功寫入500萬條記錄,共耗時739秒,平均每秒寫入數(shù)據(jù)6766筆。數(shù)據(jù)文件大小137M。寫入過程中,服務(wù)器內(nèi)存、CPU和磁盤等資源使用情況如下圖所示:
可見,CPU使用率平穩(wěn),Idle值穩(wěn)定在73到83之間,wait值穩(wěn)定在7到12之間。內(nèi)存分配上的變化較大,主要用來緩存數(shù)據(jù),cache部分上升了1.1G,但是沒有交換區(qū)到內(nèi)存的換入換出。磁盤IO表現(xiàn)有周期性的上下波動,估計和TC的實現(xiàn)機制有關(guān),數(shù)據(jù)先寫入內(nèi)存緩沖區(qū),然后定期的刷新到磁盤。
2、B+tree類型讀操作
成功讀出500萬條記錄,共耗時1171秒,平均每秒讀出數(shù)據(jù)4270筆。
讀數(shù)據(jù)過程中沒有發(fā)生磁盤IO。CPU較繁忙,Idle值穩(wěn)定在38左右,等待CPU資源的進程一直在1到6個之間。內(nèi)存表現(xiàn)平穩(wěn)沒有波動。
3、Hash Table類型寫操作
成功寫入445萬條記錄,寫入失敗55萬條記錄,共耗時1560秒,平均每秒寫入數(shù)據(jù)2853筆。數(shù)據(jù)文件大小538M。寫入過程中,服務(wù)器內(nèi)存、CPU和磁盤等資源使用情況如下圖所示:
CPU使用率較平穩(wěn),Idle值穩(wěn)定在60到80之間,wait值最高在50左右,穩(wěn)定在20到40之間。內(nèi)存cache部分上升了0.7G用于緩存數(shù)據(jù)。磁盤IO表現(xiàn)有呈階梯狀的上升,最后達到100%,導致無法成功寫入數(shù)據(jù)。
4、Hash Table類型讀操作
成功讀出500萬條記錄,共耗時175秒,平均每秒讀出數(shù)據(jù)28571筆。
讀數(shù)據(jù)過程中沒有發(fā)生磁盤IO。CPU較繁忙,Idle值穩(wěn)定在37到41之間,等待CPU資源的進程一直在1到9個之間。內(nèi)存表現(xiàn)平穩(wěn)沒有波動。
五、總結(jié)
通過以上測試結(jié)果可以說明,TC/TT寫入的數(shù)據(jù)的時候,先緩沖到內(nèi)存中,然后通過一定的機制寫入磁盤,這也是寫的效率較高的原因,但是由此帶來了周期性的磁盤繁忙,也可能有丟失數(shù)據(jù)的風險。寫入的數(shù)據(jù)完全緩存到了文件系統(tǒng)中,所以cache部分占用的內(nèi)存大量增加,這也是讀取數(shù)據(jù)的時候沒有發(fā)生磁盤IO的原因。B+ tree類型寫入性能十分優(yōu)異,令人驚訝的是讀出的速度反而慢于寫入的速度。Hash Table類型寫入性能一般,但讀取性能良好??傮w上來說TC/TT在非海量數(shù)據(jù)的情況下表現(xiàn)不錯,服務(wù)器資源占用穩(wěn)定,讀寫效率較高。
【編輯推薦】
- Mongodb源碼分析之Mongos分析
- Mongodb源碼分析--內(nèi)存文件映射(MMAP)
- 走進MongoDB的世界 展開MongoDB的學習之旅
- 淺析Mongodb源碼之游標Cursor
- 野心勃勃的NoSQL新貴 MongoDB應(yīng)用實戰(zhàn)