OpenStack中虛擬機的監控
本文涉及的程序代碼均可以從我的github上下載, 并且持續更新代碼
虛擬化使用kvm,使用libvirt作為C API
基本思想:host負責運行程序,采集數據,額外一臺服務器作為server收集每臺host的數據進行分析
程序介紹:
首先我們需要打開一個和hypervisor的連接,需要一個virConnectPtr的指針
virConnectOpenReadOnly(char *) 返回的就是這麼一個指針。初始化程序例如:
void conn_init(char *ip, virConnectPtr *conn) { *conn = NULL; /* the hypervisor connection */ char *p; p = (char *)malloc(35*sizeof(char)); *conn = virConnectOpenReadOnly(p); free(p); if (*conn == NULL) { fprintf(stderr, "Failed to connect to hypervisor\n"); } }
第二個參數是一個指向virConnectPtr變量的指針,這裡的p指向的是類似“qemu+ssh://10.0.0.1/system”的字符串,10.0.0.1是你的host ip
關閉連接的函數
void conn_close(virConnectPtr *conn) { if (*conn != NULL) virConnectClose(*conn); }
現在我們有了一個指向host的hypervisor的連接,我們可以用他來獲得host上跑的虛擬機的情況
void list_id_domain(virConnectPtr conn) { int ids[10]; int maxids=10; int num, i; num = virConnectListDomains(conn, ids, maxids); for(i = 0;i < num;i++) { printf("%d\n",ids[i]); } }
這個函數使用上面得到的conn這個指針,列出host上跑的實例的id號
有了id號我們就可以獲取每個實例的詳細信息,假設我有一個id為7的虛擬機實例:
virDomainPtr dom = NULL; dom = virDomainLookupByID(conn, 7);
dom這個變量就是以后我們要一直用到的,釋放函數:
virDomainFree(dom);
cpu監控程序:
void list_info_domain(virDomainPtr domain) { virDomainInfo info; int interval = 2; struct timeval startTime; struct timeval endTime; int realTime; int cpuTime; double cpuUsage; virDomainGetInfo(domain, &info); unsigned long long startCpuTime = info.cpuTime; if (gettimeofday(&startTime, NULL) == -1) { printf("Failed to get start time\n"); } sleep(interval); virDomainGetInfo(domain, &info); unsigned long long endCpuTime = info.cpuTime; if (gettimeofday(&endTime, NULL) == -1) { printf("Failed to get end time\n"); } cpuTime = (endCpuTime - startCpuTime)/1000; realTime = 1000000 * (endTime.tv_sec - startTime.tv_sec) + (endTime.tv_usec - startTime.tv_usec); cpuUsage = cpuTime / (double)(realTime); printf("\t\tstate is %d\n", info.state); printf("\t\tvCPU is %d\n", info.nrVirtCpu); printf("\t\tMAXmemory is %ld\n", info.maxMem/1024); printf("\t\tmemory is %ld\n", info.memory/1024); printf("\t\tcpuUsage is %.2f%\n", cpuUsage*100); }
解釋一下程序,首先virDomainGetInfo函數,傳入剛才我們得到的domain,另外一個參數是要返回的virDomainInfo的結構體變量,其中包含了cpu個數,分配的時間,和分配的mem信息。我們分別取了間隔為2妙的info信息,使用裡面的info.cpuTime運行時間,把后一次減去前一次,然后再除以實際的gettimeofday函數得到host的cpu運行時間,得到一個近似的百分比,反應的是此虛擬機實例的cpu使用情況在整個host的cpu使用情況中的百分比。
磁盤監控:
void list_disk_domain(virDomainPtr domain) { virDomainBlockStatsStruct stats; size_t size; const char *disk = "vda"; size = sizeof(stats); int interval = 2; virDomainBlockStats(domain, disk, &stats, size); long long start_rd_bytes = stats.rd_bytes; long long start_wr_bytes = stats.wr_bytes; sleep(interval); virDomainBlockStats(domain, disk, &stats, size); long long end_rd_bytes = stats.rd_bytes; long long end_wr_bytes = stats.wr_bytes; long rd_bytes = end_rd_bytes - start_rd_bytes; long wr_bytes = end_wr_bytes - start_wr_bytes; int rd_usage = rd_bytes/interval; int wr_usage= wr_bytes/interval; // printf("%s:\n", virDomainGetName(domain)); printf("\t\tread: %dbytes/s\n", rd_usage); printf("\t\twrite: %dbytes/s\n", wr_usage); printf("\t\trd_req: %lld\n", stats.rd_req); printf("\t\trd_bytes: %lld\n", stats.rd_bytes); printf("\t\twr_req: %lld\n", stats.wr_req); printf("\t\twr_bytes: %lld\n", stats.wr_bytes); }
磁盤使用情況的方法和cpu類似,這裡用到的是virDomainBlockStats(domain, disk, &stats, size)這個函數,disk指向的字符串這裡為“vda”,實際使用甚麼你要根據xml裡面的信息
網絡部份這裡我們要用到libvirt中的Network Filters
openstack實例的libvirt.xml在nova.conf中定義的實例目錄下,里面有
... <interface type='bridge'> <source bridge='br100'/> <mac address='02:16:3e:23:f3:7d'/> <model type='virtio'/> <filterref filter="nova-instance-instance-00000007-02163e23f37d"> <parameter name="IP" value="10.200.200.56" /> <parameter name="DHCPSERVER" value="10.200.200.54" /> </filterref> </interface> ...
filterref中包括了其他的filters,默認在/etc/libvirt/nwfilter目錄下
你也可以使用virsh管理工具查看具體filter內容
# virsh nwfilter-dumpxml nova-instance-instance-00000007-02163e23f37d Filtering chains
Filtering chains就是你在目錄下看到的許多filters的文件。譬如有arp, 有dhcp, mac等
在程序中使用libvirt
int list_network_domain(virDomainPtr domain) { const char *path; virDomainInterfaceStatsStruct stats; size_t size; size = sizeof(stats); path = "vnet1"; int interval = 2; if( virDomainInterfaceStats(domain, path, &stats, size) ) return FALSE; long long start_rx_bytes = stats.rx_bytes; long long start_tx_bytes = stats.tx_bytes; sleep(interval); if( virDomainInterfaceStats(domain, path, &stats, size) ) return FALSE; long long end_rx_bytes = stats.rx_bytes; long long end_tx_bytes = stats.tx_bytes; int rx_usage = (end_rx_bytes - start_rx_bytes)/interval; int tx_usage = (end_tx_bytes - start_tx_bytes)/interval; printf("\t\trx usage: %d bytes/s", rx_usage); printf("\trx bytes: %lld bytes", stats.rx_bytes); printf("\t\trx packets: %lld", stats.rx_packets); printf("\trx errs: %lld\n", stats.rx_errs); printf("\t\ttx usage: %d bytes/s", tx_usage); printf("\ttx bytes: %lld bytes", stats.tx_bytes); printf("\t\ttx packets: %lld", stats.tx_packets); printf("\ttx errs: %lld\n", stats.tx_errs); }
這個函數很重要,其中將返回stats指針所指向的內容便是domain中各個網口的信息。這裡有個問題,就是path的值,他是由domain中網卡的名字,不是eth0也不是em0等,而是要通過獲取domain的xml中<device>網卡的interface部分中<target dev="vnet0">這一部分中的vnet0,同理前面說得disk裡面的“vda”也是從這裡獲取,
所以你需要運行一下這個程序
char *xmldesc; xmldesc = virDomainGetXMLDesc(dom, 0); if ((fp = fopen(virDomainGetName(dom), "w")) == NULL) { printf("Cannot open file test\n"); } fprintf(fp,xmldesc); fclose(fp); free(xmldesc);
返回的是字符串指針指向了xml的內容,記住這個程序運行好需要free指針。
via livemoon的博客
【編輯推薦】