解決虛擬機遷移五大問題(2)
上節我們介紹了導致虛擬機遷移失敗的兩個原因:硬件資源不足以及服務器硬件不兼容。本文接續介紹虛擬機遷移失敗的其他三個原因以及如何解決。
3.虛擬機任務沖突
某些虛擬化任務需要花費相當多的時間才能完成,而且即使在發生超時錯誤后仍在后臺運行。當另一個虛擬化任務也在同時運行時嘗試啟動一個虛擬機可能會導致服務器發生錯誤。例如,當你刪除不需要的快照時,在合并過程中,虛擬機可能不會重啟。修改虛擬機配置文件中的超時設置將允許關鍵的活動不間斷運行,但是你可能還需要重新配置后臺任務來避免在下班時間虛擬機發生遷移以及重啟。
4.虛擬機文件損壞
虛擬機僅僅是運行于內存中的鏡像,而且該鏡像以特定的虛擬機文件格式比如.vmx以及.vmdk保存在磁盤中。與所有基于磁盤的存儲一樣,磁盤存儲子系統或者網絡連接存儲以及服務器存在的問題可能會破壞虛擬機文件。當虛擬機所需要的必要文件丟失、被鎖定、損壞時,虛擬機將無法啟動。
文件鎖定用于避免并發的任務對正在使用的文件帶來意想不到的變化,經常會發生上述錯誤。在某些情況下,虛擬機組件文件仍舊被鎖定而且避免了虛擬機在另一臺服務器上啟動。你可以修改被鎖定的文件然后移除鎖定,但是這一詳細的過程需要具備有關特定hypervisor以及數據中心環境的專業知識。更為常見的是從最近的快照或者另一個備份恢復虛擬機。
5.許可、管理輸入以及其他問題
導致虛擬機無法啟動的其他問題與比如用戶輸入意外中斷有關,而與服務器功能或者文件完整性無關。虛擬機可能開啟了一個正常以及成功的啟動過程,但是在啟動完成之前暫停了,并等待管理輸入。一旦你回答了該問題,虛擬機將會繼續啟動。在重新配置虛擬機以自動應答常規問題、消除人為干預之前,你需要在虛擬機啟動過程中避免中斷。這一過程與hypervisor相關而且需要具備專業知識。
另一個經常被忽略的問題是許可,該問題通常源于hypervisor安裝疏忽。例如,將虛擬機部署在一臺剛被虛擬化的服務器上時,這臺新服務器的許可可能沒有被正確配置。在其他情況下,許可可能被破壞了,或者組織可能就沒有許可。因此,你必須確保有足夠的許可來支持正在使用的虛擬化服務器,確保服務器已經配置了許可而且務必使許可是完整的而且沒有被破壞。
訪問hypervisor的日志文件或者管理日志也可能會加速故障診斷過程。如果通過日志沒有找到問題,根本原因很可能是上述問題中的一個。