EMC DataDomain的離線故障診斷方法
如果DataDomain存儲係統可以正常開機登錄的情況下,可以使用DD OS的命令行進行很多的故障排查和診斷,如system status和enclosure show all等。同時係統也定期自動進行這方麵的檢查,如果發現問題,及時發出Autosupport告警信息。 但如果DD OS係統徹底不能啟動的時候,或者被人拔了盤和卡等的情況下,該如何進行係統的故障診斷呢?本文就是介紹在DD OS係統不能正常啟動情況下的故障診斷方法,也叫做offline diagnostics。 那麼什麼時候使用offline的故障診斷方法?主要是下麵幾種情況下,需要使用offline的故障診斷: 下麵我們看看可以對DataDomain存儲係統的那些部件進行離線檢查: FRU 測試名稱 System inventory System Controller Boot Disk HDD Quick Test System Controller Disks (all) HDD Comprehensive Test Fibre Channel HBA Card, Cable Gateway Diagnostic Memory (DIMMs) Memory Diagnostics Motherboard CPU Test CPU MCE Test CPU SSE Test Motherboard PCIe Topology Test SAS HU Diagnostics Test SATA HU Diagnostics Test Ethernet Network Interface Card (NIC) Network Internal Loopback Test Network External Loopback Test NVRAM Card NVRAM Card Test Serial Attached SCSI (SAS) Daughter and HBA Expansion Cards SAS Diagnostics Test VTL HBA Card, Cable VTL Diagnostic Battery Backup Unit BBU Diagnostic 要運行離線故障診斷,必須滿足下麵兩個條件:
下麵我們以第一種方式為例來做個簡單介紹。
連接console到DD係統,如果控製器已經不能啟動,直接通過按電源按鈕或者插拔電源的方式來重新reboot,如果DD係統還正常啟動,登錄到係統後,運行system reboot, DD係統重新啟動。
Reboot過程中,讓係統進入GRUB菜單,如下圖所示:

選擇offline Diagnostics (Serial Console),係統進入離線故障賬單子菜單,如下圖所示:

keyixuanzeduixitongjinxingquanbugongnengzhenduan,yekeyijinjinxuanzeduisuoguanxindebujianjinxinglixianguzhangzhenduan。ruguoduizhenggexitongjinxingzidongguzhangzhenduan,suohuafeideshijianhuibijiaochang,yibanhuiyou3-4個小時,取決於係統配置。下麵我們僅僅選擇對Fibre Channel、磁盤和SAS接口進行離線診斷,如下圖所示:

選擇Run selected Diagnostics, 係統會顯示一個彙總窗口以及需要花多少時間的彙總。係統在完成診斷後,會給出一個問題彙總和建議,如下圖:

本案例中,VTL的FC HBA卡有問題,需要進行進一步的診斷分析。其他類似這裏不在詳細敘述。





閩公網安備 35020302001891號