IBM N6210 (NetApp FAS3240)故障診斷與處理
IBM N6210 (NetApp FAS3240)故障診斷與處理
突然接到一個客戶的緊急求助,說IBM N6210存儲故障,業務運行明顯變慢,具體原因未知......kehunengtigongdexinxijiuzhexie,wenshebeizaishenmedifang?shifoukeyidaoxianchanghuozheyuanchengdenglu。dayue,shebeizaiyigesanjidishi,qiewufayuancheng。erwenqitayixiewenti,kehuduiN6210也不是很熟悉。
下麵對故障診斷過程做一個分享。
1. 認識N6210
IBM的N6210就是OEM的NetApp FAS3240,除外觀做了一些修改以外,其他沒有任何的改變,所有備件均通用,操作係統Data ONTAP也沒有做任何的修改。係統出現故障,在控製器的麵板的指示燈會有顯示,下麵對FAS3240的物理外觀做個介紹。
上圖是FAS3240的控製器外觀圖,可以看到在控製器的前麵板有電源和控製器的指示燈。右邊的綠色LED燈為控製器的指示燈,如果綠色閃爍,代表控製器online。
FAS3240有如下三種基本配置,根據係統命名後綴也可以做個基本判斷:
CB – Controller (A) – Base configuration,單控製器架構,FAS3210支持此種架構。
CC – Controller-controller configuration,雙控製器架構,FAS2係列均支持此種架構
CI – Controller (A) – IOXM Configuration (B),單控製器和擴展模塊,FAS3240和FAS3270支持此種架構
再來認識一下控製器的詳細後視圖,
在控製器上有一個LED燈,該指示燈是用來指示NVMEM的狀體,如果控製器發生切換或者控製器故障,而該指示燈每隔兩秒閃爍一次,說明NVMEM中有dirty cache,需要專家介入處理了,係統丟數的可能性非常大。
2. 遠程診斷分析過程
由於客戶對係統不熟悉,而且不能遠程,也不能到現場,隻能通過麵板指示燈來做初步判斷。讓客戶通過微信(SymmToken)把故障設備的指示燈發過來後,很快判斷出B控製器有問題,是否被成功接管需要進一步的分析。而客戶提供的前端主機端口沒有任何信號的問題就是這個問題,由於B控製器已經shutdown,所以沒有信號是正常狀態。從客戶提到的應用性能變慢,而沒有業務完全不可用的情況,可以初步判斷出是A控製器成功接管了B控製器,業務目前在A控製器上運行,而至於為什麼B控製器出現故障,需要進一步的log做分析判斷。在指導客戶收集了Autosupport後,進一步分析,最後定位到了NVMEM和NVMEM的電池故障,可以先更換NVMEN的電池,如果B控還不能正常啟動,可以考慮進一步更換NVMEM。對於NVMEM和NVMEM battery的更換需要特別注意是否有dirty cache,避免造成數據丟失。
依據分析,已搞清楚客戶問題,並提供了詳細的更換備件號和Action plan,並啟動備件訂購流程,配件更換後,問題順利解決。





閩公網安備 35020302001891號