2020年2月27日 星期四

華碩伺服器的磁碟控制器無法建立 RAID 5/6 及硬碟失敗處理

無法建立 RAID 5/6

參考華為的網站

Personality Mode设置为JBOD-Mode导致RAID卡部分功能不可以用

正常應該可以建立 RAID 6 的磁碟陣列,但是設成 JBOD 就只有 RAID 0, 1, 00, 10 可以選。

開機後,按“Ctrl+R”進入 RAID 管理界面。再按“Ctrl+P”或“Ctrl+P”切换到“Ctrl Mgmt”頁簽。

再選擇“Next”並按“Enter”,進入下一頁設定,將“Personality Mode”設置為「RAID-Mode」。


設置完成的 Disk Array 如下。



在 Properties 頁,分別顯示如下




開機時的相片

硬碟失敗處理

建立了由 6顆 6TB HD 組成的 RAID 6,覺得可以放心了。但有一天,卻回報 3顆 HD 亮紅燈,真慘。

把伺服器關掉重開,硬碟抽出再重新插入,看看重新開機會不會就好了。但很不幸,還是一樣 3顆 HD 亮紅燈。只好冷靜下來,看有沒有機會救回來。

使用 megacli 指令觀察硬碟狀態,有一顆 Failed,2顆 OffLine,Failed 和 OffLine 有什麼差別呢。

[root@get-182 ~]# ]# megacli -PDList -aALL -Nolog|grep '^Firm'
Firmware state: JBOD
Firmware state: Failed
Firmware state: Online, Spun Up
Firmware state: Offline
Firmware state: Offline
Firmware state: Online, Spun Up
Firmware state: Online, Spun Up

看看 disk array 的資訊,因為有 2 個 disk array,所以這個是 Virtual Drive: 1。

[root@get-182 ~]# ]# megacli -ldinfo -lALL -aALL
                                    
Virtual Drive: 1 (Target Id: 1)
Name                :VD_24TB
RAID Level          : Primary-6, Secondary-0, RAID Level Qualifier-3
Size                : 21.830 TB
Sector Size         : 512
Is VD emulated      : Yes
Parity Size         : 10.915 TB
State               : Offline
Strip Size          : 256 KB
Number Of Drives    : 6
Span Depth          : 1
Default Cache Policy: WriteBack, ReadAhead, Direct, No Write Cache if Bad BBU
Current Cache Policy: WriteThrough, ReadAhead, Direct, No Write Cache if Bad BBU
Default Access Policy: Read/Write
Current Access Policy: Read/Write
Disk Cache Policy   : Disk's Default
Encryption Type     : None
Bad Blocks Exist: No
PI type: No PI

Is VD Cached: No

上面的 State 顯示為 OffLine。

既然有2顆硬碟是 OffLine,是不是可能是好的呢? 只是因為一些原因被設為 OffLine。若把它設為 OnLine,會如何呢? 就死馬當活馬醫吧,來試試看吧。

為了保險起見,先將其中一顆設為 OnLine 就好,若成功再設另一顆。但事後證明這想法實在錯了,應該同時將兩顆都設為 OnLine。因為後來上線後,硬碟內容就改變了,另一顆再加進來就整個死了。後來花了不少時間 rebuild,而且為了加快 rebuild 的速度,還不能 mount,整個伺服器不能運作。但事情很難講,也許將兩顆同時設為 OnLine 也不能成功。總之,磁碟陣列恢復運作,很高興,就等另一顆硬碟送回裝上吧。

將其中一顆設為 OnLine,磁碟陣列的 State 顯示為 Degraded,等到另一顆加上,rebuild 完成後,磁碟陣列的 State 顯示為 Partially Degraded。全部硬碟都加入,rebuild 完成後,State 則為 Optimal。

將硬碟設為 OnLine 的方式,可以用下指令的,但太不保險了。直接重新開機,按 Ctrl-R 進入磁碟陣列的管理界面,在 [PD Mgmt] 的功能下,移到 OffLine 的硬碟,將其設為 OnLine 即可。會跳出警告的畫面,提醒磁碟陣列可能無法運作。這提醒是有意義的,第一次的結果是恢復運作,但第二次就不能運作了,只好將其再次設為 OffLine。

最後要將另一顆 OffLine 的硬碟加回去,就費了一些功夫。因為只要插回去,它就會被認為是原來的一個硬碟。只好把它拔下來,用另個 Linux 系統,使用 cfdisk 把原來的資訊都清掉。cfdisk 會提醒磁碟含有 disk array 的資訊,就不管了。然後再將硬碟插回去,它就直接 rebuild 了。

沒有留言:

張貼留言

網誌存檔