第一首先,檢查一下你的服務(wù)器能否正常自檢。 如果開(kāi)開(kāi)機(jī)還有自檢畫面
證明你的三大件沒(méi)有問(wèn)題。
第二檢查,你的服務(wù)器能否正常進(jìn)入raid 如果不能進(jìn)入。問(wèn)題大致出現(xiàn)在你的raid卡,或者硬盤這兩個(gè)問(wèn)題了
第三。檢查,你的服務(wù)器診斷板開(kāi)機(jī)報(bào)錯(cuò)情況。 如過(guò)報(bào)錯(cuò)信息是raid,就檢查一下你的raid卡(陣列卡),如果報(bào)錯(cuò)是
DASD麻煩你檢查一下你的硬盤。
下面就是進(jìn)入raid卡判斷問(wèn)題的方法。 雖然和有些型號(hào)不匹配大致問(wèn)題檢查是相同的僅提供參考。
RAID配置
關(guān)于這一部分,我覺(jué)得很多人都寫過(guò)這樣的文章,所以我也不多寫了。我當(dāng)時(shí)是參考以下的博客做出來(lái)的,寫的還是比較詳細(xì)的。
我那時(shí)候有四塊硬盤,三塊一起做了個(gè)RAID5,剩余的一塊作為全局熱備【Global hot spares】使用的,當(dāng)有硬盤壞了能及時(shí)自己替換上去。下面的配圖是我自己的配置界面:
如果硬盤壞了當(dāng)初又沒(méi)有設(shè)置熱備盤,那么可以進(jìn)入陣列卡,把這塊新?lián)Q的硬盤設(shè)置為熱備盤就OK了,它會(huì)自動(dòng)同步的。那就點(diǎn)擊一下這塊新?lián)Q的硬盤,然后勾選“Make Global HSP”,然后點(diǎn)擊“GO”按鈕就可以了,設(shè)置熱備盤對(duì)數(shù)據(jù)不會(huì)有影響,如果擔(dān)心,那么在操作前備份一下數(shù)據(jù)以防萬(wàn)一。如果你之前沒(méi)有熱備盤,那么設(shè)置成熱備盤后它會(huì)自動(dòng)去替換之前壞的那塊硬盤,如果你之前有熱備盤,那么設(shè)置成熱備盤那么它就是熱備盤。
二、系統(tǒng)安裝
RAID配置結(jié)束之后,就到系統(tǒng)安裝部分了。我當(dāng)時(shí)只測(cè)試安裝過(guò)server 2003 和 server 2008 R2.
安裝server 2003 需要用到 IBM server guide,也就是我們常說(shuō)的引導(dǎo)盤 。我測(cè)試了很多個(gè)版本,最后發(fā)現(xiàn) IBM server guide V8.41_anyos_i386.iso 才能正常使用,其他版本的剛剛加完文件之后就一直在加載的界面滾動(dòng),然后就一直保持這樣,很奇怪。。。。
而安裝server 2008 R2則不需要server guide了,直接刻錄微軟官方的2008 R2系統(tǒng)鏡像,就可以安裝系統(tǒng)了,比server 2003的方便很多。
三、服務(wù)器維護(hù)
當(dāng)服務(wù)器出現(xiàn)問(wèn)題,快速定位故障所在很重要。下面我提供兩種我認(rèn)為很方便快捷的方法:
方法一:看面板前面的狀態(tài)燈。在電源開(kāi)關(guān)所在的那一個(gè)區(qū)域(如下圖),如果狀態(tài)指示燈閃爍黃燈(如下圖),那么你可以拉開(kāi)隔壁的藍(lán)色的一個(gè)東西,可以拉出來(lái)的,就像我下圖的一個(gè)東西:
拉開(kāi)之后是一片小短板,上面有很多小燈,每一個(gè)燈都對(duì)應(yīng)一些字母,如 LINK PCI SP。。。如果哪一個(gè)燈亮著***,那么問(wèn)題很有可能是那一塊問(wèn)題了,如我下面的就是DASD的燈亮了,那么這些字母分別對(duì)應(yīng)什么呢?請(qǐng)看下面:
ps1 指示燈:當(dāng)此指示燈發(fā)亮?xí)r,表明電源1 出現(xiàn)故障。
ps2 指示燈:當(dāng)此指示燈發(fā)亮?xí)r,表明電源2 出現(xiàn)故障。
temp 指示燈:當(dāng)此指示燈發(fā)亮?xí)r,表明系統(tǒng)溫度超出閾值級(jí)別。
風(fēng)扇指示燈:當(dāng)此指示燈點(diǎn)亮?xí)r,表明散熱風(fēng)扇或電源風(fēng)扇出現(xiàn)故障或運(yùn)行太慢。風(fēng)扇發(fā)生故障還會(huì) 導(dǎo)致over temp 指示燈發(fā)亮。
vrm 指示燈:當(dāng)此指示燈發(fā)亮?xí)r,表明微處理器托盤上的某個(gè)vrm 出現(xiàn)故障。
cpu 指示燈:當(dāng)此指示燈發(fā)亮?xí)r,表明某個(gè)微處理器出現(xiàn)故障。
pci 指示燈:當(dāng)此指示燈發(fā)亮?xí)r,表明某個(gè)pci 總線發(fā)生錯(cuò)誤。
mem 指示燈:當(dāng)此指示燈發(fā)亮?xí)r,表明發(fā)生內(nèi)存錯(cuò)誤。
dasd 指示燈:當(dāng)此指示燈發(fā)亮?xí)r,表明某個(gè)熱插拔硬盤驅(qū)動(dòng)器出現(xiàn)故障。
nr 指示燈:當(dāng)此指示燈發(fā)亮?xí)r,表明存在兩個(gè)電源但電源并不冗余。
nmi 指示燈:當(dāng)此指示燈發(fā)亮?xí)r,表明出現(xiàn)一個(gè)不可屏蔽中斷(nmi)。
sp 指示燈:當(dāng)此指示燈發(fā)亮?xí)r,表明服務(wù)處理器遇到錯(cuò)誤。
exp 指示燈:當(dāng)此指示燈發(fā)亮?xí)r,表明某個(gè)連接的i/o 擴(kuò)展單元出現(xiàn)故障。
log 指示燈:當(dāng)此指示燈發(fā)亮?xí)r,表明您應(yīng)該查看事件日志或remote supervisor
adapterii 日志以獲取有關(guān)非最佳條件的信息。
over spec指示燈:當(dāng)此指示燈發(fā)亮?xí)r,表明對(duì)電源的需求超過(guò)了指定的電源供應(yīng)。
remind 按鈕:按下此按鈕可重新設(shè)置操作員信息面板上的系統(tǒng)錯(cuò)誤指示燈并將服務(wù)器置于提醒方式。在提醒方式下,故障并沒(méi)有清除但系統(tǒng)錯(cuò)誤指示燈會(huì)閃爍(每2 秒閃爍一次)而不是持續(xù)發(fā)亮;如果出現(xiàn)另一個(gè)系統(tǒng)錯(cuò)誤,則系統(tǒng)錯(cuò)誤指示燈將會(huì)持續(xù)發(fā)亮。
方法二:IBM X3650 M3內(nèi)置有一個(gè)遠(yuǎn)程控制端口,有點(diǎn)類似 DELL R910 的,都是以服務(wù)器第一塊網(wǎng)卡默認(rèn)為管理端口,然后會(huì)有一個(gè)默認(rèn)的地址,于是可以登錄上去查看系統(tǒng)信息以及日志等等。
X3650的管理網(wǎng)口是在服務(wù)器后面的第一塊網(wǎng)卡,其默認(rèn)的管理地址是 192.168.70.125 ,我們可以拿一臺(tái)筆記本和一根網(wǎng)線,接到服務(wù)器的第一塊網(wǎng)口,然后設(shè)置筆記本的本地連接是同網(wǎng)段IP:192.168.70.X (如192.168.70.5)即可,子網(wǎng)掩碼 255.255.255.0 ,網(wǎng)關(guān)為空,如果能 ping 通192.168.70.125,說(shuō)明是連接正確了。
然后打開(kāi)筆記本的瀏覽器,輸入地址192.168.70.125 就會(huì)出現(xiàn)登錄界面,在User Name處輸入帳號(hào): USERID, Password處輸入密碼: PASSW0RD.完成后會(huì)出現(xiàn)歡迎界面.
(“USERID”和“PASSW0RD”照搬就可以了,這個(gè)和系統(tǒng)用戶名密碼不一樣,是所有同型號(hào)機(jī)器的默認(rèn)設(shè)置,并且“PASSW0RD”里面的“0”不是英文的“O”,而是數(shù)字的“0”)
進(jìn)入到的界面應(yīng)該和我下圖的一樣: