logo资料库

更换阵列卡.docx

第1页 / 共30页
第2页 / 共30页
第3页 / 共30页
第4页 / 共30页
第5页 / 共30页
第6页 / 共30页
第7页 / 共30页
第8页 / 共30页
资料共30页,剩余部分请下载后查看
关于 IBM 服务器更换阵列卡的方法 随着时间的推移,越来越多的 IBM 服务器陆续过保了,许多 的蓝色快车服务站也开始维修过保的服务器,但是,很多有 实践经验的工程师(包括去 IBM 作专职)逐渐离开蓝快,后 面来的工程师基本上不清楚以前的服务器,更换主板、电源、 CPU、MEM,还可以作,但服务器上最重要的是 RAID 卡上存 了一份阵列信息,硬盘上也会保存一份阵列信息。如果工程 师更换 RIAD 卡或硬盘时操作不当或大脑思路不清淅,很容 易造成客户的数据的丢失。我作了多年的工程师,几乎每一 种 IBM 服务器我均搞过,将一些更换阵列卡的方法以及注意 的问题等,实践过的经验方法共享给各位,也欢迎各位朋友 同事提出宝贵的意见和建议。 (一) RAID 卡的分类 1、 3L、3H(80M 属第三代 RAID 卡) 2、 4L、4LX、4M、4MX、4H(U160 属于第四代) 3、 5I 卡(第五代) 4、 6I、6M(第六代) 5、 7K、7T、7I(第七代) 6、 8I(第八代) (二) 举例:第四代 RAID 卡,4L、4LX、4M、4MX、4H 在 7600/X250 服务器上更换方法。 备件 1、4H FRU 37L6892,母卡;子卡,FRU 37L6902;
备件 2、三个硬盘 18GU160 10K 80P FRU 19K1467 在 7600/X250 服务器上安装,4H 卡,SCSI 线接第一个 SCSI 通道,即 CHANNEL 1( 阵列卡上有标识),三个硬盘分别上在 SCSI 硬盘背板通 道 ID0、ID2、ID3 上,开机后,第二屏会自检到 4H 卡和三 个硬盘。 (三) 如何判断 4L 4LX 4H 4M4MX RAID 卡坏了: 1. 服务器更本认不到 RAID 卡 更换一个 PCI 槽也是一样 的。 2. 开机检测试 RAID 卡上有 5 个灯 如果不是连续的闪跃 过 只有一个灯亮,或者 5 个灯全部常亮 RAID 卡必然坏了。 3. 开机可以检测到 RAID 卡,但是 RAID 卡报代码的错误, 按 Ctrl+I 可以进入 RAID 卡 BIOS,作 Restare to Factory Defanlt Settings (恢复原设置,即清除 RAID 卡上 的阵列信息) 后还是报代码错误 也是必然的 RAID 坏。 4. RAID 卡 插到服务器上,服务器开机就没有显示了,拔 掉 RAID 卡,服务器就有显示了,RAID 卡 必然是坏的。 5.RAID 卡 配完 RAID 后 ,装系统死机(排除 OEM 的 MEM 光 盘 OEM 硬盘的问题) 也可以说明 RAID 卡 坏,不过这种情 况不是很明显的,很少呢能碰到,我只遇到一次。 6. 就是篮快备件库里返修过的 RAID 卡,有时可以认到, 有时不认,RAID 卡有飞线的,实际上也是坏的,要投诉篮快 的领导可以换到好的。
7. 特别说明目前 IBM 的 4MX 卡(双通道的,RAID 卡上有个 散热片的),这种 RAID 卡 ,特别容易坏,过 3 年保修期几 乎是各个都坏。这主要是 IBM 设计上的问题。相反 4M 4LX 4H 就很少坏。 8. 一 个 重 要 的 要 点 : 4MX 卡 在 X250/X255/X235 坏的特别的多,你仔细看 这种服务器的 PCI 槽都有红色的卡位 4MX 卡在蓝色的卡位反而坏的少。 下面是检测查看 RAID 卡上的情况:(以及功能菜单选项的作 用) IBM 服务器开机后第二屏显示:当检测到 RAID 卡时: IBM Serve RAID BIOS XXXX 1994 2001 ………. BIOS Version 4.84 (这是 RAID 卡的 BIOS 版本号) Controlier 1 slot 3 Logical drivel firnware4.84. 01=ok 《 press ctrl+I to access the mini-configuration program 此时:按 Ctrl+I 可以进入 RAID 卡 BIOS IBM Serve RAID Mini—Configuration Program ver4.84 01 Main memu View cantroller status (显示 RAID 卡及硬盘状态)
View configuration Advanced functions(高级设置) EXIT 进入 View Controller status(选择这一项回车进入) Status for controller(4H 卡) 此时可以看到有 4 个通道 通 道 1 上有硬盘 3 个没有没 RAID CH1 Array SID CH2 CH3 CH4 Array ……………………. SID SID SID 0 RED (没有作 RAID 状态) 1 RED 2 RED 3 RED 7 INI (SCSI 卡上的通道 ID) 8 9 15 DRC(终结) Advanced Functions (进入高级设置) Restare to Factory Defanlt Settings (恢复原设
置,即清除 RAID 卡上的阵列信息) Copy the configuration from drives to the controlle (从 硬盘上拷贝阵列信息到 RAID 卡上)、这是更换 RAID 卡重要 的步骤,这一步作好才可以恢复 RAID 卡与硬盘之间的阵列 信息的链接,系统才可以启动。 View controller and PCI informatim (显示 RAID 卡的信 息) Controller information Controller Type Serve RAID 4H(可以看出是 4H 卡) Partmumber 06p5792 下面是配阵列的方法: 4.84Serverraid 光盘启动后进入程序配置阵列 Managed Systems Localhost(Local System) Conroller 1 鼠标右键 and tips Restroe to factory-defanlt setting Arrays 鼠标右键 configuration from drives Logical drives Hlints Copy delete
all arrays Hot-spare drives Physical drives Arrays (鼠标右键) Hintsard tips Configure RAID 鼠标右键 进行配置阵列,可作 RAID 1,RAID 5+Hot-Spare 配完阵列后在 SCSI 上看到硬盘为 ONLINE 状态 表示配好了, 可以启动装系统 SCSI Physical drives channel 1 IDO –online (17357MB) ID2 – online( 17357MB) ID3 – online( 17357MB) ID15 – online( 17357MB) SCSI channel 2 此时就表示 IBM 的 RAID 已经配好了 可以安装系统了 作 RAID5 呢 后台继续作 RAID 的同步 重新启动可以安装系统。 下面分几种情况更换 RAID 卡(4H 卡坏,用相同的 4H 来更换) 也就是说相同的卡去换相同一样的卡 这个工作难度不大。 (一) 情况一:(已经配好了 RAID 并且有重要的数据的前 提下)
(1) 只是 RAID 卡坏,硬盘没有坏,作为客户千万不能乱 动硬盘,或将硬盘的 ID 顺序搞乱,不能更换硬盘的位置, 否则死路一条。 (2) 换 RAID 卡之前,要搞清楚原来 RAID 卡 4H 的 BIOS VERSION 版本号(一般是 4.84 或 5.11 或 6.11) (3) 换上去的 RAID 卡 4H(要和原来坏的 RAID 卡 4H BIOS 4.84 的 BIOS 4.84 要一致,否则启动系统只是蓝屏,Driver 不对。 (4) 更换 RAID 4H 卡时,要看清楚 4H 的 SCSI 线接在哪个 通道上,要关闭所有电源下进行,同时,要注意灰尘,将 PCI 槽上或主板上的灰清除干净,否则会烧掉新装的 RAID 卡, 或 RAID 卡短路,也可以换一个 PCI 槽上新的 RAID 卡,这没 有什么影响的。 (5) 作好一切准备工作后,将 RAID 卡 4H 装好,开电源, 开机。 会看到如下信息:(其中之一) IBM Serve RAID BIOS BIOS Version:4.84.0.1 Controller 1 slot 3,Drive Logical drivel firnware4.84. 01=ok 会看到: 3 个新硬盘被发现
按 CTRL+I 进入 Copy the configuration from drives to the controller (选择这项) 可以将硬盘之中的 RAID 信息写入 RAID 卡上, 同步后,起动系统,OK 也可以用 SERVE RAID 光盘 4。84 启动, 选择 copy the configuration from drives the coneroller (二) 情况二:(前提条件主板电源系统均好的) 4H 卡也坏,有一个 18G 硬盘也坏,同时坏了两个与数据有关 的关键性的配件。 这个硬盘如果是在 RAID 之中(CTRL+I 可以看到 DDD,不一 定说明就是坏的,只能说是掉线,是否真正坏,可以 SCSI 线从 RAID 的通道上,接回到主板的 SCSI 口上,CTRL+A 进入 后,再扫描检测,如果红底白字则有坏道。 下面有两种情况:(前提条件是先不要动那个确定坏的硬盘, 先去更换 4H 阵列卡坏的 那个硬盘也千万不要从服务器 或 EXP200EXP300 中拔出来,因为硬上还有阵列信息的链接) 1.如果只是有一个硬盘坏 RAID 卡没坏情况如下:
分享到:
收藏