存储S5500T(S3900)系统硬盘FW升级

问题描述

江苏某局点客户反馈S5500T存储硬盘故障率高,通过与原厂沟通,确认硬盘DOM 1217~DOM 1235批次Mickey Cert误重映射的FW BUG,该特性重映射标准过严,当业务模型为大量写数据集中在硬盘较小的范围内时,容易触发Mickey Cert 的重映射机制出现误重映射导致硬盘故障。

告警信息

存储硬盘故障,面板亮红色告警灯。

处理过程

 

首先,准备升级软件工具(SSH软件、串口线、网线、便携、OceanStor Toolkit升级工具、JRE1.6软件包、防静电手环),对用户进行停机宣传(提前三天开始),向客户索要升级存储的口令。

 

升级操作过程:

1、停止上层业务,关闭存储侧业务网口;

登录存储CLI,执行poweroffifmodule –c a –if 0和poweroffifmodule –c b –if 0分别将存储AB控的iSCSI接口卡下电

1.jpg

2、升级前检查,登录存储ISM检查阵列上是否有异常告警,如果有异常告警,处理后再执行操作。

3、升级存储硬盘FW,通过SSH Secure File Transfer上传升级脚本文件至存储任一控制器/home/permitdir目录下

2.jpg

4、CLI登陆升级脚本及硬盘FW升级包所在控制器,并进入debug模式。

输入developer命令进入developer模式

3.jpg

输入minisvstem命令,进入minisvstem模式,再输入vi进入编辑模式,然后输入shell进入debug模式。

4.jpg

download.jpg

5.jpg

6.jpg

5、最后再执行如下命令

chmod +x FW_updata.sh

dos2unix FW_updata.sh

7.jpg

6、执行./FW_updata.sh Compass_SAS_B004.LOD命令进入控制器保存脚本文件目录下,升级硬盘FW,脚本会自动判断存储上需要升级硬盘FW的硬盘数量并逐一对其进行升级。

8.jpg

7、最后升级完成后执行poweroffsys对存储进行下电并手动上电,上电直接按控制器上开关按钮

9.jpg

10.gif

 

8、登录存储CLI模式,输入showdisk -physic检查所有硬盘的FW是否为B004版本,如果是BOO4则说明升级成功,以下图为例:

11.gif

9、调整存储硬盘ERC时间,升级后前期修改的ERC时间会丢失,需重新修改。

点击OceanStor Toolkit工具,所有功能→维护→硬盘参数配置,运行硬盘ERC时间修改工具,修改完成后关闭ERC修改工具。

12.jpg

 

10、使用巡检工具检验存储是否有异常,如无任何异常,则存储系统硬盘FW升级完成。

根因

存储硬盘微码版本低导致存储硬盘FW bug,使存储硬盘故障率大大增加。

解决方案

针对S5500T存储硬盘故障率高,对存储系统硬盘FW微码升级。

建议与总结

该局点的存储硬盘故障率偏高,之前未进行过此项升级操作导致报出硬盘故障,直接更换硬盘。后来升级后发现硬盘故障率明显降低,所以存储硬盘故障并不是一方面因为设备使用时间过长而导致故障,建议后期升级版本同时针对硬盘微码也将此升级,根据需求定期升级硬盘FW微码,尽可能的降低硬盘故障率,从而延长存储使用寿命。

免责声明:本案例仅供参考不提供专业意见。

版权声明:
作者:youlijiang
链接:https://www.cnesa.cn/538.html
来源:正群欣世
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>