SE_Zhang 的文章
  • V5服务器OS出现unknown device called “PCI Data Acquisition and Signal Processing Controller

    V5服务器OS出现unknown device called “PCI Data Acquisition and Signal Processing Controller 问题信息 表5-223 问题的基本信息 信息名称 信息内容 问题来源 1288H&2288H V5 该案例适用于 1288H&2288H V5 输出时间 2018-1-3 关键词 1288H&2288H V5 OS PCI Data Acquisition and Signal Processing Controller 问题现象描述 客户V5服务器安装OS windows2016,出现未知设备报错“PCI Data Acquisition and Signal Processing Controller”。 关键过程、根本原因分析 (1)现象分析 出现该报错,肯定是某个设备没有正常识别。没正常识别的原因,应该是新装OS系统下没有安装对应驱动。 (2)未知设备确认 1288H&2288H V5服务器iBMC默认打开黑匣子功能,而在OS侧没有安装对应驱动。 (3)安装驱动 IBMA自带Windows iBMA涉及黑匣子驱动,SNMP服务,以及hwBMAService服务的安装。 安装过程中请注意黑匣子驱动和SNMP服务必须在hwBMAService之前完成安装。否则可能导致iBMA软件的部分功能无法使用。 请参考《iBMA V100R002 用户指南 01》,正确安装黑匣子驱动。 结论、解决方案及效果 结论: V5服务器的iBMC默认打开黑匣子功能,但Windows侧没有相关驱动。 解决方案: 在OS windows 2016下,正确安装IBMA,从而安装黑匣子驱动。

    SE_Zhang 2025-12-02
    14 0 0
  • 华为V5服务器无法正常启动,报VCC上电超时告警

                   V5服务器无法正常启动,报VCC上电超时告警 表5-222 问题的基本信息 信息名称 信息内容 问题来源 1288H&2288H V5 该案例适用于 1288H&2288H V5 输出时间 2017-12-01 关键词 1288H&2288H V5 VCC 告警 问题现象描述 客户V5服务器前期均能正常上电,出现插上自购的GPU卡,无法正常上电的现象。通过查看服务器,发现出现U10告警。 关键过程、根本原因分析 (1)U10告警解析 通过查询《华为机架服务 精准告警处理 (iBMC) 》手册,发现其为非standby电源异常。 (2)日志分析 告警时maintenance有上电异常的打印,怀疑是GPU供电异常导致主板无法上电。 建议排查GPU的兼容性,以及是否正常确安装GPU卡。 3)GPU兼容性 GPU型号为Tesla M10,为客户自行采购,没在合同中。但在华为器件兼容性列表中。 (4)GPU安装 根据华为兼容性列表的备注事项可知: GPU插到riser卡上,可以支持2张M10 GPU卡,每个GPU需要一根04150627-001(GPU专用线缆)。线缆不要选错,要华为专用线缆,不能乱插到主板上。 GPU正确安装方法如图5-334所示。 图5-334 04150627-001电源线缆在机箱上的布置图 经分析,客户为自行采购GPU,采用的业界标准电源线,非华为专用电源线缆。如果用业界标准线,而非华为专用线缆,会出现VCC_12V0与地短路,导致无法上电。 结论、解决方案及效果 结论: 客户为自行采购GPU,采用的业界标准电源线,非华为专用电源线缆。如果用业界标准线,而非华为专用线缆,会出现VCC_12V0与地短路,导致VCC_12V0上电超时,无法启动。 解决方案: GPU电源线替换为华为专用电源线缆。

    SE_Zhang 2025-12-01
    14 0 0
  • 华为管理软件常见问题

                    iBMC升级后,原root用户无法登录WEB UI   问题现象描述 20台RH2288 V3服务器,使用SmartKit升级iBMC,从2.0.6升级到2.66版本,原来的root/Root@123无法登陆iBMC web,只能登陆iBMC后台uboot。 关键过程、根本原因分析 (1)uboot添加账号和密码 在IBMC uboot下,添加账号和密码,发现无法添加。 (2)uboot下刷新BMC版本 IBMC升级完成后, 1)旧账号密码无法使用root/Root@123 2)服务器初始账号密码也无法使用root/Huawei12#$ 3)服务器IP可以ping通 4)可以登录到后台UBOOT,但无法登录IBMC web界面 (3)版本分析 IBMC 2.02升级到最新版本2.66,版本升级方法没有问题。旧版本2.02没有升级版本兼容性问题。 经确认,2.66版本为定制化版本,不兼容普通版本。当升级为该版本后,对应的默认账号和密码与普通服务器不一样。 服务器IBMC版本升级到定制版本,导致前期账号和密码不可使用,默认的账号和密码也无法使用。 结论、解决方案及效果 结论: 服务器IBMC版本升级到定制版本,导致前期账号和密码不可使用,默认的账号和密码也无法使用。 解决方案: BMC 2.66版本不是通用版本。 1)18台服务器从2.66降为2.62后,还原为初始账号和密码,恢复正常,可以继续使用。 2)2台服务器在2.66版本上还原出厂配置后,重新降为2.62,发现只能主IBMC为2.62,备IBMC依然为2.66,无法刷新。 A)提供主备切换命令ipmcset -d rollback,进行刷新操作。 B)采用键盘、鼠标、显示器,现场实操,进BIOS配置账号和密码

    SE_Zhang 2025-11-28
    50 0 0
  • 2288H V5服务器RAID卡下所有硬盘在位状态出现异常

                 2288H V5服务器RAID卡下所有硬盘在位状态出现异常 问题现象描述 2288H V5服务器运行过程中突然报多块硬盘在位状态异常。 关键过程、根本原因分析 现象分析 从告警日志记录中,可以看到disk0-disk11(前置12盘硬盘背板)、disk40-43(后置IO模组1和2)全部都出现在位状态异常记录,1秒钟内removed再installed。顺序从disk0-disk43依次出现。 日志分析 IBMC中日志没有发现有当前时间点的硬件故障报错。且RAID卡日志记录只有记录到问题发生前一天的,没有当前记录。 初步判断非RAID卡硬件故障引起。 当前服务器版本信息: 原理分析 BMC中呈现硬盘出现在位状态异常,是通过查询CPLD寄存器值体现的。怀疑CPLD寄存器地址出现异常变更引起。 拉通CPLD、BMC分析,得出非CPLD问题。如果是CPLD寄存器出现异常,那么不可能这么规律。同时不可能所有硬盘都出现问题。因为GPIO信号如果受到干扰,是随机的,体现的就是硬盘是随机出现不在位。 经过BMC等各领域讨论,最终确认问题原因:BMC旧版本bug。BMC存储模块重启,代码重新设置硬盘的在位属性,造成SEL日志的打印。 结论、解决方案及效果 结论: BMC旧版本2.70 bug:BMC存储模块重启,代码重新设置硬盘的在位属性,造成SEL日志的打印。 解决方案: 升级BMC版本至2.94及以上版本。 经验总结、预防措施和规范建议  

    SE_Zhang 2025-11-27
    38 0 0
  • V5服务器反复上下电3508 RAID卡概率初始化失败问题

                      V5服务器反复上下电3508 RAID卡概率初始化失败问题 问题现象描述 SAS3508 RAID卡在做长期ORT可靠性测试时发现,在多次AC上下电情况下(模拟暴力上下电)小概率出现初始化失败,OS无法正常启动,需要手动干预。 触发条件: 使用了3508 RAID卡的控制节点。 3508 RAID卡的PCB版本号为.A。 3508 RAID卡的“当前写策略”为“Write Back”或“Write Back with BBU”。 整框上下电或插拔单板。 故障现象和判断方法 服务器启动时无法找到启动项,OS无法正常启动, 如下图所示: 判断方法: 从网设文档中获取刀片或者2288服务器iBMC的IP地址,然后登录web界面,默认用户名/密码:Administrator/Admin@9000; 在管理界面的“信息”栏下点击“系统信息”,选择“存储”菜单,查看RAID卡类型是否为LSI SAS3508,如果是,需要继续下一步确认,否则不涉及该预警。 查看RAID卡的PCB版本,如果显示.A,需要继续下一步确认,否则不涉及该预警。 进入下图界面,查看RAID卡的“当前写策略”,显示为“Write Back”或“Write Back with BBU”则涉及此预警,否则不涉及预警。 关键过程、根本原因分析 根本原因 SAS3508 RAID卡由于芯片存在一致性问题,在反复AC上下电触发下,信号小概率出现亚稳态 (0、1 状态随机),导致raid软件没有进入掉电保护的处理流程,初始化失败。 3508RAID卡FW默认配置BIOS模式为stop on error,当在此模式时,FW在遇到任何错误或者配置变更,启动过程都会将UEFI Driver设置为Not healthy,必须要客户进入F11-Device Manager界面进行修复,才能正常进入操作系统。

    SE_Zhang 2025-11-26
    35 0 0
  • 华为V5服务器device manager中没有RAID卡配置界面

                   V5服务器device manager中没有RAID卡配置界面 问题现象描述 V5服务器device manager中没有RAID卡配置界面,但在IBMC下可以正常识别RAID卡型号。 关键过程、根本原因分析 (1)RAID卡配置说明 2208\2308\3008\3108 RAID卡均支持UEFI模式以及legacy模式进行RAID配置以及启动。 而3408\3416\3508 RAID卡只支持在UEFI模式下进行RAID配置。不支持legacy配置,只支持legacy启动,如果需要离线配置RAID组,切换到EFI模式配置完成后,再切换回Legacy模式即可使用。 (2)boot type模式确认 iBMC web界面没有异常告警信息,可以正常识别RAID卡。 按F11,进入device manager,没有发现RAID卡识别信息,无法配置,确认问题现象。 排查确认BIOS boot type类型为legacy。 Legacy模式下,在Front page中,只有4个配置界面,没有Boot from file以及Administrator secure boot选项。---较为明显的区别 (3)原因确认 Boot type为legacy模式,3508 RAID卡需要在UEFI模式下进行RAID配置。 调整boot type为UEFI,实现RAID卡正常识别。 结论、解决方案及效果 结论: 3508 RAID卡只支持在UEFI模式下进行RAID配置。不支持legacy配置,只支持legacy启动,如果需要离线配置RAID组,切换到EFI模式配置完成后,再切换回Legacy模式即可使用。 解决方案: BIOS boot type模式调整为UEFI。  

    SE_Zhang 2025-11-25
    64 0 0
  • SR588更换硬盘后为GBOD状态

                            SR588更换硬盘后为GBOD状态 登录BMC 192.168.70.125  用户名USERID   密码PASSW0RD 在主界面点击服务器配置--RAID设置 将硬盘设置为未配置状态 再将硬盘设置为热备用,硬盘会自动同步

    SE_Zhang 2025-11-24
    25 0 0
  • HPEVA4400管理和维护登录

                                    HPEVA4400管理和维护登录 默认的上面的控制器ip地址是10.0.0.2,下面的是10.0.0.3 然后请将您的笔记本的ip地址设置成同一个网段的,比如10.0.0.5,并确认是否可以ping通,然后在IE浏览器中输入 https:// 10.0.0.2:2374  管理 https:// 10.0.0.2:2373 维护 然后输入用户名:manage    密码是:!manage 用户名:administrator    密码是:hpinven

    SE_Zhang 2025-11-21
    245 0 0
  • Linux命令——利用 du -sh 命令查看磁盘使用文件大小信息

              Linux命令——利用 du -sh 命令查看磁盘使用文件大小信息   一、du -sh 查看当前目录总大小 二、du -sh * 查看当前目录下各个文件及目录占用空间大小(不包括隐藏目录 三 、du -sh .[!.]* * | sort -h 查看当前目录下各个文件及目录占用空间大小(包括隐藏目录) du -sh .[!.]* * | sort -h 这个命令的解释如下:   du -sh: du 是 "disk usage" 的缩写,-s 选项表示汇总输出,即只显示每个参数的总计,-h 选项表示以人类可读的格式(例如 K, M, G)显示大小。 .[!.]*: 这是一个 shell glob 模式,用于匹配所有以 . 开头但后面不是 . 的文件或目录(即隐藏文件或目录,但不包括 . 和 ..)。 *: 匹配当前目录下的所有非隐藏文件和目录。 sort -h: 对 du 的输出按大小排序,-h 选项同样表示以人类可读的格式理解大小。 但是,由于 shell glob 模式不能直接在一个 du 命令中处理多个模式,我们需要分别处理隐藏文件和非隐藏文件,并将它们合并。   四 、du -sh * | sort -rh 查看目录下所有文件的大小并按照大小排序 五、du -sh [文件],查看该文件的大小 六、ls -la 罗列所有文件,包括隐藏文件。 ls: 这是 "list" 的缩写,用于列出目录的内容。 -l: 这是长格式(long format)选项,它会显示关于文件和目录的详细信息,包括文件权限、所有者、大小、创建/修改日期和时间以及文件名。 -a: 这是“全部”(all)选项,它会列出包括以点(.)开头的隐藏文件在内的所有文件和目录。

    SE_Zhang 2025-11-20
    831 0 0
  • 存储设备、交换机和主机正确的关机、开机顺序

    正确的关机顺序:停止所有业务→关闭主机操作系统→关闭主机电源→关闭交换机电源→关闭控制框电源→关闭硬盘框电源。 正确的开机顺序:打开硬盘框电源→打开控制框电源→打开交换机电源→打开主机电源和启动操作系统。 说明: 不同的产品接通与关闭电源的方法各不相同,其中: 对于S2600存储系统,直接接通或拔出电源线缆。 对于S5000系列存储系统,打开或关闭控制框或硬盘框后视图中的电源按钮。 对于S5500T、S5600T、S5800T、S6800TS3900、S5900、S6900存储系统,按任意一个控制器上的电源按键开关。 https://support.huawei.com/enterprise/zh/knowledge/EKB1000055325

    SE_Zhang 2025-11-19
    267 0 0