Galax安装时节点加载异常

问题描述

当加载节点超时,且未加载成功时,即表示节点加载异常。需要清理节点原来的加载信息并重新加载节点。

告警信息

加载超时

处理过程

判断加载异常的节点类型:

1.      加载异常的节点是否为物理节点?
是,执行步骤2;
否,执行步骤7;

重新加载物理节点:

2.      使用“PuTTY”,登录MCNA节点。
以“root”用户通过“管理IP地址”登录MCNA节点。

3.      执行以下命令,进行节点加载准备。
service galaxbtserver restart
nodeset 节点名 install

4.      进入机房,重启故障物理节点服务器。

查看加载结果:

5.      在“SingleCLOUD安装配置系统”查看节点加载状态。

6.      节点是否加载成功?
是,结束。
否,请联系华为热线。

排除格式化超时问题:

7.      登录IP SAN,根据LUN ID找到管理节点使用的LUN。

8.      管理节点虚拟机使用的LUN的写策略配置是否配置为“回写、镜像”?
是,执行10。
否,执行9。

9.      配置管理节点使用的LUN的写策略为“回写、镜像”。
具体配置方法,请参见IP SAN设备资料。

重新加载虚拟节点:

10.  使用“PuTTY”,登录MCNA节点。
以“root”用户通过“管理IP地址”登录MCNA节点。

11.  执行以下命令,进行节点加载准备。
service galaxbtserver restart和nodeset 节点名 install

12.  执行以下命令,查看管理节点虚拟机ID。
tabdump mvm

13.  根据加载失败的管理节点虚拟机名称“node”字段,确认虚拟机ID和虚拟机所在CNA节点主机名。
虚拟机ID为第二个字段“id”,虚拟机所在CNA节点名称为倒数第三个字段“oncna”。例如上述信息中,节点“IMGS01”对应的虚拟机ID为“i-FA000001”,所在CNA节点主机名为“CNA02”。

14.  根据加载异常的虚拟机所在的CNA节点主机名获取CNA节点的管理IP地址。
根据加载异常的虚拟机所在的CNA节点主机名获取CNA节点的管理IP地址。

15.  使用“PuTTY”,登录加载异常的虚拟机所在的CNA节点。
以“root”用户,通过“管理IP地址”登录CNA节点。

16.  执行以下命令,关闭加载异常的虚拟机。
virsh shutdown 虚拟机ID
例如,关闭加载异常的“IMGS01”节点,执行命令virsh shutdown i-FA000001。
显示信息示意如下:
Domain i-FA000001 is being shutdown

17.  等待15秒后,执行以下命令,启动加载异常的虚拟机。
virsh start 虚拟机ID
例如,启动加载异常的“IMGS01”节点,执行命令virsh start i-FA000001。
显示信息示意如下:
Domain i-FA000001 started

查看加载结果

18.  在“SingleCLOUD安装配置系统”查看节点加载状态。

19.  节点是否加载成功?
是,结束。
否,执行步骤 20。
重新创建管和加载虚拟化管理节点

20.  登录“SingleCLOUD安装配置系统”。

21.  删除管理节点虚拟机。

22.  重新创建管理节点虚拟机。
创建后虚拟机自动加载。
查看加载结果

23.  在“SingleCLOUD安装配置系统”查看节点加载状态。

24.  节点是否加载成功?
是,结束。
否,拨打华为热线解决。

根因

需要排查一下原因:

  1. MCNA节点或MCNA节点上的xCAT服务被重启。
  2. 网络中断。
  3. 待加载节点异常下电。
  4. 管理节点虚拟化部署时,系统卷挂载失败。
  5. MBR文件损坏,节点启动失败。
  6. 格式化磁盘超时。、
  7. BT下载异常。

建议与总结

节点加载失败的原因很多,对于不再案例的问题请联系华为热线单独分析。

版权声明:
作者:youlijiang
链接:https://www.cnesa.cn/1352.html
来源:正群欣世
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>