SE_You 的文章
  • CentOS7安装NVIDIA显卡驱动

    预、查询命令 1、Linux查看显卡信息:(ps:若找不到lspci命令,可以安装 yum install pciutils) lspci | grep -i vga 2、使用nvidia GPU可以: lspci | grep -i nvidia 3、查看显卡驱动 cat /proc/driver/nvidia/version 一、前提准备 1.安装依赖环境: yum install kernel-devel gcc -y 2.检查内核版本和源码版本,保证一致   ls /boot | grep vmlinu rpm -aq | grep kernel-devel 3.屏蔽系统自带的nouveau 查看命令: lsmod | grep nouveau 修改dist-blacklist.conf文件: vim /lib/modprobe.d/dist-blacklist.conf 将nvidiafb注释掉: #blacklist nvidiafb 然后添加以下语句: blacklist nouveau options nouveau modeset=0 屏蔽前 屏蔽后 4.重建initramfs image步骤 mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak dracut /boot/initramfs-$(uname -r).img $(uname -r) 5.修改运行级别为文本模式 systemctl set-default multi-user.target 6.重新启动 reboot 二、本地安装 1.在NVIDIA官网下载驱动 网址:https://www.nvidia.cn/Download/index.aspx?lang=cn 2.安装过程 chmod +x NVIDIA-Linux-x86_64-440.64.run ./NVIDIA-Linux-x86_64-440.64.run 3.如果报错 unable to find the kernel source tree for the currently running kernel.........,使用下面命令安装,3.10.0-1062.18.1.el7.x86_64需要改成自己的目录 ./NVIDIA-Linux-x86_64-440.64.run --kernel-source-path=/usr/src/kernels/3.10.0-1062.18.1.el7.x86_64 -k $(uname -r)  4.安装成功 nvidia-smi

    SE_You 2025-09-03
    28 0 0
  • ERROR: Unable to load the ‘nvidia-drm‘ kernel module.

    centos 7安装NVIDIA参考《CentOS 7 安装 NVIDIA 显卡驱动和 CUDA Toolkit》 安装tf gpu遇到问题一: centos 7 安装 nvidia驱动时遇到的ERROR: Unable to load the 'nvidia-drm' kernel module问题,网上查询大部份查询都是说出现这个问题最有可能的原因是你安装的Ubuntu是UEFI模式启动的,但是在BIOS中却打开了Security BOOT选项。 正确做法是禁用该选项。我的是禁用的。 解决办法:核版本不一致导致的失败 # uname -r # ll /usr/src/kernels/ 查询的结果不一致,解决办法,升级内核 #yum -y update 问题二:ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory。 当装完CUDA,CUDNN后调TF报这个错 1.是否正确添加的环境变量。我当时装的时候由于安装失败反复安装CUDA9.0,10.0等,环境变量等引用出现了问题。 libcublas.so.9.0代表TF对应的是CUDA9.0,libcublas.so.1.0对应的是CUDA10.0,同理。 2.显卡和CUDA不匹配,很多新显卡不支持低版本的CUDA,升级对应版本的cuda,cudnn,tf,NVIDIA,版本对应关系网上很好查到,不再复制了。 注:今天再次装新机的时候,使用#yum -y update后还是未能装成功报相同的问题,经查 #uname -r #rpm -q kernel-devel 结果不一致, 经查,服务器同存在 3.10.0-957.el7.x86_64 3.10.0-1062.18.1.el7.x86_64, 删除3.10.0-957.el7.x86_64后重启服务器, # rpm -qa|grep kernel 删除旧的 # rpm -e kernel-3.10.0-957.el7.x86_64 重启 #reboot 安装成功。

    SE_You 2025-09-02
    609 0 0
  • .NET Framework 4.0 官方下载 (支持Win11/10/7) - 附安装错误一键修复方案

    一、为什么仍需安装.NET Framework 4.0? .NET Framework是微软创建的一个软件开发和运行环境。尽管现在已有更高版本(如4.5、4.8),但 .NET Framework 4.0 依然是一个不可或缺的经典运行库。许多专业软件、旧版游戏、企业内部系统(如财务、工控软件)在开发时指定了依赖此版本。 当您的电脑弹出错误提示,如“无法启动此程序,因为计算机中丢失 .NET Framework 4.0”或类似的错误代码时,您就需要手动安装它。 系统与硬件要求: 支持的操作系统: Windows 11, 10, 8.1/8, 7 SP1, Vista SP2, XP SP3, 以及对应的服务器版本。 硬件要求: 至少1 GHz处理器、512MB RAM、850MB可用磁盘空间。 二、下载.NET Framework 4.0:官方与一键修复两种方式 我们提供两种安全可靠的下载安装方式,您可以根据自身情况选择。 方式一:从微软官网下载 (官方原版) 此方法适合熟悉电脑操作、希望安装最纯净官方版本的用户。 1.  访问官网: [点击访问 微软.NET Framework 4.0 官方下载页] 2.  选择版本: Runtime (运行时): 普通用户选择此项,用于运行依赖.NET 4.0的程序。 Developer Pack (开发包): 软件开发者选择此项,包含完整的SDK。 3.  开始下载: 保存安装文件,文件名通常为 `dotNetFx40_Full_x86_x64.exe`。 方式二:使用金山电脑医生一键安装 (推荐新手/遇错用户) 如果您在安装中遇到问题,或者不希望手动处理复杂的系统环境,此方法是您的最佳选择。 金山电脑医生 会智能检测您的系统环境,自动处理版本冲突、注册表问题和DLL文件缺失,实现一键式安全安装。 三、离线安装包下载 (无网络环境适用) 如果您的电脑无法联网,或者需要在多台电脑上部署,建议下载离线安装包。离线包包含了所有必需文件,安装过程无需网络连接。 官方离线包文件名: `NDP40-KB2468871-x86-x64-AllOS-ENU.exe` 下载方法: 在官网下载页面寻找 "Of……

    SE_You 2025-09-01
    760 0 0
  • RG 路由器CPU-ktimer 进程高

    一、故障现象 路由器CPU ktimer进程利用率高 二、组网拓扑 无 三、可能原因 1、系统任务调度频繁或异常、定时器长时间占用 四、排查步骤 步骤一:通过命令show cpu查看进程cpu利用率。 Ruijie#show cpu ======================================= CPU Using Rate Information CPU utilization in five seconds: 0.20% CPU utilization in one minute : 0.07% CPU utilization in five minutes: 0.05% NO 5Sec 1Min 5Min Process 0 0.00% 0.00% 0.00% LISR INT 1 0.00% 0.00% 0.00% HISR INT 2 0.00% 0.05% 0.05% ktimer 进程解释: ktimer线程提供给各个模块注册定时器用的。该线程占有CPU比例高,证明有定时器长时间占用,可能部分调度存在异常。 步骤二:该进程CPU占用高,一般需要研发参与定位,请直接跳转到信息收集章节。 五、信息收集 show run show memory show version show cpu show log show memory show arp show ef-rnfp all //间隔10S,收集3次 Show ip fpm statistics sh ip fpm users show ip rou summary show ip ref route statistic sho ip ref adjacency show ip fpm st show ip fpm count show core | b Buff debug support show except pcie show show skb show task show efb 六、总结与建议 1、ktimer线程提供给各个模块注册定时器用的。该线程占有CPU比例高,证明有定时器长时间占用,可能部分调度存在异常,若出现该进程CPU高,进行收集信息反馈400处理。

    SE_You 2025-08-29
    22 0 0
  • RG RSR30X路由器LISR进程CPU利用率高问题

    一、故障现象描述 客户现场两台RSR30X出现cpu高问题,问题持续时间约5分钟,CPU升高期间,并未发现业务出现异常。 通过查看设备端日志,发现占用CPU较高的进程是LISR_INT。 二、故障排查分析 经过排查发现,计算LISR_INT的CPU利用率,按照计算周期内LISR_INT执行的时间与计算周期总时间周期的比值确认,计算公式如下: cpu_rate = int_using_time*100/(current_cycle - begin_int_time); 其中,current_cycle表示当前的cycle计数,不清零,持续递增; begin_int_time表示低级中断开始的时间,不清零,持续递增; int_using_time表示本次计算周期内低级中断持续的时间,计算一次完成后会清0; 由于current_cycle和begin_int_time使用32bit的变量进行记录,且不会清0,会持续升高,因此存在溢出的情况,当出现溢出时current_cycle - begin_int_time有可能会变成一个非常小的值,因此cpu_rate会变成非常大的值超过100,此时show cpu时会将cpu利用率强制显示为100%。综上:故障原因是由于计算LISR-INT的cpu利用率时,使用的变量容量较小,当变量出现溢出时,会导致LISR-INT的cpu利用率失准,出现误报。 三、故障根因说明 由于计算LISR-INT的cpu利用率时,使用的变量容量较小,当变量出现溢出时,会导致LISR-INT的cpu利用率失准,出现误报。 四、故障解决方案 升级10.4(3b76)p1版本解决现场问题。

    SE_You 2025-08-28
    46 0 0
  • RG 路由器CPU-LISR/HISR 进程高

    一、故障现象 路由器CPU LISR/HISR进程利用率高 二、组网拓扑 无 三、可能原因 1、LISR/HISR进程占用CPU利用率高,说明系统中断频繁,任务调度处在繁忙状态,需要结合其他进程来具体分析 2、最常见情况,tnet/tnet6 CPU利用率高时,LISR CPU利用率也高 四、排查步骤 步骤一:通过命令show cpu查看进程cpu利用率。 Ruijie#show cpu ======================================= CPU Using Rate Information CPU utilization in five seconds: 60% CPU utilization in one minute : 73% CPU utilization in five minutes: 63% NO 5Sec 1Min 5Min Process 0 15% 17% 15% LISR INT 1 0% 1% 1% HISR INT 进程解释: HISR:高级中断服务程序; LISR:中断处理程序; 中断程序用于任务间的中断交替处理,具体作用不必深究。HISR/LISR与后面的进程不同,HISR/LISR服务于所有程序中断,因此这里表示所有LISR的CPU利用率和所有HISR的CPU利用率。 LISR/HISR 占用CPU利用率高,说明系统中断频繁,任务调度处在繁忙状态,但这不能直接说明问题,需要结合其他进程来具体分析。 步骤二:查看其它哪些CPU进程利用率高。 最常见情况,tnet/tnet6 CPU利用率高时,LISR CPU利用率也高。可以参考”tnet/tnet6进程高“排查。 五、信息收集 show run show memory show version show cpu show log show memory show arp show ef-rnfp all //间隔10S,收集3次 Show ip fpm statistics sh ip fpm users show ip rou summary show ip ref route statistic sho ip ref adjacency show ip fpm st show ip fpm count show core | b Buff debug support show except pcie show show skb show task show efb 六、总结与建议 1、LISR/HISR进程占用CPU利用率高,说明系统中断频繁,任务调度处在繁忙状态,需要结合其他进程来具体分析 2、最常见情况,t……

    SE_You 2025-08-27
    35 0 0
  • RG RSR设备console无法登入排查步骤

    一、故障现象 终端使用console线无法登入路由器 二、组网拓扑 拓扑描述:终端PC使用console线接到路由器console口进行登入 三、可能原因 1、console密码错误 2、console波特率设置问题 3、console线问题 4、设备console卡死 四、排查步骤 步骤一、console密码错误 console登陆设备提示密码错误 注:目前不支持console有RSR10-01G系列、RSR810系列、RSR820系列的4G路由器 解决方法:进行密码恢复 1、重启路由器,进入Boot层的命令行模式 注:RSR路由器进入Boot层的命令行模式,老版本和新版本有些不一样。新版本直接进入命令行模式;老版本则先进入菜单模式 1)新版本进入Boot层的命令行模式 重启路由器,在出现“Press Ctrl+C to enter Boot ...”时,同时按下键盘的Ctrl+C键,即可进入Boot层的命令行模式,设备会出现“BootLoader>”提示符 2)老版本进入Boot层的命令行模式 a、重启路由,在出现“Press Ctrl+C to enter Boot Menu ...”时,同时按下键盘的Ctrl+C键,可进入Boot层下的菜单模式 b、在Boot层下的菜单模式,按下键盘的Ctrl+Q键,即可进入Boot层的命令行模式,设备会出现“BootLoader>”提示符 2、重命名配置文件 BootLoader>rename config.text config.bak //将config.text重命名为config.bak,千万不要敲错,否则会导致配置丢失! 3、重启设备 BootLoader>reload //重启设备 4、恢复配置文件 Ruijie>enable //进入特权模式 Ruijie#copy flash:config.bak flash:config.text //将config.bak复制并命名为config.text Ruijie#copy startup-config running-config //运行config.text 5、配置新密码并保存设备配置 Ruijie#configure terminal //进入全局配置模式 Ruijie(config)#enable secret ruijie@123 //配置新enable密码为ruijie@123,也可更改为其它密码 Ruijie(config)#username ……

    SE_You 2025-08-26
    73 0 0
  • RG RSR7708-X 主控Console无法登入

    一、故障现象描述 主控console卡死远程也无法进入,备控能进入。 场景拓扑 二、故障排查分析 拨插主控让备控成为主控。此时输入sh run 后卡死(拔插主控为高危动作,拔插前按住ofl 按钮3s以上) 过了5分钟后 发现能登入设备了,查看cpu发现cpu到达99,主要是tent6进程占用高 tent6一般是有外部攻击或者大量的流访问,查看流表,大量外部ip在访问3.2 三、故障根因说明 大量流量访问到路由本身地址导致路由器cpu增高到达99卡死 四、故障解决方案 通过全局acl禁止访问172.16.3.2方式解决

    SE_You 2025-08-25
    29 0 0
  • RG RSR设备SSH登录不上排查步骤

    一、故障现象 终端无法通过SSH的方式登录上RSR路由器。 二、组网拓扑 拓扑描述: 终端172.26.10.38通过中间网络环境使用SSH连接到RSR路由器172.26.4.247 三、可能原因 1、没有开启SSH服务; 2、没有生成路由器公钥; 3、vty线路没有放通SSH登录的方式; 4、没有正确配置SSH账号密码 5、登入流量没有到路由器; 6、路由器ACL过滤; 7、路由器没有回程路由; 8、路由器配置的vty线路满了; 四、排查步骤 步骤一:检查是否没有开启SSH服务 在路由器上通过show service命令查看SSH服务是否开启 如图:ssh-server是关闭状态,需要使用如下命令开启 Ruijie#conf Ruijie(config)#enable service ssh-server Ruijie(config)#end Ruijie#wr 步骤二:检查是否没有生成路由器公钥 在路由器上使用show crypto key mypubkey dsa和show crypto key mypubkey rsa命令,看看是否生成了路由器的公钥(两个命令中有一个能显示公钥即可) 若如图rsa和dsa都是空的,需要创建dsa或者rsa的公钥 1)创建dsa公钥的方式 2)创建rsa公钥的方式 步骤三:检查是否vty线路没有放通SSH登录的方式 使用命令show run | be line v 查看输出中是否没有放通ssh 若未放通ssh,可以开启vty线路的ssh,命令如下图: 开启ssh后,line vty 0 4下将不会有transport的关键字显示 步骤四:检查是否正确配置了SSH账号密码 1)本地账号密码方式认证 使用命令show run | be line v 查看line vty的配置中是否配置login local,若为login local,需要使用show run | in rname和show run | in enable p分别检查账号密码和enable密码是否配置。注:SSH不推荐用单纯密码无账号的方式登录。 2)AAA账号密码方式认证 使用命令show run | in aaa检查是否开启了AAA的登录认证。如果开启了AAA的登录认证,默认将采用AAA服务器进行登录账号密码校验。 ①若想要本……

    SE_You 2025-08-22
    32 0 0
  • RG RSR20-XA 使用username命令无法覆盖原账号的密码

    一、故障现象描述 使用username命令尝试覆盖原账号的密码,提示“User_access reject: user 111 already exists, please delete it first.” 二、故障排查分析 步骤一、获取客户版本和配置,内部搭建环境使用相同版本和配置复现出故障现象: 步骤二、在配置的设备上复现,未出现现场的现象,判断是由于配置引起的。逐个配置增加后,发现“no password policy strong”后,账号能正常覆盖成功。 三、故障根因说明 12.x平台:password policy strong配置之后,不允许直接覆盖原账号的密码,只能先删除原账号之后重新配置账号密码。10.x平台无此特性。 四、故障解决方案 no password policy strong解决。

    SE_You 2025-08-21
    26 0 0