![](https://www.alaica.com/wp-content/uploads/linux-41.png)
我在 Debian 64 位 Linux 下使用 NVIDIA UNIX x86_64 内核模块版本(驱动程序)280.13,Linux 内核为 2.6.32-5-amd64 x86_64。但是,我在 /var/log/messages 文件中收到以下错误
2 月 13 日 05:53:39 wks01 内核:[26652.425207] NVRM:0000:01:00.0 处的 GPU 已从总线上脱落。
2 月 14 日 03:59:14 wks01 内核:[39846.244283] NVRM:0000:01:00.0 处的 GPU 已从总线上脱落。
2 月 17 日 04:47:32 wks01 内核:[35237.485871] NVRM:0000:01:00.0 处的 GPU 已从总线上脱落。
2 月 18 日 06:53:19 wks01 内核:[49298.937949] NVRM:0000:01:00.0 处的 GPU 已从总线上脱落。
2 月 19 日 06:14:01 wks01 内核:[28508.567838] NVRM:0000:01:00.0 处的 GPU 已从总线上脱落。
此错误是随机发生的,并且我的笔记本电脑进入硬冻结模式。硬重启是我的 Dell M6500 基于 Debian Linux 的笔记本电脑从完全冻结状态恢复的唯一方法。我该如何解决这个问题?
这个问题到处都有报道,最推荐的解决方案如下:
安装最新内核版本和 NVIDIA 驱动程序
您需要更新内核并安装最新的 NVIDIA Unix 驱动程序。
将 NVIDIA 驱动程序置于持久模式
您需要将 GPU 设置为持久模式。从手册页:
指示是否为 GPU 启用持久模式的标志。值为“启用”或“禁用”。启用持久模式后,即使不存在活动客户端(例如 X11 或 nvidia-smi),NVIDIA 驱动程序也会保持加载状态。这可以最大限度地减少与运行依赖应用程序(例如 CUDA 程序)相关的驱动程序加载延迟。适用于所有支持 CUDA 的产品。仅限 Linux。
编辑 /etc/rc.local 文件并在 exit 0 语句之前添加以下行:
/ usr / bin / nvidia-smi -pm 1
保存并关闭文件。上面的行确保您的 GPU 在启动到系统后立即设置为持久模式。
如何从命令行设置持久化模式?
以 root 用户身份键入以下命令:
# /usr/bin/nvidia-smi -pm 1
如何验证我的设备是否设置了持久模式?
以 root 用户身份键入以下命令:
# /usr/bin/nvidia-smi -q | grep -i Persistence
示例输出:
持久模式:启用
如何查看所有设置?
键入以下命令以显示 GPU 或单元信息:
# nvidia-smi -q | less
示例输出:
==============NVSMI 日志============== 时间戳 : 2012 年 2 月 21 日星期二 07:20:20 驱动程序版本:280.13 附加 GPU : 1 GPU 0000:01:00.0 产品名称:Quadro FX 2800M 显示模式 : 不适用 持久模式:启用 驱动型号 当前:不适用 待定:不适用 序列号:不适用 GPU UUID:不适用 信息版本 OEM 对象:不适用 ECC 对象:不适用 电源管理对象:N/A PCI 巴士 : 1 设备:0 域:0 设备 ID:061D10DE 总线 ID:0000:01:00.0 风扇速度:不适用 内存使用情况 总计:1023 MB 已用:74 Mb 免费:949 MB 计算模式:默认 利用率 显卡:不适用 内存:不适用 纠错模式 当前:不适用 待定:不适用 ECC 错误 易挥发的 单比特 设备内存:不适用 注册文件:不适用 L1 缓存:不适用 L2 缓存:不适用 总计 : 不适用 双位 设备内存:不适用 注册文件:不适用 L1 缓存:不适用 L2 缓存:不适用 总计 : 不适用 总计的 单比特 设备内存:不适用 注册文件:不适用 L1 缓存:不适用 L2 缓存:不适用 总计 : 不适用 双位 设备内存:不适用 注册文件:不适用 L1 缓存:不适用 L2 缓存:不适用 总计 : 不适用 温度 显卡:48℃ 功率读数 电源状态:不适用 电源管理:不适用 功耗:不适用 功率限制:不适用 钟表 图形:不适用 SM:不适用 内存:不适用
2012 年 7 月 7 日更新:Nvidia v302.17 驱动程序
一些用户告诉我,如果您使用 NVIDIA v302.17 驱动程序,这个问题可以通过 Linux 内核 3.xx.xx 系列解决。您需要从所有浏览器中删除(删除或禁用)flash 播放器支持。这将摆脱这个问题。跟踪此问题的 NVIDIA 内部错误是错误 ID # 973068。
推荐读物:
- 手册页 nvidia-smi
- NVIDIA 加速 Linux 显卡驱动程序自述文件和安装指南以及版本 302.17指南。