解决GPU服务器SSH远程连接不上的问题

您所在的位置:网站首页 英伟达驱动连接不上服务器 解决GPU服务器SSH远程连接不上的问题

解决GPU服务器SSH远程连接不上的问题

2024-07-15 05:37| 来源: 网络整理| 查看: 265

断电后重启实验室的GPU服务器,然后设置开机自启动SSH远程访问服务时,一直报错。

于是怀疑是 /etc/ssh/sshd_config文件里没有把一些东西的注释删掉,于是做了以下操作:

(1)查看服务器是否安装SSH

-bash-4.2# rpm -qa | grep ssh openssh-keycat-7.4p1-11.el7.x86_64 fence-agents-ilo-ssh-4.0.11-66.el7.x86_64 libssh2-1.4.3-10.el7_2.1.x86_64 openssh-clients-7.4p1-11.el7.x86_64 openssh-askpass-7.4p1-11.el7.x86_64 ksshaskpass-0.5.3-7.el7.x86_64 openssh-7.4p1-11.el7.x86_64 openssh-server-7.4p1-11.el7.x86_64

根据上述命令发现Centos7默认安装了SSH包。

(2)查看配置文件里是否开启了服务

-bash-4.2# vim /etc/ssh/sshd_config

结果如下所示:配置文件没有问题

注:这里解释一些配置文件里的一些内容注释

#禁用root账户登录,如果是用root用户登录请开启 PermitRootLogin yes # 是否让 sshd 去检查用户家目录或相关档案的权限数据, # 这是为了担心使用者将某些重要档案的权限设错,可能会导致一些问题所致。 # 例如使用者的 ~.ssh/ 权限设错时,某些特殊情况下会不许用户登入 StrictModes no # 是否允许用户自行使用成对的密钥系统进行登入行为,仅针对 version 2。 # 至于自制的公钥数据就放置于用户家目录下的 .ssh/authorized_keys 内 RSAAuthentication yes PubkeyAuthentication yes AuthorizedKeysFile .ssh/authorized_keys # 有了证书登录了,就禁用密码登录吧,安全要紧 PasswordAuthentication no

(3)重启OpenSSH服务

-bash-4.2#service sshd restart Error getting authority :Error initializingauthority: Could not connect: No such file ordirectory (g-io-error-quark,1)

出现问题了:获取权限出错∶错误的初始化权限,无法连接,没这样的文件或目录( g-io-error-quark,1 )

(4)看看日志

-bash-4.2# journalctl -xb

这时候想起了日志是个好东西,它里面记录了报错的原因,于是就上述命令查看日志发现,出现了如下图所示的报错:

将该报错信息输入到百度检索发现,原来好多人都遇到过类似的事情。于是我们终于查找到了原因——原来是一起负责维护的同学之前做磁盘挂载的时候,/home/data重新挂载到了sdc1磁盘,由于/etc/fstab 中用的是之前的文件类型xfs ,想着说为了后续扩容,就进行了格式化,然后用了新的类型ext4,导致启动系铳时,没办法加载到。

于是为了解决该问题,就先把之前的挂载卸载掉了

# 卸载:umount 设备名称 或者 挂载目录 -bash-4.2#unmount /home/data

然后用lsblk -f查看sdc已经没有挂载任何东西了

(5)删除对应的磁盘挂载配置信息

-bash-4.2#vim /etc/fstab

(6)重启服务器

(7)用MaboXterm连接一下GPU服务器,成功

--------------------------------------------------------------------------------------------------------------------------------------------

注:在进行第(4)步之前执行了内核的升级(由于这步神操作导致了后面的NVIDIA不能用!!!!!!!!!!!!!具体详见下一篇博客)

因此,不要轻易升级内核!!!!!!!!!!!会带来连锁反应的!!!!!!!!!!!!!!!!!

-bash-4.2# nvidia-smi NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

 



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3