H3C Workspace云桌面 故障处理手册

您所在的位置:网站首页 云桌面无法安装 H3C Workspace云桌面 故障处理手册

H3C Workspace云桌面 故障处理手册

2024-05-28 23:32| 来源: 网络整理| 查看: 265

H3C Workspace云桌面

故障处理手册

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

资料版本:5W111-20240418

 

Copyright © 2024 新华三技术有限公司 版权所有,保留一切权利。

非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。

除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。

本文档中的信息可能变动,恕不另行通知。

目  录

1 故障处理概述··· 1

1.1 故障处理流程·· 1

2 记录故障现象··· 2

2.1 故障现象记录表·· 2

2.2 故障现象记录表填写说明·· 2

3 收集基本信息··· 2

3.1 基本信息收集表·· 3

3.2 基本信息收集表填写说明·· 3

4 收集系统日志··· 3

4.1 客户端日志·· 4

4.2 多媒体、vGPU、协议、外设、Agent日志·· 4

4.3 管理平台日志·· 7

5 常见故障··· 7

5.1 管理平台故障·· 8

5.1.1 新建本地用户,在客户端使用该用户登录云盘,提示“用户名或密码错误”·· 8

5.1.2 配置云盘服务器,提示“云盘已经被平台xx使用” 8

5.1.3 为登录名为中文的用户增加云盘授权时,提示“增加失败” 8

5.1.4 为用户授权云盘后,无法对用户的云盘使用权进行启用/禁用操作·· 8

5.1.5 盲水印下发/命令下发失败·· 8

5.1.6 管理平台连接License服务器提示“连接命令已下发,但状态异常,请检查License服务器设置”·· 9

5.1.7 使用软件分发功能在制作软件库时打开软件库模板虚拟机,虚拟机中无法显示软件制作工具·· 9

5.1.8 域用户在客户端修改密码后,新密码不生效,老密码仍然可以登录·· 9

5.1.9 新建VDI桌面镜像虚拟机网络异常·· 9

5.1.10 管理员登录数超最大限制无法登录·· 10

5.1.11 管理员登录提示用户名/密码错误,实际密码正常·· 10

5.1.12 新建管理员登录后,无部分功能按钮,无法进行对应操作·· 11

5.1.13 域管理员无法登录·· 12

5.1.14 客户端超时无法连入云桌面·· 12

5.1.15 客户端连接数量达到上限·· 12

5.1.16 桌面池下云桌面显示异常,虚拟化界面状态正常·· 12

5.1.17 客户端不能被强制下线,终端关机,重启无反应·· 13

5.1.18 升级服务功能正常,但是客户端无法升级·· 13

5.1.19 管理员在License Server中安装了激活文件,但在Workspace管理平台中配置连接License Server后却获取不到授权数量·· 13

5.1.20 试用期部署了License Server,且Workspace管理平台中配置并连接License Server后,之前可用的客户端都无法连接云桌面·· 13

5.1.21 在文件分发页面,点击按钮后,提示“同名文件正在上传,请稍后重试” 14

5.1.22 在文件分发页面,点击按钮后,提示“临时目录%s空间不足,请进行清理!” 14

5.1.23 在文件分发页面,点击按钮后,发现文件立即上传完成,但并不是当前用户自己上传的文件   14

5.1.24 桌面池部署桌面加域失败,域用户客户端无法虚拟桌面·· 14

5.1.25 客户端部署/升级时不执行下载·· 14

5.1.26 融合版本挂载镜像安装时报错“An unkonwn error has occurred”·· 15

5.1.27 系统安装后业务异常,服务起不来或者添加主机中提示版本号不对·· 15

5.1.28 E1010P09以后的版本,暂停模板存储失败,提示:存储被业务进程占用,不支持暂停·· 15

5.1.29 Workspace文件分发失败,报错“unc procCmdAgentSoftWare Path”或“Agent响应超时,本次任务失败”,云终端提示:接收失败·· 16

5.1.30 管理平台无法正常登录/一直转圈·· 18

5.1.31 前台登录后页面空白,服务器错误响应码:504· 27

5.1.32 Workspace 前台收集主机日志一直转圈·· 28

5.1.33 重置前台admin管理员密码·· 29

5.1.34 集群扩容添加主机失败·· 29

5.1.35 管理平台是双机热备,双机出现脑裂问题导致平台无法正常访问·· 30

5.1.36 VOI终端进行转移分组操作时报错“终端被使用,不允许改变匹配客户端类型” 30

5.1.37 平台升级时onestor precheck报错“rpm database check failed!” 30

5.1.38 管理平台关闭主管理节点内存大页失败,报错“大页正在被使用,禁止关闭”·· 31

5.1.39 超融合环境,扩容主机时报错“将主机xxxxx添加到业务主机组异常”·· 32

5.1.40 双机热备场景下,[系统/双机热备管理/共享存储]页面使用的是GlusterFS存储,在扩容业务节点后,该存储状态显示为不活动·· 32

5.1.41 双机热备场景下,镜像存储或者双机热备共享存储不活动,启动镜像存储或者双机热备共享存储时,提示目录已经被使用;后台检查该存储目录时,发现目录处于只读状态·· 32

5.1.42 管理平台从低版本升级到新版本,低版本时,用户自定义了角色用于控制管理员的权限,并使用该角色新建了管理员,升级后使用该管理员登录平台,某些页面报403错误·· 33

5.1.43 管理平台从E1009H10版本离线升级到E1013P11版本,升级前部署校园空间使用双机热备共享存储,部署完成后暂停该存储,平台升级后双机热备存储无法启动,报错:该磁盘不存在·· 33

5.1.44 管理平台从低版本升级到E1013系列版本,有概率出现校园空间某功能(如共享空间、随堂测试)无法使用,并且尝试重启服务后问题依然存在·· 33

5.2 License相关故障·· 34

5.2.1 连接License Server时提示“非法的使用场景”或“连接异常,请检查License服务器设置”·· 34

5.2.2 License服务器断电后License Server无法连接,提示“连接异常,请检查License服务器设置”·· 36

5.2.3 连接License Server报错“I/O error on POST request for.......” 38

5.2.4 管理平台连接License Server后提示获取到的授权为0· 41

5.3 外设故障·· 42

5.3.1 连接云桌面后,摄像头软件无法找到摄像头·· 42

5.3.2 摄像头重定向到云桌面后,摄像头应用软件播放画面卡顿、撕裂、丢帧·· 42

5.3.3 toolbar上点击挂载按钮,无法将磁盘重定向到云桌面中·· 43

5.3.4 toolbar上显示已经挂载成功,但是云桌面中没有显示对应的网络驱动器·· 43

5.3.5 云桌面中挂载好的网络驱动器名称显示错误·· 43

5.3.6 云桌面中进入映射的网络驱动器中时,刷新资源很慢,标题栏进度条进展缓慢·· 43

5.3.7 在Toolbar中不能看到希望重定向的设备·· 44

5.3.8 在Toolbar中能看到希望重定向的设备,但无法点击进行重定向·· 44

5.3.9 重定向设备(主要是存储设备)在云桌面内,设备管理器中可见,但存在黄色叹号·· 45

5.3.10 外设无法重定向,故障原因不明·· 45

5.4 客户端安装或升级故障·· 45

5.4.1 能够自动下载客户端,但下载进度一直为0· 45

5.4.2 出厂终端自带的SpaceOS系统,无法自动部署Workspace客户端应用程序·· 45

5.4.3 自启动的SpaceConfig程序终端标签页显示信息不完整·· 45

5.4.4 终端能自动发现管理平台,但是无法自动下载客户端·· 46

5.4.5 管理平台部署后,终端无法自动下载客户端·· 46

5.5 客户端登录故障·· 46

5.5.1 启动Workspace客户端后弹窗提示“获取认证模式失败,请检查服务器配置是否正确”,输入用户名密码无法登录   46

5.5.2 客户端远程桌面断开后,快速再次连接该桌面,Workspace提示“启动超时,稍后重试”·· 46

5.5.3 客户端程序崩溃·· 46

5.5.4 客户端无法正常连接云桌面·· 47

5.6 客户端连接和使用云桌面故障·· 47

5.6.1 用户首次在客户端登录云桌面,无法正常进入桌面·· 47

5.6.2 客户端连接云桌面突然断开,界面返回到Workspace程序界面·· 47

5.6.3 在使用远程桌面过程中,弹出“错误报告”窗口·· 47

5.6.4 客户端无法连接桌面,使用微软mstsc(远程桌面链接)能连接桌面·· 47

5.6.5 连接桌面,画面模糊,鼠标一直偏移·· 48

5.6.6 无法双屏,本地两个显卡·· 48

5.6.7 SpaceOS系统下客户端无法连接桌面·· 48

5.6.8 云桌面配置了双显卡,终端为双屏,但连接桌面后只显示单屏·· 48

5.6.9 SpaceOS系统环境本地磁盘映射没有磁盘列表·· 49

5.6.10 窗口化后,本地桌面闪烁·· 49

5.6.11 终端复制文件或者文件夹,云桌面点击粘贴后没有反应·· 49

5.6.12 鼠标操作没有响应·· 49

5.6.13 云桌面崩溃·· 50

5.6.14 云桌面卡顿·· 50

5.6.15 在云桌面中通过Office2007使用Excel时,选中整个表格后复制会报错“可用资源不足,EXCEL无法完成此任务”   50

5.6.16 云桌面开机启动慢,进入桌面后打开软件鼠标一直转圈,很长时间才能打开·· 50

5.6.17 Windows Defender病毒库将优化工具误报为病毒或潜在的垃圾软件,导致优化工具无法运行·· 50

5.6.18 客户端连接共享桌面时画面黑屏,黑屏超过30秒后断开连接·· 51

5.6.19 从云桌面中拷贝大量Excel数据时,弹出报错“可用资源不足,Excel无法完成此任务。请少选择一些数据或关闭其他应用程序” 52

5.7 vGPU、多媒体故障·· 52

5.7.1 创建云桌面添加了vGPU却无法使用GPU· 52

5.7.2 带vGPU的云桌面连接时出现画质比本地稍微模糊的情况·· 52

5.7.3 带vGPU的云桌面在切换为软解时,出现卡顿现象·· 53

5.7.4 云桌面播放视频没有声音·· 53

5.7.5 vGPU云桌面黑屏·· 53

5.7.6 vGPU云桌面,单屏转双屏,副屏黑屏·· 53

5.7.7 MPC播放器无法重定向播放·· 53

5.7.8 MPC播放器提示找不到音频设备·· 54

5.7.9 视频重定向播放卡顿/不流畅·· 54

5.7.10 vGPU帧率上不去·· 54

5.7.11 拖动窗口卡顿·· 54

5.7.12 新部署的云桌面没有自动加载H5扩展或重定向不成功·· 55

5.7.13 云桌面使用IE浏览器打开Flash网页卡顿·· 55

5.7.14 C113播放视频没有画面·· 55

5.7.15 C113打开视频短暂黑屏(能自动恢复)·· 56

5.7.16 C100接入HDMI无声音播放设备显示器进行视频重定向,关闭MPC播放器后,VdSession进程无响应   56

5.8 主机故障·· 56

5.8.1 节点故障或网络不通·· 56

5.8.2 硬盘或RAID卡故障·· 56

5.8.3 节点暂无数据·· 57

5.8.4 高可用IP通但是IO不通·· 57

5.8.5 扫描添加主机时找不到主机或添加失败·· 58

5.8.6 删除主机提示删除失败,实际删除成功·· 58

5.8.7 主机无可用硬盘·· 60

5.8.8 删除存储节点过程中,由于误操作拔出该存储节点对应的OSD,导致读缓存残留·· 61

5.8.9 无法扫描到主机·· 63

5.8.10 备机和业务节点免密异常·· 63

5.9 其他·· 63

5.9.1 配置认证服务器进行连接测试,提示网络通信异常或LDAP服务器错误·· 63

5.9.2 超融合环境服务器异常断电重启或网络变动,主机恢复正常后虚拟机启动失败·· 64

5.9.3 用户使用盲水印策略,在云桌面内截图后上传,解析出来没有设置的水印内容·· 64

5.9.4 C113终端升级SpaceOS系统后无法开机,黑屏或停留在启动logo· 64

5.9.5 双机热备环境搭建失败·· 64

5.9.6 超融合环境模板创建在共享存储目录,重启主机后模板不可用·· 64

5.9.7 共享存储启动失败,报错 internal error ocfs the mountpoint hace to be an empty directory· 64

5.9.8 外挂存储异常导致Workspace上存储显示不活动,后台查看发现存储只读·· 64

5.9.9 胖终端分辨率异常,通过鼠标操作桌面时存在无法点击或点击无效的情况·· 65

6 故障处理救助··· 65

6.1 故障处理求助准备·· 65

6.2 故障处理求助电话·· 65

 

1 故障处理概述

本文介绍了H3C Workspace产品在使用过程中可能遇到各种问题,用户可参考本文档完成对H3C Workspace的故障处理。

1.1  故障处理流程

当H3C Workspace发生故障时,用户可参考图1-1所示的流程进行故障处理。在紧急情况下记录故障现象后,可优先从“查找常见故障”开始排查,后续补齐其他记录表。

图1-1 故障处理流程

 

表1-1 故障处理流程说明

流程步骤

说明

记录故障现象

记录H3C Workspace故障现象并填写《H3C Workspace故障现象记录表》。

收集基本信息

收集H3C Workspace基本信息并填写《H3C Workspace基本信息收集表》。

收集系统日志

收集H3C Workspace系统日志。

查找常见故障

结合故障现象、基本信息和测试结果在本文档中查找符合的故障描述。

尝试排除故障

如果找到符合的故障描述,请参考相关的解决办法排除故障。

故障处理求助

如果未找到符合的故障描述或尝试排除故障失败,请拨打电话(400-810-0504)向H3C技术支持寻求帮助。

 

2 记录故障现象

当用户遇到H3C Workspace故障时,请先记录故障现象并填写《H3C Workspace故障现象记录表》。

2.1  故障现象记录表

表2-1 H3C Workspace故障现象记录表

项目

描述

故障发生时间

 

故障操作与截图

 

故障影响范围

 

故障相关信息

 

 

2.2  故障现象记录表填写说明

用户可参考以下说明填写《H3C Workspace故障现象记录表》:

·     故障发生时间:故障发生的时间或时间范围,请尽可能精确到分钟。

·     故障操作与截图:执行过的相关操作以及关键步骤的截图。

·     故障影响范围:例如个别用户、全部用户、个别组织、全部组织、管理员、第三方系统等。

·     故障相关信息:可能与故障相关的其他信息,例如:设备断电、网线脱落、存储故障等。

 

3 收集基本信息

故障现象记录完成后,请根据实际情况填写《H3C Workspace基本信息收集表》。

3.1  基本信息收集表

表3-1 H3C Workspace基本信息收集表

项目

信息

部署模式

()虚拟化模式              ()超融合模式             ()CloudOS纳管Workspace

桌面模式

()VDI                          ()IDV                          ()VOI/TCI

硬件运行环境

CPU配置

 

内存容量

 

本地存储容量

 

共享存储类型

 

共享存储容量

 

版本信息

 

授权信息

授权类型

()正式授权

()试用授权

()临时授权

使用情况

 

 

3.2  基本信息收集表填写说明

请参考以下内容填写《H3C Workspace基本信息收集表》。

·     部署模式:H3C Workspace的部署模式,包括虚拟化模式、超融合模式和CloudOS纳管Workspace模式。

·     硬件运行环境:H3C Workspace的硬件运行环境,包括服务器和共享存储。

¡     CPU配置:服务器的CPU数量和主频。

¡     内存容量:服务器的内存容量。

¡     本地存储容量:服务器的本地存储容量。

¡     共享存储类型:未使用时标明“无”。

¡     共享存储容量:各共享存储卷的容量,未使用共享存储时请标明“无”。

·     版本信息:H3C Workspace的版本信息,包括版本号及序列号。

·     授权信息:H3C Workspace的授权信息。

¡     授权类型:H3C Workspace当前的授权类型,包括正式授权、试用授权和临时授权。

¡     使用情况:H3C Workspace授权的使用情况。

4 收集系统日志

收集完H3C Workspace的基本信息后,请参考以下内容收集H3C Workspace系统日志。

4.1  客户端日志

终端日志可通过浏览器一键收集。收集方法:在浏览器中输入“终端IP地址:9001”,可一键下载客户端打包日志。

表4-1 客户端日志

系统

组件名称

日志目录

日志文件名称

日志内容

Windows

Workspace

用户文档目录\Workspace\log

Workspace.日期.log

记录Workpace软件运行日志

VdSession

用户文档目录\VdSession\log

VdSession-服务器地址-桌面池-桌面ID-日期.log

记录远程桌面连接程序运行日志

U2ec

Workspace安装目录\log

u2ec_日期.log

记录外设重定向程序运行日志

安装日志

Workspace安装目录\log

Workspace_NSIS_log.txt

记录Workspace客户端安装日志

SpaceAgent

SpaceAgent安装目录\log

SpaceAgent.日期.log

记录SpaceAgent终端服务代理程序日志

SpaceConfig

SpaceAgent安装目录\log

SpaceConfig.日期.log

记录客户端终端配置程序运行日志

upgrader

Liveupdate安装目录\log

Upgrader.日期.log

记录客户端在线升级运行日志

popview.日期.log

SpaceOS

Workspace

/home/spaceos/Documents/Workspace/log

Workspace.日期.log

记录Workspace软件运行日志

VdSession

/home/spaceos/Documents/VdSession/log

VdSession-服务器地址-桌面池-桌面ID-日期.log

记录远程桌面连接程序运行日志

SpaceAgent

/userdata/H3C/SpaceAgent/log

SpaceAgent.日期.log

记录SpaceAgent终端服务代理程序日志

SpaceConfig

/userdata/H3C/SpaceAgent/log

SpaceConfig.日期.log

记录客户端终端配置程序运行日志

upgrader

/userdata/H3C/Liveupdate/log

Upgrader.日期.log

记录客户端在线升级运行日志

popview.日期.log

4.2  多媒体、vGPU、协议、外设、Agent日志

虚拟机日志可通过浏览器一键收集。收集方法:在浏览器中输入“虚机IP地址:9003”,可一键下载客户端打包日志。

表4-2 多媒体、vGPU、协议、外设、Agent相关日志

虚拟机/客户机

系统

组件名称

日志目录

日志文件名称

日志内容

客户机

Windows

外设

H3C安装路径\workspace\Device Redirect\log\

VDIUsbService日期星期几.log

端口重定向日志

UsbSetup日期星期几.log

端口重定向驱动安装日志

VDIComService日期星期几.log

串口重定向日志

ComSetup日期星期几.log

串口重定向驱动安装日志

devredirect日期.log

摄像头重定向日志

virtualCamera日期星期几.log (虚拟机侧独有)

虚拟摄像头日志(虚拟机内独有)

C:\Users\当前登录用户\H3CDClient\

CDriverMapp日期星期几.log(物理机侧独有)

磁盘映射日志

SDriverMapp日期星期几.log(虚拟机侧独有)

磁盘映射日志

视频重定向

用户文档目录\VdSession\log

VdSession-服务器地址-桌面池-桌面ID-日期.log

记录视频重定向运行日志

vGPU

用户文档目录\VdSession\log

VdSession-服务器地址-桌面池-桌面ID-日期.log

记录光谱运行日志

HTML5

用户文档目录\VdSession\log

VdSession-服务器地址-桌面池-桌面ID-日期.log

记录H5重定向运行日志

Spiceclient

用户文档目录\VdSession\log

protocol-服务器地址-桌面池-桌面ID-日期.log

记录远程桌面连接程序协议运行日志

SpaceOS

sPiceclient

/home/spaceos/Documents/VdSession/log

protocol-服务器地址-桌面池-桌面ID-日期.log

记录远程桌面连接程序协议运行日志

视频重定向

用户文档目录\VdSession\log

VdSession-服务器地址-桌面池-桌面ID-日期.log

记录视频重定向运行日志

H5

用户文档目录\VdSession\log

VdSession-服务器地址-桌面池-桌面ID-日期.log

记录H5重定向运行日志

vGPU

用户文档目录\VdSession\log

VdSession-服务器地址-桌面池-桌面ID-日期.log

记录vgpu运行日志

外设

/var/log/ comredirect/

Comredir日期星期几.log

串口重定向日志

/var/log/camera_redirect/

devredirect日期.log

摄像头重定向日志

/var/log/eveusb/

Eveusb日期星期几.log

端口重定向日志

/var/log/

syslog

系统日志及端口重定向日志

/home/当前登录用户/文档/DiskMapping/

CDriverMapp日期星期几.log

磁盘映射日志

/home/当前登录用户/Documents/DiskMapping/

虚拟机

Windows

外设

Agent安装路径\ VdiAgent \Device Redirect\log\

VDIUsbService日期星期几.log

端口重定向日志

UsbSetup日期星期几.log

端口重定向驱动安装日志

VDIComService日期星期几.log

串口重定向日志

ComSetup日期星期几.log

串口重定向驱动安装日志

devredirect日期.log

摄像头重定向日志

virtualCamera日期星期几.log (虚拟机侧独有)

虚拟摄像头日志(虚拟机内独有)

H3C安装路径\VdiAgent\Vdagent Tools\log\

CDriverMapp日期星期几.log(物理机侧独有)

磁盘映射日志

SDriverMapp日期星期几.log(虚拟机侧独有)

磁盘映射日志

vGPU

H3C安装路径\VdiAgent\Vgpu\log

VGPUCapturer_日期星期几.log(虚拟机侧独有)

Capturer日志

视频重定向

Agent安装路径\VdiAgent\Vdagent Tools\log\

MMRRedirect+序号.log

视频重定向日志

Agent安装路径\ VdiAgent \Device Redirect\log\

MMRPlayerHookExe+序号.log

视频重定向日志

MMRPlayerHookDll+序号.log

MMRVChannel+序号.log

MMRTransfer+序号.log

MMRDShowHook+序号.log

MMRVRender+序号.log

H5

H3C安装路径\VdiAgent\Device Redirect\log

H3CcivetwebServer日期星期几.log

H5重定向日志

优化工具

C:\

optToolsCopyProfileSev日期星期几.log (虚拟机侧独有)

优化工具日志

agent

Agent安装路径\ VdiAgent\Vdagent Tools\log \

Vdagent_日期.log

Agent相关日志

: C:\Program Files (x86)\H3C\VdiAgent\Vdagent Tools\log

服务器

Linux

hostagent

/var/log/vdi/hostagent/

hostagent+日期.log

记录hostagent运行日志

Linux

Spiceserver

/var/log/libvirt/qemu/

虚机存储名称.log

记录spiceserver及虚机kvm/qemu进程的运行日志

 

4.3  管理平台日志

Workspace管理平台日志都在/var/log/vdi/目录下,主要有以下几个模块:

·     cancer :license client日志,新版本统一用OM提供的liccmgr组件。

·     controller:Controller 所有日志,包括grpc通信日志。

·     hostagent:hostagent日志。

·     ssv:ssv用户日志模块日志。

·     workspace-server:管理平台后台日志。

·     vdi-install.log:vdi安装日志。

·     vdi-upgrade.log:vdi升级日志。

5 常见故障

本章列举了H3C Workspace在使用过程中可能遇到的各种故障问题,用户可根据故障现象及检查结果快速定位并解决问题。

5.1  管理平台故障 5.1.1  新建本地用户,在客户端使用该用户登录云盘,提示“用户名或密码错误” 1. 故障分析

新建本地用户操作并不会为该用户创建云盘账号,需要在[应用/云盘]中为该用户增加云盘授权后才能正常使用云盘功能。

2. 处理步骤

在[应用/云盘]中为用户增加云盘授权。

5.1.2  配置云盘服务器,提示“云盘已经被平台xx使用” 1. 故障分析

一个云盘服务器只能被一个管理平台使用,当某个管理平台使用云盘服务器地址xx配置成功后,其他管理平台将不能使用该地址。

2. 处理步骤

重新部署云盘服务,使用新的云盘服务器地址。

5.1.3  为登录名为中文的用户增加云盘授权时,提示“增加失败” 1. 故障分析

云盘组件暂不支持中文名作为登录名,所以无法为中文登录名的用户授权。

2. 处理步骤

使用英文、数字、下划线作为用户登录名。

5.1.4  为用户授权云盘后,无法对用户的云盘使用权进行启用/禁用操作 1. 故障分析

处于“未初始化”状态的授权用户,无法被启用/禁用。

2. 处理步骤

初次登录云盘后,被授权用户状态即可变为“已初始化”状态。处于“已初始化”状态的用户可以被启用/禁用。

5.1.5  盲水印下发/命令下发失败 1. 故障分析

可能存在agent和controller双向流心跳中断的情况。

2. 处理步骤

(1)     服务端检查:

a.     通过SSH接入服务器后台。

b.     输入命令tailf /var/log/vdi/controller/grpc.log | grep 云桌面ip。

c.     查看是否有新日志打印,若无则表示agent双向流连接失败。

(2)     云桌面端检查:

a.     检查agent配置文件C:\Program Files (x86)\H3C\VdiAgent\conf\grpc_config.cfg中服务器ip、端口(8860)是否正确。

b.     查看C:\Program Files (x86)\H3C\VdiAgent\Vdagent Tools\log\VDIGrpcAgent日期,检查是否一直更新CDoubleStreamClient::TimerCallback():agentKeepMsg日志。如果两分钟内有日志打印,则证明心跳正常,即双向流建立正常。反之不正常,需要参考上一步定位原因。

5.1.6  管理平台连接License服务器提示“连接命令已下发,但状态异常,请检查License服务器设置” 1. 故障分析

管理平台在下发License服务器连接命令后,后台连续数次获取连接状态结果不是“已连接”。

2. 处理步骤

等待数秒后刷新页面,如果仍未连接,请检查License服务器配置,包括IP地址、端口等。再次连接,如仍不能解决,收集CAS、管理平台和cancer日志并联系H3C技术支持。

5.1.7  使用软件分发功能在制作软件库时打开软件库模板虚拟机,虚拟机中无法显示软件制作工具 1. 故障分析

可能是由于Agent异常,或者登录虚拟机的账户不是Administrator。

2. 处理步骤

在管理平台查看虚拟机是否处于运行状态(持续5分钟),将虚拟机中的登录账户切换为Administrator。

5.1.8  域用户在客户端修改密码后,新密码不生效,老密码仍然可以登录 1. 故障分析

域控策略的问题,允许老密码在修改过后仍然可以使用5分钟。

2. 处理步骤

请5分钟后再进行登录,验证老密码是否不能登录。

5.1.9  新建VDI桌面镜像虚拟机网络异常 1. 故障分析

可能是该虚拟机选择了错误的虚拟交换机导致。

2. 处理步骤

进入“虚拟化”页面找到该虚拟机,点击按钮,查看虚拟机网络配置,修改虚拟交换机配置。如仍不能解决,收集日志并联系H3C技术支持。

5.1.10  管理员登录数超最大限制无法登录 1. 故障分析

默认单个操作员并发连接数为10,管理员同时登录管理平台数超过配置,无法继续登录。

2. 处理步骤

在线管理员修改默认参数,路径为系统管理-高级设置-基础参数,修改参数“单个操作员并发连接”,如仍不能解决,收集日志并联系H3C技术支援。

图5-1 修改参数

 

5.1.11  管理员登录提示用户名/密码错误,实际密码正常 1. 故障分析

·     查看统一鉴权是否运行正常。登录服务后台,输入命令service auth-center status查看统一鉴权运行状态是否是为running状态,如下图所示。

图5-2 查看统一鉴权服务状态

 

·     在浏览器中打开页面“管理平台ip:6060/swagger-ui.html”,在“认证相关API”中,使用/oauth2/token接口进行测试,测试页面如下图所示。按照提示输入对应参数,在参数中修改username和password,执行后查看结果是否正常。

图5-3 token测试页面

 

2. 处理步骤

如果统一鉴权状态异常,或者测试页面无法正常执行结果,则判定为统一鉴权服务异常。之后可在后台执行命令systemctl restart auth-center.service重启恢复。如仍不能解决,收集日志并联系H3C技术支援。

5.1.12  新建管理员登录后,无部分功能按钮,无法进行对应操作 1. 故障分析

管理员对应角色权限勾选是否正确。

2. 处理步骤

更新对应管理员角色权限后重新登录。如仍不能解决,收集日志并联系H3C技术支持。

5.1.13  域管理员无法登录 1. 故障分析

检查域服务器配置是否正确。

2. 处理步骤

检查域服务器配置是否正确,配置正确后重新登录域账号。如仍不能解决,收集日志并联系H3C技术支持。

5.1.14  客户端超时无法连入云桌面 1. 故障分析

检查云桌面是否安装spice控制台。

2. 处理步骤

重新制作模板添加spice控制台,或者收集日志并联系H3C技术支援。

5.1.15  客户端连接数量达到上限 1. 故障分析

检查License-server配置界面,确定是否正确获取授权信息,可用授权是否为0。

2. 处理步骤

购买正式授权或再次申请临时授权,或者收集日志并联系H3C技术支援。

5.1.16  桌面池下云桌面显示异常,虚拟化界面状态正常 1. 故障分析

检查云桌面是否正确安装Agent(需检查制作桌面镜像模板时安装的路径)、Agent服务是否启动、配置服务器地址是否正确。服务器的配置信息在Agent安装路径/conf文件中,比如:C:\Program Files (x86)\H3C\VdiAgent\grpc_config.cfg,查看文件中的GrpcAddress和GrpcPort是否设置正确。

图5-4 Agent配置文件

 

2. 处理步骤

若未正确安装Agent则重新安装,或者收集日志并联系H3C技术支持。

5.1.17  客户端不能被强制下线,终端关机,重启无反应 1. 故障分析

检测是否正确安装SpaceAgent,自动寻址(服务器地址)是否正确。

·     在Linux系统下,命令行中执行:sudo systemctl status SpaceAgent

·     在Windows系统下,命令行中执行:sc query SpaceAgent

2. 处理步骤

若未正确安装SpaceAgent则重新安装,或者收集日志并联系H3C技术支持。

5.1.18  升级服务功能正常,但是客户端无法升级 1. 故障分析

检测是否正确安装SpaceAgent,自动寻址(服务器地址)是否正确。

·     在Linux系统下,命令行中执行:sudo systemctl status SpaceAgent

·     在Windows系统下,命令行中执行:sc query SpaceAgent

2. 处理步骤

若未正确安装SpaceAgent则重新安装,或者收集日志并联系H3C技术支持。

5.1.19  管理员在License Server中安装了激活文件,但在Workspace管理平台中配置连接License Server后却获取不到授权数量 1. 故障分析

为了简化用户操作,Workspace管理平台连接到License Server后会采用抢占方式获取License Server中的空闲授权,在多个Workspace管理平台共用同一个License Server时,授权可能被其他管理平台抢占。

2. 处理步骤

在浏览器登录:License Server管理ip:8090,依次点击[客户端连接]-[查看详情]-[操作]-[强制回收授权],即可将被抢占的License置为空闲状态,此时在Workspace管理平台重连接License Server即可。

5.1.20  试用期部署了License Server,且Workspace管理平台中配置并连接License Server后,之前可用的客户端都无法连接云桌面 1. 故障分析

Workspace出厂自带180天的300点试用授权,配置连接到License Server意味着试用终止,后台会从License Server拉取授权信息并覆盖试用授权信息,如果此时License Server中没有安装授权激活文件,Workspace的主要功能将无法使用。

2. 处理步骤

如需继续试用,请向一线人员申请180天期限的临时授权码;如需正式使用,请向一线人员下单获取正式授权码。

5.1.21  在文件分发页面,点击按钮后,提示“同名文件正在上传,请稍后重试” 1. 故障分析

此时有其他用户正在上传同一个文件,或者当前用户上次上传异常结束。

2. 处理步骤

等待其他用户文件上传完成,或者关闭其他上传页面,等待1分钟后重试。

5.1.22  在文件分发页面,点击按钮后,提示“临时目录%s空间不足,请进行清理!” 1. 故障分析

临时空间所在磁盘被占满,没有空间再存放上传的文件。

2. 处理步骤

删除管理节点目录/vms/tmp下所有文件并重新上传。

5.1.23  在文件分发页面,点击按钮后,发现文件立即上传完成,但并不是当前用户自己上传的文件 1. 故障分析

临时文件目录中存在同名文件,导致系统错误认为文件已上传完成。

2. 处理步骤

删除管理节点目录/vms/tmp/upload下的同名文件,并重新尝试上传。

5.1.24  桌面池部署桌面加域失败,域用户客户端无法虚拟桌面 1. 故障分析

云桌面加域失败。

2. 处理步骤

(1)     请确认云桌面内是否可以ping通域名,DNS是否解析正确。

(2)     请确认域控中是否存在相同计算机名,更改桌面池计算机名前缀后重新进行尝试。

(3)     请确认桌面镜像制作过程中是否安装了CAStools、CAStools是否运行正常,云桌面是否正常关机并完成了镜像制作。

5.1.25  客户端部署/升级时不执行下载 1. 故障分析

(1)     注册到管理平台的终端不在VDI非默认分组分组中。

(2)     安装包对应的.torrent文件的第一行IP不正确。

2. 处理步骤

(1)     在终端列表上删除对应终端信息,让终端重新向管理平台注册。

(2)     利用终端转移分组,将终端转移到正确的分组中。

(3)     如果.torrent文件第一行的IP和终端ping不通,在升级管理或者系统参数-基础参数页面,修改BT服务器IP。部署需要重启SpaceAgent服务,或者在管理平台升级服务页面开启客户端自动升级。

5.1.26  融合版本挂载镜像安装时报错“An unkonwn error has occurred” 1. 故障分析

可能是安装过程中,iso镜像传输出错导致。ilo挂载iso,需要从HDM通过网络的方式读取本地iso的内容,iso的传输过程:本地iso->服务器hdm->服务器硬盘。iso镜像通常比较大,如果网络状况不好或者故障,会导致iso镜像传输出错。

2. 处理步骤

重新挂载iso,重新安装。为了避免再次由于网络原因导致失败,可以考虑用U盘安装。

5.1.27  系统安装后业务异常,服务起不来或者添加主机中提示版本号不对 1. 故障分析

查看系统安装日志/var/log/syslog.install中是否有安装失败的日志,可能是安装过程中,安装包比较大、网络状况不好或者故障导致压缩包没读完整,进而导致解压失败。

2. 处理步骤

重新安装。

5.1.28  E1010P09以后的版本,暂停模板存储失败,提示:存储被业务进程占用,不支持暂停

查看被占用的进程:以共享存储路径是/templatesa为例,使用lsof和fuser –m进行排查。

图5-5 使用lsof排查

 

图5-6 使用fuser –m排查

 

5.1.29  Workspace文件分发失败,报错“unc procCmdAgentSoftWare Path”或“Agent响应超时,本次任务失败”,云终端提示:接收失败 1. 故障分析

(1)     首先通过ping测试确定云桌面和管理平台网络互通。

(2)     在云桌面内部资源管理器直接访问\\172.100.2.10\h3cd,若提示无法访问,有可能是管理平台服务异常或者网络问题。

图5-7 访问\\172.100.2.10\h3cd

http://zhiliao.h3c.com/Uploads/t/20210323/52fbe2931bbf48b8e90e74d8f1661816.png

 

图5-8 访问\\172.100.2.10\h3cd失败

http://zhiliao.h3c.com/uploads/t/20210323/16165004462360.png

 

(3)     检查平台侧服务状态,在后台执行命令service smb status,若服务运行正常,还是考虑网络问题。

图5-9 查看SMB服务运行状态

http://zhiliao.h3c.com/uploads/t/20210323/16165005479987.png

 

(4)     文件分发使用的是管理平台的445端口,可能是445端口不通。使用tcping工具,测试端口连通性。工具使用方法参见https://zhiliao.h3c.com/theme/details/148855《tcping工具使用方法》,测试结果显示管理平台445端口不通。

图5-10 测试445端口连通性

http://zhiliao.h3c.com/uploads/t/20210323/16165030228964.png

 

2. 处理步骤

用户配置了网络策略,屏蔽了445端口导致,可开启445端口解决问题。如果445端口已通,建议继续排查139端口以及云桌面内如下服务是否有限制:

·     Samba服务

·     UPnP Device Host

允许UPnP设备宿主在此计算机上。如果停止此服务,则所有宿主的UPnP设备都将停止工作,并且不能添加其他宿主设备。如果禁用此服务,则任何依赖于它的服务将都无法启动。

·     TCP/IP NetBIOS Helper

提供TCP/IP (NetBT)服务上的NetBIOS和网络上客户端的NetBIOS名称解析的支持,从而使用户能够共享文件、打印和登录到网络。如果此服务被停用,这些功能可能不可用。如果此服务被禁用,任何依赖它的服务将无法启动。

·     SSDP Discovery

当发现了使用SSDP协议的网络设备和服务,如UPnP设备,同时还报告了运行在本地计算机上使用的SSDP设备和服务。如果停止此服务,基于SSDP的设备将不会被发现。如果禁用此服务,任何依赖此服务的服务都无法正常启动。

·     Server

支持此计算机通过网络的文件、打印、和命名管道共享。如果服务停止,这些功能不可用。如果服务被禁用,任何直接依赖于此服务的服务将无法启动。

·     Network Location Awareness

当发现了使用 SSDP 协议的网络设备和服务,如 UPnP 设备,同时还报告了运行在本地计算机上使用的 SSDP 设备和服务。如果停止此服务,基于 SSDP 的设备将不会被发现。如果禁用此服务,任何依赖此服务的服务都无法正常启动。

·     Network Connections

管理“网络和拨号连接”文件夹中的对象,在其中您可以查看局域网和远程连接。

·     DNS Client

DNS 客户端服务(dnscache)缓存域名系统(DNS)名称并注册该计算机的完整计算机名称。如果该服务被停止,将继续解析 DNS 名称,然而将不缓存 DNS 名称的查询结果,且不注册计算机名称。如果该服务被禁用,则任何明确依赖于它的服务都将无法启动。

·     Computer Browser

维护网络上计算机的更新列表,并将列表提供给计算机指定浏览。如果服务停止,列表不会被更新或维护。如果服务被禁用,任何直接依赖于此服务的服务将无法启动。

5.1.30  管理平台无法正常登录/一直转圈 1. workspace-server服务状态异常

Workspace产品后台运行了很多服务,其中Workspace-server服务和auth-center服务是管理平台正常运行的必要服务,如果其中Workspace-server服务异常,会导致管理平台无法登录。常见的故障情况是:

(1)     在管理平台输入正确的账户密码之后点击按钮,没有任何反应。

(2)     按下F12键打开浏览器自带的调试器工具查看网络报错,可以看到接口返回了502报错码。

(3)     使用SSH工具连接到Workspace管理平台服务器命令行,执行如下图中命令,异常情况下返回信息中的判断字段为failed,通过执行恢复命令(service workspace-server restart)拉起服务恢复。

(4)     执行恢复命令后请检查判断字段应为running。

图5-11 查看Workspace-server服务状态

 

2. auth-center服务状态异常

在上述1中提到的auth-center服务同样也是管理平台正常运行的必要条件。

由auth-center服务异常引发的故障现象一

(1)     登录管理平台提示:查询有效管理员Token失败。

(2)     同样连接到Workspace管理平台服务器命令行执行systemctl status auth-center.service命令,发现auth-center服务状态异常,通过执行恢复命令(service auth-center restart)拉起服务恢复。

(3)     执行恢复命令后请检查判断字段应为running。

图5-12 查看auth-center服务状态

 

由auth-center服务异常引发的故障现象二

(1)     登录管理平台页面,输入用户名密码后,一直转圈,显示登录中,但是无法进入管理平台页面。

(2)     执行命令查看auth-center服务的状态,发现服务状态虽然是running,但是服务出现Out of memory内存溢出的报错,说明该服务已经无法响应用户认证请求,导致前台登录失败。

(3)     通过执行恢复命令(service auth-center restart)拉起服务恢复。执行恢复命令后请检查判断字段,正常应为running。

图5-13 查看auth-center服务状态报错

 

3. 根分区沾满导致前台登录异常

根分区沾满也可能导致前台登录异常,故障现象与异常情况以较为类似,此时通过后台命令对文件夹大小进行排序,找出大文件,根据文件的性质进行文件写空操作或删除操作。友情提示,删除文件之前一定要经过确认无用才可以删除。出现相对频繁的根分区沾满有以下两种情况。

·     首先是在一些特定的版本中,比如新安装的E1009、E1009H10环境,Workspace后台如下路径下有异常大文件,导致根分区被沾满,这是由于Workspace E1009、E1009H10版本升级了samba版本,但是默认安装时没有创建/var/log/samba路径,因此新安装会出现问题,而升级上来的版本不会有问题。因此导致后台相关路径下的日志文件中一直打印找不到相关路径的日志,如图。

图5-14 找不到先关路径的日志

https://zhiliao.h3c.com/uploads/t/20210926/16326269304617.png

 

处理步骤:手动在var/log路径下创建samba路径,双机热备场景主备都需要创建,并将异常的大文件写空即可,具体命令如下图:

图5-15 创建路径

https://zhiliao.h3c.com/uploads/t/20210926/16326271164711.png

 

·     另一种较常见的情况是容器日志过大,导致根分区被沾满。在Workspace中某些功能被容器化了,但是在早期版本中,没有对容器的日志进行有效压缩,在命令行通过文件夹大小排序发现容器的日志目录,也就是如下图所示位置,占用空间较大。遇到这种情况,可以执行恢复命令将容器日志写空后可恢复,新版本已经解决该问题。执行恢复命令后,请隔一段时间后查看日志文件大小,正常情况下不应该超过100M。

图5-16 容器日志文件

 

处理步骤:将上述日志写零,注意不是删除。命令:> filename(文件名请根据实际需要写零的日志文件修改)

4. 硬件变更导致内嵌的CAS/UIS授权失效

Workspace的虚拟化能力来自于CAS,虽然当前产品已经无法登录CAS/UIS界面,但是产品本身内嵌了CAS/UIS的授权,而CAS/UIS授权与服务器硬件host.info文件强绑定,当安装Workspace的服务器遇到硬件故障,需要更换主板或者网卡时,就会遇到CAS/UIS授权失效,进而影响Workspace前台登录。这种故障通过浏览器自带的调试工具可以看到调用接口返回401认证失败的错误码。

处理步骤:在浏览器中打开页面http://管理平台ip:8083/vdi/license/passInit对授权进行初始化,如果是双机热备则IP为双机热备虚IP。清除浏览器缓存后可以正常登录。

5. 数据库记录异常导致前台登录异常

(1)     前台登录报错“当前用户登录已失效,点击确定重新登录”。

图5-17 登录报错

https://zhiliao.h3c.com/uploads/t/20210630/16250359479503.png

 

(2)     通过F12键打开浏览器调试工具,查看网络情况,可以看到在登录失败的时候,接口调用返回的错误码为401认证报错。但是通过异常四的方法却无法恢复,这种情况下我们需要进一步排查日志,日志路径:/var/log/uis-core/uis.log,发现有如下明显报错。

图5-18 报错

https://zhiliao.h3c.com/uploads/t/20210630/16250436953793.png

 

(3)     查询数据库返回的结果不唯一,这说明查询数据库发现有重复的项。接着进入数据库查询发现92和93重复了。

图5-19 数据库查询

https://zhiliao.h3c.com/uploads/t/20210630/16250438226041.png

 

(4)     通过命令删除重复的项目,如下图所示。注意需要谨慎操作,确定是和该故障完全一致才能采用这种方法处理。然后清理浏览器缓存,再次登录Workspace即可恢复。

图5-20 重复项

https://zhiliao.h3c.com/uploads/t/20210630/16250438451671.png

 

6. 新版本增加心跳线程导致前台登录异常

这种情况多见于1007L01之前版本,升级到1007L01及之后版本,升级完成后,管理平台可以正常登录,但是大概几分钟之后会自动登出,这是由于1007L01版本增加了一个心跳检查进程,需要彻底清理浏览器缓存。判断方法:

·     第一种方法:在Web页面打开浏览器调试器,查看是否有heartbeat心跳线程定期的发送,如图所示就是心跳线程的定期发送,请观察一段时间,看是否有周期性发送,如果有,则可能是这个问题。

图5-21 心跳线程的定期发送

 

·     第二种方法是后台查看相关日志,日志路径:/var/log/vdi/workspace-server/workspace-server.log和日志关键字[onlineSync] syncOnlineOperator, vdi time out token。

处理步骤:彻底清理浏览器缓存,如图的两种方式分别是不彻底清理和彻底清理缓存

图5-22 不彻底清理缓存

 

图5-23 彻底清理缓存

7. 升级未完成,被人为中断导致前台登录异常

正常情况下Workspace能够直接输入IP即可登录前台页面,这是由于nginx程序默认的80端口代理了8083端口,因此可以直接输入IP进行登录。版本升级过程,程序会将nginx监听端口从80修改为20080端口,升级完成后修改回80端口。但是在某些情况下,比如升级未完成就被人为中断,可能没有修改回80端口,80代理8083,8083代理了Workspace服务。这种故障的故障现象是:在地址栏输入Workspace管理平台IP地址无法登录,但是输入IP:8083正常登录。

处理步骤:修改如下图中所示的配置文件,配置文件路径:/etc/nginx/conf.d/vdi.conf。修改主备管理节点相关的配置文件中监听端口字段为80,修改完成后再次登录即可。

图5-24 修改端口

 

8. 此账户在线数量已经达到最大数量限制 故障分析

admin用户登录失败,提示“此账户在线数量已经达到最大数量限制”,如下图:

图5-25 登录失败

https://zhiliao.h3c.com/uploads/t/20210411/16181312524632.png

 

早期版本admin操作员并发连接数已达到默认值10个,无法使用admin再上线。一般出现在将“操作员闲置时长”修改为特别大的情况下,这样在线用户长时间都没超时下线。

处理步骤

SSH登录后台,重启workspace-server服务(systemctl restart workspace-server),在线的操作员自动退出,浏览器清空缓存并重启后重新登录即可。之后可以根据实际需求,修改“单个操作员并发连接”和“操作员闲置时长”参数。

图5-26 修改参数

 

5.1.31  前台登录后页面空白,服务器错误响应码:504 1. 故障分析

(1)     Workspace登录后前台页面空白,右上角有报错,服务器错误,响应码:504。

图5-27 服务器报错

 

(2)     检查Workspace前台服务的服务状态,包括uis-core、tomcat8、workspace-server,服务均正常。在查看uis-core服务时,uis-core服务所占用内存超过了最大内存的限制。通过systemctl status uis-core可以查看到使用内存最大为4096m。

图5-28 查看uis-core服务

http://zhiliao.h3c.com/uploads/t/20220321/16478634681551.png

 

(3)     通过命令ps -aux |grep uis-core可以看到现在使用的内存大小。

图5-29 使用内存大小

http://zhiliao.h3c.com/uploads/t/20220321/16478645769051.png

 

2. 处理步骤

·     规避方法:重启uis-core服务。

·     解决方法:升级至Workspace E1010P09及后续版本。

5.1.32  Workspace 前台收集主机日志一直转圈 1. 故障分析

(1)     执行ps -ef | grep log_collect查看是否有回显,确认是否在收集过程中。

图5-30 执行ps -ef | grep log_collect

http://zhiliao.h3c.com/uploads/t/20220323/16479993138416.png

 

(2)     查看临时目录/tmp/operation_log/xxxx(xxx为随机生成的文件夹)下是否有主机日志生成。

图5-31 查看临时目录

http://zhiliao.h3c.com/uploads/t/20220323/16479998289599.png

 

(3)     观察临时目录,待主机日志收集完成后合并压缩成CloudDesktop.zip。

图5-32 压缩成CloudDesktop.zip

http://zhiliao.h3c.com/uploads/t/20220323/16480013869058.png

说明

当选择主机较多,时间较长时,根目录空间不足可能会导致日志压缩失败,当前版本前台刷新浏览器不会中断收集任务,需要中断收集日志接口。

 

2. 处理步骤

保持Workspace环境正常登录,浏览器中输入http://x.x.x.x:8083/vdi/operation-log/cancelGatherLog/xxx(x.x.x.x为环境中管理地址,xxx任意)。此方法中断收集后临时目录/tmp/operation_log/xxxx中临时日志文件不会自动释放,需要手动清理,以防根分区占满。

图5-33 临时文件

 

5.1.33  重置前台admin管理员密码 1. 故障分析

不涉及故障分析,适用于忘记admin密码,需要恢复密码为Cloud@1234。

2. 处理步骤

在管理平台后台中执行相关命令如下所示:

mysql -uroot -p1q2w3e@4R

use author_center;

update USER set password='zr5V0CX44QdJeiVgNDZoMg==' where name='admin';

service workspace-server restart

service auth-center restart

service controller restart

5.1.34  集群扩容添加主机失败 1. 故障分析

添加主机进入集群时报错“主机加入计算集群全部失败,参数{0}不存在”。在管理节点后台中进入数据库:mysql -p1q2w3e@4R,进入uis库查看PARAMETER表中的init.gateway参数是否为空。部署集群时没有添加网关时会导致该表项为空,添加主机时会导致校验无法通过。

2. 处理步骤

在管理节点后台进入数据库,进入uis库,执行下面的sql语句:

SELECT * FROM TBL_CLUSTER_PARAMETER;//查看需要加入集群的CLUSTER_ID,假设为1

INSERT INTO TBL_CLUSTER_PARAMETER (CLUSTER_ID,NAME,VALUE) VALUES(1,’init.gateway’,网关IP);

5.1.35  管理平台是双机热备,双机出现脑裂问题导致平台无法正常访问 1. 故障分析

首先通过在主备节点上分别执行crm status命令检查平台是否出现脑裂问题,如果主备节点已出现脑裂问题,检查同步分区配置文件(/etc/drbd.d/r0.res)中记录的盘符名称和现有系统盘盘符是否一致,出现脑裂问题大概率是由于服务器重启后系统盘的盘符变化导致。

2. 处理步骤

确定是由于系统盘盘符变化导致的双机脑裂,可以修改主备节点/etc/drbd.d/r0.res文件中的盘符名称为现在系统盘盘符的名称(比如配置文件中记录的是sdb5,现在的系统盘是sda,就将sdb5改成sda5),然后重启热备服务(service cmsd restart)。

5.1.36  VOI终端进行转移分组操作时报错“终端被使用,不允许改变匹配客户端类型” 1. 故障分析

当欲转移分组的VOI终端在默认终端分组中且已被添加到桌面池内时,不能再转移终端分组。

可以转移终端分组的情况:

·     相同类型的终端分组分组之间可以转移。

·     其它终端分组可以往默认终端分组转移。

2. 处理步骤

将终端从桌面池中移除后再将默认终端分组下的终端转移到其它终端分组。

注意:从桌面池移除终端有可能会影响已有用户数据,操作前务必做好数据备份工作。

5.1.37  平台升级时onestor precheck报错“rpm database check failed!” 1. 故障分析

rpm数据损坏,导致执行rpm -qa命令时报错,进而导致升级脚本precheck时报错。

图5-34 报错

 

2. 处理步骤

(1)     删除/var/lib/rpm文件下的__db.001、__db.002、__db.003三个文件。

(2)     执行rpm --rebuilddb命令重建rpm数据库(注意rebuilddb参数前面是两个横杠)。

5.1.38  管理平台关闭主管理节点内存大页失败,报错“大页正在被使用,禁止关闭” 1. 故障分析

管理节点有运行docker容器,docker使用虚拟文件系统,管理平台节点开启大页内存后,docker有概率使用到大页内存,导致页面关闭主机大页内存时报错“大页正在被使用,禁止关闭”。

2. 处理步骤

(1)     主管理节点提示大页正在被使用无法关闭时,使用命令查看下占用进程。

find /proc -name "smaps" | grep -i huge

(2)     确认下对应进程号是不是docker进程。

ps -ef | grep $pid

(3)     如果上一步查出来是docker进程,因为关闭大页内存,服务器需要重启生效,可以手动先将docker容器服务关闭。

service docker stop

(4)     在管理平台数据中心-虚拟化-集群-主机-高级设置页面,关闭大页,重启服务器。

(5)     如果在步骤(2)中没有docker进程,是其他程序在运行,比如智能网卡场景,要求必须使用大页内存,这种情况是不允许关闭大页内存的。

5.1.39  超融合环境,扩容主机时报错“将主机xxxxx添加到业务主机组异常” 1. 故障分析

超融合环境默认有名称为uistorHostGroup的业务主机组,如果手动将默认的该业务主机组删掉就会出现“将主机xxxx添加到业务主机组异常”的报错。

2. 处理步骤

在管理平台-ONEStor-块存储-卷映射-业务主机组页面,手动新建名称为uistorHostGroup的业务主机组,然后重新尝试扩容主机。

5.1.40  双机热备场景下,[系统/双机热备管理/共享存储]页面使用的是GlusterFS存储,在扩容业务节点后,该存储状态显示为不活动 1. 故障分析

[系统/双机热备管理/共享存储]页面使用GlusterFS存储,该存储状态复用GlusterFS双机热备存储集群的状态,扩容业务后GlusterFS双机热备存储集群状态显示为不佳,因此[系统/双机热备管理/共享存储]页面的存储状态显示为不活动。

2. 处理步骤

在[数据中心/教学存储配置/GlusterFS配置]页面,选择对应的双机热备存储进行修复。

5.1.41  双机热备场景下,镜像存储或者双机热备共享存储不活动,启动镜像存储或者双机热备共享存储时,提示目录已经被使用;后台检查该存储目录时,发现目录处于只读状态 1. 故障分析

此问题容易出现在超融合环境。

·     超融合环境下,手动重启集群中大部分存储节点,但是未重启管理节点时,可能导致镜像存储或者双机热备共享存储异常,无法自动恢复。

·     超融合环境下,如果有超过两台主机同时重启就会导致分布式存储异常,无法正常提供存储服务给管理节点使用。

2. 处理步骤

(1)     手动关闭占用镜像存储或者双机热备共享存储的相关进程,例如云盘,BT,终端监控等进程。可以通过命令“lsof 存储路径”查看进程。

(2)     使用df -h命令获取对应存储路径的文件系统信息,便于后续第(3)、(4)步使用。

(3)     使用umount命令手动卸载存储挂载点。

(4)     检测存储状态是否正常。例如使用iSCSI共享目录,则通过命令sudo fsck -fn /dev/mapper/360000000000000000e000000652c8f86(此路径为示例,现场需根据实际情况进行替换)进行检测。如果正常则继续执行第(6)步,如果异常则继续执行第(5)步。

(5)     如果第(4)步检测发现异常,则使用修复命令修复。

(6)     执行命令:sudo fsck -fy /dev/mapper/360000000000000000e000000652c8f86(此路径为示例,现场需根据实际情况进行替换)。

(7)     在管理平台中启动相关不活动的存储。

5.1.42  管理平台从低版本升级到新版本,低版本时,用户自定义了角色用于控制管理员的权限,并使用该角色新建了管理员,升级后使用该管理员登录平台,某些页面报403错误 1. 故障分析

由于新版本部分新权限在老版本中不具备,而版本升级时,并不会为在低版本中用户自定义的角色补充新加的权限,因此升级新版本后,使用低版本中自定义角色的管理员登录平台可能出现部分页面没有权限访问,导致报错403。

2. 处理步骤

使用超级管理员用户登录平台,并为自定义的角色添加需要的权限。

5.1.43  管理平台从E1009H10版本离线升级到E1013P11版本,升级前部署校园空间使用双机热备共享存储,部署完成后暂停该存储,平台升级后双机热备存储无法启动,报错:该磁盘不存在 1. 故障分析

暂停双机热备共享存储时,未结束占用该存储的进程,导致平台升级时multipathd更新多路径无法删除旧的map,导致双机热备共享存储多路径创建失败,无法访问。再次启动时会报错“该磁盘不存在”。

2. 处理步骤

(1)     后台通过命令"lsof 存储路径"查看双机热备共享存储是否被其他进程占用。

(2)     后台/var/log/messages日志中存在以下关键字,表明删除旧的map时存储被占用。以下日志中(360000000000000000e000000fce21051)表示一个存储,不同存储编号不同。

multipathd: 360000000000000000e000000fce21051: map in use

multipathd: 360000000000000000e000000fce21051: can't flush

multipathd: del map(360000000000000000e000000fce21051) faild before del all its paths

(3)     通过kill命令手动结束在步骤(1)中查询到的占用存储路径的进程。

(4)     通过systemctl restart multipathd命令重启多路径服务。

(5)     在管理平台中启动双机热备共享存储。

5.1.44  管理平台从低版本升级到E1013系列版本,有概率出现校园空间某功能(如共享空间、随堂测试)无法使用,并且尝试重启服务后问题依然存在 1. 故障分析

校园空间后台连接RabbitMQ服务失败,导致无法正常运行。查看/var/log/vdi/athena/athena-exam.log,报错“An unexpected connection driver error occured (Exception message: Connection reset)”。

2. 处理步骤

在管理平台[应用/校园空间]页面,单击按钮停止所有容器,单击校园空间业务容器操作列的按钮,删除该容器后单击按钮,重建所有容器。

5.2  License相关故障

License Server用于控制Workspace授权。当Workspace与License Server连接异常时,会导致Workspace无法获取授权,客户端连接桌面异常。以下几种情况可能导致Workspace无法获取授权:

·     License Server版本不符合要求。Workspace要求使用1145及以上版本的License Server进行对接。

·     购买的Workspace授权类型,与实际环境所需要的的授权类型不匹配。

·     Workspace与License Server的网络通信异常。环境中存在策略限制,或网络不通等情况。确认5555端口未做限制,检查是否有防火墙限制通信、是否有IP冲突等。

·     Workspace侧配置的客户端信息,与License Server界面配置的客户端信息不一致。

·     Workspace中管理授权的组件docker容器异常。为正常进行授权管理,首先需保证docker服务正常运行。其次,确保相关容器为正常运行状态。

·     Workspace侧绑定的License Server已更换,但之前使用过的License Server未正常断开连接。

5.2.1  连接License Server时提示“非法的使用场景”或“连接异常,请检查License服务器设置” 1. 故障现象

图5-35 连接License Server报错

https://zhiliao.h3c.com/uploads/t/20211115/16369654176319.png

 

2. 故障分析

(1)     确认授权类型是否正常:

¡     现场为办公场景,授权编码也适用于办公场景;

¡     授权为正式授权(连接License Server的情况下,需使用正式授权);

¡     环境服务器为X86服务器,授权也是X86的授权。

(2)     Workspace与License Server网络通信正常,客户端密码和License Server侧统一。

(3)     License Server可正常获取到授权。

(4)     docker容器都正常运行,docker ps -a可正常获取状态。

(5)     排查workspace.log发现日志中仍提示非法的使用场景,无其他有效信息。

(6)     进入Workspace数据库查看,发现数据库中记录了两条License Server的信息。因现场更换过License Server,且更换前,未在Workspace侧断开License Server的连接,导致License Server有连接残留。

3. 处理步骤

(1)     进入数据库中,查看licc库中的connection_cfg表是否有残留。(注意:操作数据库前,请先在前台界面备份Workspace配置)。发现数据库中记录的License Server IP与现在使用的License Server IP信息不一致,说明有残留信息。

mysql –uroot –p1q2w3e@4R

use licc;

图5-36 数据库记录信息

https://zhiliao.h3c.com/uploads/t/20211201/16383388791873.png

 

(2)     清理connetion_cfg,connection_info表,将connection_status表中login_status值修改0。

delete from connetion_cfg; delete from connection_info;

select * from connection_status;

update connection_status set login_status=0 where id=1;//id替换为上一步获取的实际ID

(3)     修改完成后,exit退出数据库。然后重新连接License Server,确认是否恢复正常。

5.2.2  License服务器断电后License Server无法连接,提示“连接异常,请检查License服务器设置” 1. 故障现象

图5-37 License Server无法连接

https://zhiliao.h3c.com/uploads/t/20210204/16124239511768.png

 

2. 故障分析

当License Server服务器异常或管理节点的liccmgr容器异常(liccmgr容器运行于docker容器)时,可能导致Workspace连接License Server服务器异常。

目前大部分局点License Server是以虚拟机的形式运行在Worksapce的业务节点上,所以首先要检查License Server虚拟机是否正常启动,以及License Server与管理节点的网络是否可达。在保证License Server服务器及网络正常的情况下,再排查管理节点liccmgr容器的状态。

(1)     通过ssh登录Worksapce管理节点后,执行docker ps –a命令查看下容器的状态。下图执行docker命令报错,说明docker服务异常。

图5-38 执行docker命令报错

https://zhiliao.h3c.com/uploads/t/20210204/16124247379671.png

 

(2)     执行systemctl status docker.service命令,检查docker服务的状态,发现docker服务未运行。

图5-39 执行systemctl status docker.service命令

https://zhiliao.h3c.com/uploads/t/20210204/16124248184750.png

 

3. 处理步骤

(1)     执行systemctl start docker.service命令手动拉起docker服务,然后检查docker服务的状态。

图5-40 执行systemctl start docker.service命令

https://zhiliao.h3c.com/uploads/t/20210204/16124251716520.png

 

(2)     docker正常运行后,执行dcoker ps –a命令查看liccmgr及其他容器是否正常。docker及其他容器是否正常运行后在前台刷新界面,重新连接License Server即可。

图5-41 执行dcoker ps –a命令

https://zhiliao.h3c.com/uploads/t/20210204/16124252365658.png

 

5.2.3  连接License Server报错“I/O error on POST request for.......” 1. 故障分析

(1)     前台点击连接License Server报错“I/O error on POST request for.......”,如图下图所示。

图5-42 连接License Server报错

https://zhiliao.h3c.com/uploads/t/20210210/16129255529073.png

 

(2)     Workspace连接License Server是有vdi-lcp容器完成,受限后台执行docker ps查看容器状态,发现vdi-lcp容器状态是Up,但是时间是8s之前Up起来,有可能该容器在震荡,持续通过docker ps观察,发现vdi-lcp容器在震荡。

图5-43 执行docker ps

https://zhiliao.h3c.com/uploads/t/20210210/16129258048908.png

 

(3)     执行docker exec -it vdi-lcp /bin/sh命令进入vdi-lcp容器中,发现进入容器一会就回自动退出。

(4)     执行下面命令进入数据库并查看method_lock表。

图5-44 查看method_lock表

https://zhiliao.h3c.com/uploads/t/20210210/16129261465733.png

 

¡     正常情况method_lock表是空的,如下图。

图5-45 method_lock表为空

https://zhiliao.h3c.com/uploads/t/20210210/16129269123278.png

 

¡     异常环境中method_lock表有数据,如下图。

图5-46 method_lock表有数据

https://zhiliao.h3c.com/uploads/t/20210210/16129269708278.png

 

2. 处理步骤

(1)     使用如下命令删除该异常数据。

图5-47 删除异常数据

https://zhiliao.h3c.com/uploads/t/20210210/16129269984541.png

 

(2)     执行select * from method_lock命令查看是否还有异常数据。

(3)     观察vdp-lcp容器是否还有震荡,如果没有,过几分钟之后再连接License Server。

5.2.4  管理平台连接License Server后提示获取到的授权为0 1. 故障分析

现场License Server是E1204版本,E12XX系列的License Server新增授权拥有者的功能,授权设置拥有者后,就只有拥有者对应的客户端能够获取到此授权,其它客户端就可能会出现获取到的授权为0的现象。

2. 处理步骤

登录License Server管理平台,检查授权是否设置了授权拥有者。只有授权的拥有者ID设置为defaultOwner或者对应客户端的ID,管理平台使用对应客户端连接License Server才能获取到正确数量的授权。

图5-48 License Server管理平台

 

5.3  外设故障 5.3.1  连接云桌面后,摄像头软件无法找到摄像头 1. 故障分析

可能是摄像头重定向服务没有运行或摄像头服务没有建立连接。

2. 处理步骤

·     若是摄像头重定向服务没有运行:云桌面中检查devredirect.exe是否在运行(任务管理器),Linux客户端检测devredirect是否再运行,Windows客户端检查devredirect.exe是否在运行。如果没有运行,请先手动启动服务,再重连桌面。

·     若是摄像头服务没有建立连接,请按照如下方法处理:

a.     检查云桌面中摄像头服务的日志,VdiAgent\Device Redirect\log\devredirect日期.log,看看有没有如下日志:VdiServiceServer::OnConnect: Peer socket info: “::ffff:10.125.17.137##50069”

b.     如果没有,则说明连接建立失败,尝试手动测试连接是否能成功建立。

c.     在终端浏览器中输入:http://[本地IP]:8090/control?cmd=connectserver&ip=[云桌面IP地址]。

d.     如果浏览器中返回结果:ok,说明连接成功;如果浏览器中返回结果:connect to server may failed,说明连接建立失败。这时有可能是云桌面内防火墙开启了,并且11998端口没有放行,可以将云桌面中的防火墙关闭后再重试。

5.3.2  摄像头重定向到云桌面后,摄像头应用软件播放画面卡顿、撕裂、丢帧 1. 故障分析

·     可能使用的是USB端口重定向,由于带宽不足或者无帧完整判断导致。摄像头设备使用USB端口重定向,带宽占用高,同时对网络延迟敏感,摄像头应用软件播放中可能会出现画面卡顿、撕裂、丢帧。

·     可能是云桌面配置过低。

2. 处理步骤

·     请在云桌面管理中心中确认配置的策略是否是摄像头重定向。云桌面中的设备管理器中,以“按连接列查看设备”,如果设备挂在“Virtual Usb Hub”下,说明是USB端口重定向。在管理平台更改策略为摄像头重定向。

·     云桌面(单核、双核,内存1G或2G)对于高清分辨率的解码/渲染能力不足,可能会出现CPU使用率过高(接近100%),导致画面卡顿等现象。请增加云桌面CPU、内存配置。

5.3.3  toolbar上点击挂载按钮,无法将磁盘重定向到云桌面中 1. 故障分析

云桌面中进入目录C:\Program Files (x86)\H3C\VdiAgent\Vdagent Tools\log,打开SDriverMapp开头的日志文件,查看日志中是否存在此信息:Can't install driver。

2. 处理步骤

如果存在则说明磁盘映射的驱动未成功安装。进入目录C:\Program Files (x86)\H3C\VdiAgent\Vdagent Tools,命令行中执行"vdinfsctl /i d"以及"vdinfsctl /i n",完成之后再次尝试挂载。

5.3.4  toolbar上显示已经挂载成功,但是云桌面中没有显示对应的网络驱动器 1. 故障分析

进入目录C:\Program Files (x86)\H3C\VdiAgent\Vdagent Tools,命令行中执行"vdinfsctl /l"查看云桌面中是否存在对应的磁盘。如果有对应的磁盘但是资源管理器中未显示,则尝试一下处理方案。

2. 处理步骤

重启explorer.exe进程。

5.3.5  云桌面中挂载好的网络驱动器名称显示错误 1. 故障分析

进入目录C:\Program Files (x86)\H3C\VdiAgent\Vdagent Tools,命令行中执行"vdinfsctl /l"查看云桌面中对应磁盘的名称是否正常,如果此处信息正常,只是资源管理器中显示错误。

2. 处理步骤

重启explorer.exe进程。

5.3.6  云桌面中进入映射的网络驱动器中时,刷新资源很慢,标题栏进度条进展缓慢 1. 故障分析

可能与杀毒软件相关。

2. 处理步骤

请将云桌面中的vdagent.exe以及客户端的VdSession.exe加入杀毒软件的实时监控排除列表中,重启系统后再次尝试操作。

5.3.7  在Toolbar中不能看到希望重定向的设备 1. 故障分析

(1)     可能在管理平台中关闭了该类设备的重定向功能。

(2)     在终端设备上测试重定向设备是否能正常被识别。

2. 处理步骤

在管理平台上查看是存在例外规则,对应的class是否与该设备匹配。删除管理平台上的例外规则或者将其修改为开启端口重定向。

5.3.8  在Toolbar中能看到希望重定向的设备,但无法点击进行重定向 1. 故障分析

(1)     确认云桌面是否异常。云桌面如果异常会导致客户端从管理平台获取的数据不正常,客户端不发起重定向请求。

(2)     确认云桌面内外设驱动是否正常。Vdi hub及vdi hub stub驱动

(3)     确认云桌面外设重定向服务是否正常启动。

(4)     确认云桌面与终端IP是否互相通。

2. 处理步骤

(1)     登录管理平台确认。

(2)     在云桌面设备管理器中确认是否存在vdi hub设备结点。

(3)     在云桌面中的服务里查看usb redirection服务是否正常运行。

(4)     终端与云桌面IP是否能相互ping通,并联系管理员进行云桌面处理。

(5)     在云桌面C:\Program Files (x86)\H3C\VdiAgent\Device Redirect\driver\目录内查找到对应操作系统的版本目录。NT6(win7x32)、NT6x64(win7x64)、NTx6_3(win10x32)、NT6_3x64(win10x64),顺序运行卸载命令、重启、安装命令。

¡     卸载命令:

-     setup_server.exe usb uninstall

-     setup_server.exe usb dpdelete

¡     重启命令:

-     setup_server.exe usb restart

¡     安装命令:

-     setup_server.exe usb install

(6)     在云桌面内对应目录C:\Program Files (x86)\H3C\VdiAgent\Device Redirect\运行以下命令:

¡     32位系统:

-     usbService.exe install

-     usbService.exe enable

¡     64位系统:

-     usbService64.exe install

-     usbService64.exe enable

5.3.9  重定向设备(主要是存储设备)在云桌面内,设备管理器中可见,但存在黄色叹号 1. 故障分析

(1)     双击问题设备,如果出现errorcode为10,该设备无法正常启动。

(2)     双击问题设备,如果出现errorcode为38,系统中已经存在一个实例。

2. 处理步骤

(1)     尝试插拔下该设备,看是否恢复。

(2)     该问题由于系统中存在对应pdo未删除干净导致,需要重启云桌面恢复。

5.3.10  外设无法重定向,故障原因不明

查看设备在本地工作是否正常,一键收集日志供进一步分析。

5.4  客户端安装或升级故障 5.4.1  能够自动下载客户端,但下载进度一直为0 1. 故障分析

升级版本下载优先使用BT下载方式,将从6881~7000端口范围选择端口启用监听,本故障通常是由于本地端口被占用或端口未放开。

2. 处理步骤

开放BT下载通信端口,或等待10分钟后程序自动切换为http下载方式。

5.4.2  出厂终端自带的SpaceOS系统,无法自动部署Workspace客户端应用程序 1. 故障分析

启动SpaceConfig程序,查看账户页签是否存在服务器地址,如果长时间未显示服务器地址,则客户端无法发现管理平台。

2. 处理步骤

·     排查通信网络启用组播转发协议。

·     SpaceConfig查看终端网络地址信息是否正常获取。

·     检查终端与管理平台网络通信是否正常。

·     可启动SpaceConfig程序,手动添加管理平台地址。

5.4.3  自启动的SpaceConfig程序终端标签页显示信息不完整 1. 故障分析

由于系统刚启动时网卡未准备好,程序获取信息失败。

2. 处理步骤

重启SpaceConfig程序。

5.4.4  终端能自动发现管理平台,但是无法自动下载客户端 1. 故障分析

通常是由于管理平台终端分组配置不当或本地多网络连接。

2. 处理步骤

联系管理员重新划分终端分组或将终端移动到指定分组,或者只开启一个网络连接。

5.4.5  管理平台部署后,终端无法自动下载客户端

(1)     检查终端网络正常,且终端网络和管理平台属于同一网络。

(2)     步骤1正确情况下,在管理平台终端页面,可以看到相应的终端信息。管理平台增加终端分组,规划网络处IP段覆盖终端IP,并选择正确的认证方式及匹配客户端类型。并将终端加入这个终端分组中。

(3)     若以上步骤完成后,终端还是不能自动下载客户端,在终端找到应用“配置程序”或“spaceConfig”,账户页面输入管理平台IP,终端可自动下载客户端。

5.5  客户端登录故障 5.5.1  启动Workspace客户端后弹窗提示“获取认证模式失败,请检查服务器配置是否正确”,输入用户名密码无法登录 1. 故障分析

通常由客户端与管理平台网络通信不正常造成。

2. 处理步骤

·     正确配置管理平台地址,检查客户端与管理平台间的网络连通性。

·     Windows 7系统版本较老或SSL版本太低造成通信不正常,可升级Windows版本。

5.5.2  客户端远程桌面断开后,快速再次连接该桌面,Workspace提示“启动超时,稍后重试” 1. 故障分析

相同远程桌面断开后,需等待5秒才能再次连接。

2. 处理步骤

等待片刻后再次点击连接云桌面。

5.5.3  客户端程序崩溃 1. 故障分析

当客户端程序运行过程中发生异常,运行程序将自动捕获异常并弹出【错误报告】窗口,该窗口可帮助用户反馈错误信息,包括收集日志,收集崩溃信息等,以便问题定位。使用过程中弹出错误报告窗口,说明客户端程序发生异常。

2. 处理步骤

(1)     在确保能收发邮件的情况下,正确填写管理员邮箱,描述操作现象,并点击发送,将发送邮件给管理员。

(2)     可使用导出功能导出错误信息,并联系管理员处理。

5.5.4  客户端无法正常连接云桌面 1. 故障分析

检查终端时间和服务器系统时间差距是否一致,以及服务器系统时间是否与现实时间一致,服务器系统时间与现实时间差异过大(比如正常时间是2022年,服务器系统时间却是2017年)会导致客户端无法正常连接云桌面。

2. 处理步骤

修改服务器系统时间,并且需要写入硬件时钟,使服务器系统时间与现实时间保持一致。

5.6  客户端连接和使用云桌面故障 5.6.1  用户首次在客户端登录云桌面,无法正常进入桌面 1. 故障分析

用户首次登录云桌面,由于云桌面还未初始化完成,云桌面重启后造成用户单点登录失败。

2. 处理步骤

单击Toolbar上断开按钮,断开云桌面连接后,稍等几秒钟再次连接,便可进入云桌面。

5.6.2  客户端连接云桌面突然断开,界面返回到Workspace程序界面 1. 故障分析

远程连接程序因网络通信故障退出。

2. 处理步骤

检查网络连通性,待网络恢复正常后重新连接远程桌面。

5.6.3  在使用远程桌面过程中,弹出“错误报告”窗口 1. 故障分析

远程连接程序运行过程中发生异常崩溃,请按照窗口提示填写反馈内容并发送给H3C技术支持,或者联系管理员处理。

2. 处理步骤

完成错误报告反馈后,重新连接远程桌面。

5.6.4  客户端无法连接桌面,使用微软mstsc(远程桌面链接)能连接桌面 1. 故障分析

网络原因或者云桌面缺少SPICE控制台。

2. 处理步骤

(1)     排查本地网络是否能ping通服务器(业务节点地址)。

(2)     联系管理员,添加spice控制台。

5.6.5  连接桌面,画面模糊,鼠标一直偏移 1. 故障分析

云桌面里vdagent组件异常。

2. 处理步骤

(1)     排查云桌面里设备管理器,显卡是否正常、是否带黄色叹号,如果有则需要联系管理员重装。

(2)     排查VdiAgent服务是否正确运行, 以win10为例,打开任务管理器,点击“打开服务”,查找到“VDIAgent”的服务,重启该服务。

(3)     在管理平台访问http://[云桌面IP]:9003,对日志进行收集,重启云桌面如果仍然无法解决,联系管理员重新安装agent组件。

(4)     本地分辨率设置,是否有放大的情况,必须保持100%。

5.6.6  无法双屏,本地两个显卡 1. 故障分析

云桌面是否添加了两块qxl显卡,显卡驱动是否正常。

2. 处理步骤

本地和云桌面显卡驱动是否正常(黄色叹号),通过dxdiag命令排查本地。

5.6.7  SpaceOS系统下客户端无法连接桌面 1. 故障分析

根目录下没有存储空间。

2. 处理步骤

释放根目录下部分根存储空间。

5.6.8  云桌面配置了双显卡,终端为双屏,但连接桌面后只显示单屏 1. 故障分析

配置云桌面双显卡后,要求对云桌面进行重启,如果云桌面开机状态增加显卡,可能会出现无法双屏情况。

2. 处理步骤

重启云桌面后可以正常双屏。

5.6.9  SpaceOS系统环境本地磁盘映射没有磁盘列表 1. 故障分析

通常是因为SpaceOS系统未提供可用的映射路径。

2. 处理步骤

检查/userdata/share/路径是否存在,并且确定该目录为SpaceOS用户权限,通常该目录不存在或者权限不正确,会出现没有映射磁盘的情况。

5.6.10  窗口化后,本地桌面闪烁 1. 故障分析

VdiAgent服务没有正常运行。

2. 处理步骤

重新启动Vdiagent服务。以Windows10为例,打开任务管理器,点击“打开服务”,查找到“VDIAgent”的服务,重启该服务。

 

5.6.11  终端复制文件或者文件夹,云桌面点击粘贴后没有反应 1. 故障分析

云桌面用户权限问题。登录用户必须是管理员权限。

2. 处理步骤

Windows7云桌面可以手动重新添加用户的管理员权限。Windows10云桌面以管理员权限启动vdagent。

5.6.12  鼠标操作没有响应 1. 故障分析

检查本地鼠标是否正常。

2. 处理步骤

若本地鼠标无响应,应排查是否是鼠标硬件问题;若本地鼠标正常,则一键采集日志供进一步分析。

5.6.13  云桌面崩溃 1. 故障分析

第三方软件异常有可能会引发云桌面蓝屏。云桌面出现蓝屏或异常重启。

2. 处理步骤

(1)     拍照记录蓝屏界面错误码信息。

(2)     采集蓝屏转储文件、一键采集日志、业务节点侧虚机日志供进一步分析。

5.6.14  云桌面卡顿 1. 故障分析

卡顿的原因有多种,通过控制台登录云桌面,若仍然卡顿,则排查业务节点负载。一般来讲在办公使用高峰期时业务节点负载较大。

2. 处理步骤

(1)     若业务节点负载较大,应调整云桌面部署,均衡负载,或者考虑扩容。

(2)     若业务节点服务器负载正常,则录制视频采集日志供下一步分析。

5.6.15  在云桌面中通过Office2007使用Excel时,选中整个表格后复制会报错“可用资源不足,EXCEL无法完成此任务”

当启用VDP剪切板功能后,客户端连接上云桌面后在Office2007的Excel中进行整表复制时会出现此问题。在策略中关闭VDP剪切板功能后即可以解决此问题。

5.6.16  云桌面开机启动慢,进入桌面后打开软件鼠标一直转圈,很长时间才能打开

处理步骤:检查云桌面内部是否安装有保密或者安全管控软件,若有,则尝试卸载安全软件或使用纯净云桌面进行对比测试。

说明

多个局点曾出现过安装安全保密软件导致其它软件打开异常的问题。

 

5.6.17  Windows Defender病毒库将优化工具误报为病毒或潜在的垃圾软件,导致优化工具无法运行 1. 故障分析

问题为Windows系统误报,关闭Windows Defender的实时保护功能后即可解决。

图5-49 问题现象

 

2. 处理步骤

进入Windows设置页面,依次单击[更新和安全/Windows安全中心/病毒和威胁防护]菜单项,进入病毒与威胁防护设置页面关闭实时保护,才能正常运行优化工具。

5.6.18  客户端连接共享桌面时画面黑屏,黑屏超过30秒后断开连接 1. 故障分析

客户端连接共享桌面时画面黑屏,黑屏超过30秒(默认连接超时时间)后断开连接。查看用户终端本地目录“C:\Users\用户名\Documents\VdSession\log\”下以freerdp开头的日志文件,日志中提示“Timeout waiting for activation”,说明问题是由于连接超时导致。

2. 处理步骤

管理员在用户终端本地文档目录中新建配置文件rdpconfig.ini,例如Windows系统终端目录为C:\Users\用户名\Documents\VdSession\,SpaceOS系统终端目录为/home/user/Documents/VdSession/。并在配置文件中设置超时时间(如下图所示,设置值需大于30000),配置完成后即可重新连接共享桌面。

图5-50 设置超时时间

 

5.6.19  从云桌面中拷贝大量Excel数据时,弹出报错“可用资源不足,Excel无法完成此任务。请少选择一些数据或关闭其他应用程序” 1. 故障分析

·     Excel版本过低。

·     云桌面中的剪贴板程序访问Excel复制的内容,导致报错。

·     Excel复制的内容超过最大限制。

2. 处理步骤

·     升级Excel到2013(15.0.4569.1504)及更高版本。

·     在管理平台策略组页面,配置禁止从云桌面复制内容到终端的策略,并授权给云桌面。

·     少复制几行内容。

5.7  vGPU、多媒体故障 5.7.1  创建云桌面添加了vGPU却无法使用GPU 1. 故障分析

这种情况通常是由于在制作镜像时没有安装显卡驱动或者驱动版本错误导致。

2. 处理步骤

联系管理员重新制作带显卡驱动的镜像。

5.7.2  带vGPU的云桌面连接时出现画质比本地稍微模糊的情况 1. 故障分析

这是因为vGPU云桌面客户端默认采用硬件解码YUV420,YUV420算法的有损压缩特性,导致画质会有一定模糊,而硬件解码不支持解码YUV444。

2. 处理步骤

在本地客户端性能足够的情况下,可通过客户端toolbar设置中的“体验”选项切换软解。

5.7.3  带vGPU的云桌面在切换为软解时,出现卡顿现象 1. 故障分析

这通常是因为客户端本地硬件软解性能不足导致。

2. 处理步骤

通过客户端toolbar设置中的“体验”选项切换为硬解,也可切换为自适应来自动判断是否支持软解。

5.7.4  云桌面播放视频没有声音 1. 故障分析

可能是由于没有添加声卡设备,或没有连接音频设备。

2. 处理步骤

·     联系管理员添加显卡设备,并安装声卡驱动。

·     安装音频设备。

5.7.5  vGPU云桌面黑屏 1. 故障分析

可能是云桌面的抓图进程异常,导致桌面数据无效。

2. 处理步骤

联系管理员重启VGPUCapturer进程,结束进程后,此进程会自动重启。

5.7.6  vGPU云桌面,单屏转双屏,副屏黑屏 1. 故障分析

可能是QXL显卡未被禁用。

2. 故障分析

联系管理员禁用QXL驱动设备,在[虚拟化/虚拟机/修改虚拟机]页面,删除掉QXL显卡。

5.7.7  MPC播放器无法重定向播放 1. 故障分析

(1)     客户端上视频重定向开关未打开。

(2)     MPC播放器未使用配套版本。

(3)     云桌面用户无管理员权限。

2. 处理步骤

客户端打开视频重定向开关,使用服务器上配套版本MPC播放器(http://服务器IP:8083/download/software/),给用户添加管理员权限。

5.7.8  MPC播放器提示找不到音频设备 1. 故障分析

云桌面未添加音频设备且未优化。

2. 处理步骤

云桌面添加音频设备并进行优化。

5.7.9  视频重定向播放卡顿/不流畅 1. 故障分析

视频文件的码率大于带宽。

2. 处理步骤

扩充物理带宽。

5.7.10  vGPU帧率上不去 1. 故障分析

Capture抓图设置了最大帧率。

2. 处理步骤

如对高帧率有要求,则修改配置文件C:\Program Files (x86)\H3C\VdiAgent\Vgpu\config\ vGPU_Configure,适当增大CaptureRateNum配置项并重启VGPUCapturer进程。

5.7.11  拖动窗口卡顿 1. 故障分析

可能是开启了窗口效果:拖动时显示窗口内容。

2. 处理步骤

右键我的电脑->系统属性->高级->性能->视觉效果,去除勾选“拖动时显示窗口内容”后确定。

图5-51 去除勾选“拖动时显示窗口内容”

 

5.7.12  新部署的云桌面没有自动加载H5扩展或重定向不成功 1. 故障分析

新部署的云桌面当前用户下没有chrome配置文件,首次打开chrome浏览器后才能在当前用户下生成配置文件,修改配置后,需要重启chrome浏览器生效。

2. 处理步骤

新部署的云桌面,需要打开并关闭一次chrome浏览器,才能自动加载扩展。

5.7.13  云桌面使用IE浏览器打开Flash网页卡顿 1. 故障分析

可能是Flash插件版本较低导致。

2. 处理步骤

安装较新版本的Flash插件。

5.7.14  C113播放视频没有画面 1. 故障分析

在云桌面重定向或者成流播放出现黑屏。

2. 处理步骤

一键收集日志并提供给H3C技术支持分析。

5.7.15  C113打开视频短暂黑屏(能自动恢复) 1. 故障分析

检查视频连接线是否为VGA。

2. 处理步骤

如果是VGA线,则替换成HDMI可解决。然后一键收集日志,并提供给H3C技术支持分析。

5.7.16  C100接入HDMI无声音播放设备显示器进行视频重定向,关闭MPC播放器后,VdSession进程无响应 1. 故障分析

C100接入HDMI无声音播放设备的显示器(如HP N240)后,客户端播放声音播放设备会识别为HDMI显示器的声音设备,会导致系统没有声音,进一步导致视频重定向出现问题。

2. 处理步骤

在终端上,打开播放设备选择页面,选择非HDMI显示器的播放设备即可。

5.8  主机故障 5.8.1  节点故障或网络不通 1. 故障分析

(1)     打开故障节点的OSD日志。

(2)     查看是否存在类似以下的日志。

no reply from osd.10 since back 2017-05-03 02:55:15.983994 front 2017-05-03 02:55:15.983994 (cutoff 2017-05-03 02:59:38.312660)

(3)     该日志说明,osd.10所在的节点网络不通。

2. 处理步骤

(1)     检查是否存储IP冲突。

(2)     使用ping osd.10所在的节点IP,检查是否有网络通信故障,如跨交换机、网线或光纤虚接、光模块故障等。

(3)     检查是否有交换机网络生成树状态迁移。

5.8.2  硬盘或RAID卡故障

处理步骤:

(1)     如果RAID卡是HP的,可以采用hpssacli controller all show config detail,根据结果来判断是RAID Failed还是Disk Failed(请参考文章中硬盘的操作方法)。

(2)     最简单的方法是执行:python /var/lib/ceph/shell/check_disk_param.py list_disk_info,完成后在异常的OSD目录下查看osd_disk_info.ini文件,例如osd.2故障:vi /var/lib/ceph/osd/ceph-2/osd_disk_info.ini,可查看是否存在类似以下的内容;

[raid]

slot = 1

status = OK

vendor = HP

controller_mode = raid

cache_ratio = 10% Read / 90% Write

power_mode = h

total_cache_size = 4.0 GB

 

[osd]

filestore_queue_max_ops = 300

journal_queue_max_ops = 300

osd_client_message_cap = 300

disk_name = /dev/sdb

logical_name = LOGICALVOLUME

mount_point = /var/lib/ceph/osd/ceph-1

 

[device0]

id = 2I:1:1

status = OK

max_temp = 46

serial_number = W7J4ZZ7G

disk_speed = 10000

disk_type = SAS

curr_temp = 34

size = 600 GB

(3)     尝试修复文件系统,以OSD.10异常为例:

a.     执行mount命令,记录osd.10挂载的设备,假如为/dev/sdh

b.     执行umount /dev/sdh

c.     执行xfs_check /dev/sdh1,如果有错误信息打印,说明XFS文件系统损坏,继续修复

d.     执行修复命令:xfs_repair –L /dev/sdh1 等执行完毕

e.     重新启动osd,先挂载:mount –t xfs /dev/sdh1 /var/lib/ceph/osd/ceph-10

f.     start ceph-osd id=10,等集群恢复即可

5.8.3  节点暂无数据

(1)     执行free -g,如果cache过大,清理缓存:echo 3 > /proc/sys/vm/drop_caches。

(2)     每个OSD应该至少分配1G内存,如果OSD的数量超过内存容量的三分之二,需要增加内存。

5.8.4  高可用IP通但是IO不通 1. 故障分析

集群比较繁忙,tgt发给ceph的IO超时,没有读写成功。可通过观察/var/log/syslog日志观察是否有-110错误,如下:

Mar  8 11:39:47 wy-ost209 iscsid: cannot make a connection to 90.90.90.128:3260 (-1,101)

Mar  8 11:39:58  iscsid: last message repeated 3 times

Mar  8 11:39:58 wy-ost209 tgtd: procaioresp(221) io error 0x1f33160 28 -110

Mar  8 11:39:58 wy-ost209 tgtd: target_cmd_done(1520) rsp for abort task

Mar  8 11:39:59 wy-ost209 iscsid: cannot make a connection to 90.90.90.128:3260 (-1,101)

Mar  8 11:40:13  iscsid: last message repeated 4 times

2. 处理步骤

减轻业务压力,或者增大集群性能(可以增加节点硬盘)。

5.8.5  扫描添加主机时找不到主机或添加失败

在如下情况中,可能存在主机扫描不到或着添加失败的问题:

(1)     主机从其它管理节点异常删除,再加入另外一个管理节点。

(2)     异常删除若残留配置文件/etc/cvk/cvm_info.conf,会导致界面不显示该主机,删除该文件即可扫描出来。

(3)     主机曾经添加过管理节点:比如三台新装的主机,每台都执行过初始化的网络配置步骤。

(4)     添加管理节点后,会有一个/root/.ssh/isCvmFlag文件,导致主机不能被发现,删除即可。

(5)     扫描主机是以序列号为准的,相同序列号的主机只能被发现一次。比如云桌面的序列号都是Not Specified,所以加入一台云桌面以后,后面云桌面就不能被发现了(主机发现)。

(6)     如果发现界面只能扫除管理节点或者一台都没有,在/var/log/tomcat8/cas.log搜索某台主机的序列号,如果在对应时间没有搜到该序列号,可能是脚本安装有问题。

5.8.6  删除主机提示删除失败,实际删除成功 1. 故障分析

(1)     在该主机上执行lsblk命令查看是否有osd未被umount。

图5-52 执行lsblk命令

 

(2)     可以看到有分区残留,查看该osd目录是否被打开。确定该问题是由于删除主机时打开了主机下的osd目录。

2. 处理步骤

(1)     使用cd命令退出该osd目录,然后手动执行umount /var/lib/ceph/osd/ceph-11即可。

(2)     执行sgdisk –zap-all /dev/sdf 格式化分区。

图5-53 格式化分区

 

5.8.7  主机无可用硬盘 1. 故障分析

(1)     使用lsblk查看想要添加的硬盘,查看硬盘已有分区,再使用gdisk  -l /dev/xxx (xxx为盘符名称)命令,查看硬盘分区中有ceph标识。

图5-54 ceph标识

 

(2)     则认为此硬盘已被使用。

2. 处理步骤

若确认此硬盘未被用户使用,只是之前残留导致,则使用ceph-disk zap /dev/xxx(xxx为盘符名称)清除残留数据后,再尝试添加。

图5-55 清除残留数据

 

5.8.8  删除存储节点过程中,由于误操作拔出该存储节点对应的OSD,导致读缓存残留 1. 故障分析

集群开启闪存加速,删除存储节点过程中,拔出该存储节点对应的osd,节点删除成功后,发现被拔出的osd会残留读缓存分区,插回该osd,再次添加该存储节点进原集群后,发现osd对应的读缓存分区重新挂载了,而且原残留读缓存还在,造成读缓存浪费。

2. 处理步骤

(1)     插回硬盘后,如果发现该硬盘残留缓存分区,如下:

图5-56 硬盘残留缓存分区

 

(2)     如果要将该节点重新加入集群且避免缓存浪费,需要手动删除缓存分区,执行命令dmsetup remove adeb6765-dcb7-437a-807e-ad6e0b6aaced(如果删除失败,建议重启)。

图5-57 手动删除缓存分区

 

(3)     在handy界面上重新添加该节点到集群中,添加成功,且无残留缓存分区。

图5-58 重新添加

 

5.8.9  无法扫描到主机

(1)     网络排查:确保主机管理接口与管理节点的管理口处于同一局域网。

(2)     主机管理接口对应的交换机端口配置了端口聚合:

¡     如果配置了静态端口聚合,需要shutdown其中一个端口,待主机扫描完成后再up端口。

¡     如果配置了动态端口聚合,需要配置端口为边缘端口(lacp edge-port)。

(3)     集群曾经初始化失败过:需要查看每个业务节点中是否有文件残留。查看 /etc/cvk下的cvm_info文件和/root/.ssh下的mhost文件,如果文件存在,需要执行以下命令手动删除。

rm –rf cvm_info

rm –rf mhost

(4)     要加入的主机曾经做过管理节点:查看/root/.ssh下是否存在isCvmFlag文件,如果文件存在,需要执行以下命令手动删除。

rm –rf isCvmFlag

5.8.10  备机和业务节点免密异常

查看异常节点的/root/.ssh/id_rsa文件权限是否是644,如果是会导致免密异常。重新关闭开启虚拟化下的集群HA进行规避。

5.9  其他 5.9.1  配置认证服务器进行连接测试,提示网络通信异常或LDAP服务器错误

(1)     检查管理平台与认证服务器网络通信正常。

(2)     去掉安全控制,进行连接测试,若测试通过,确认认证服务器证书安装正常,然后勾选安全控制进行连接测试。

5.9.2  超融合环境服务器异常断电重启或网络变动,主机恢复正常后虚拟机启动失败

(1)     查看共享存储,若存储异常则查看服务器,保证服务器接入的万兆存储网口与初始化时服务器接入的万兆存储网口一致。

(2)     登录其中一台服务器后端ping其他服务器节点的存储内外网络地址,保证通信无异常后,启动存储使其运行正常。虚拟机可成功启动并使用。

5.9.3  用户使用盲水印策略,在云桌面内截图后上传,解析出来没有设置的水印内容

(1)     首先查看云桌面内有无盲水印bwmark进程,该进程就是云桌面内盲水印的进程,没有该进程则盲水印策略未生效。

(2)     如果有进程,确保图片格式是否正确,推荐使用png格式。

5.9.4  C113终端升级SpaceOS系统后无法开机,黑屏或停留在启动logo

将终端断电两次,可正常进入系统。

5.9.5  双机热备环境搭建失败

搭建双机热备环境需要提前规划,在管理平台初始化完成后直接搭建,确保搭建双机热备前不向磁盘写入数据。

5.9.6  超融合环境模板创建在共享存储目录,重启主机后模板不可用

管理平台[镜像/桌面镜像/镜像存储]页面,查看镜像存储状态是否正常,如果存储为非活动状态,启动存储。如果无法启动,参考5.9.7  。

5.9.7  共享存储启动失败,报错 internal error ocfs the mountpoint hace to be an empty directory

共享存储目录被占用(被备份目录占用),先将备份目录重命名后重启存储。

5.9.8  外挂存储异常导致Workspace上存储显示不活动,后台查看发现存储只读

(1)     恢复外挂存储。

(2)     确定不活动的存储。如果是虚拟化集群共享存储显示不活动,则在[数据中心/虚拟化/集群/主机/存储适配器]页面,单击,然后在主机存储页面下尝试启动该共享存储。

(3)     如果是双机热备共享存储或模板存储,则有两种恢复方法:

方法一:

a.     在主管理节点后台执行命令:df –h,显示结果示例如下。

b.     使用umount命令卸载共享存储,如:umount /iscsi/for_ha。

c.     暂停使用存储的服务,例如:云盘、bt服务,可通过下面两个命令查看占用进程。

lsof /iscsi/for_image/

fuser -m /iscsi/for_image/

手动执行命令修复存储:fsck.ext4 /dev/mapper/360000000000000000e0000009ccb0773

d.     管理平台Web页面点击启用共享存储。

方法二:

a.     暂停使用存储的服务,例如:云盘、bt服务,可通过下面两个命令查看占用进程。

lsof /iscsi/for_image/

fuser -m /iscsi/for_image/

b.     页面上删除不活动的共享存储。

c.     重新添加该存储,这时可能会提示格式化存储,但不能点击格式化,取消后再次添加即可,存储路径保持不变。(注意操作此步骤需要谨慎)

5.9.9  胖终端分辨率异常,通过鼠标操作桌面时存在无法点击或点击无效的情况 1. 故障分析

终端所用镜像未进行二级镜像制作导致显卡未生效或显卡驱动安装错误,从而引发终端分辨率异常。此时,若管理平台开启了盲水印策略,则盲水印将遮盖桌面部分区域导致鼠标操作桌面时无效或无法操作的情况。

2. 处理步骤

可使用如下两种方法解决:

·     在管理平台关闭盲水印策略。

·     远程连接桌面修改分辨率或安装相关驱动,使终端分辨率正常。

6 故障处理救助

当用户遇到无法解决的故障时,可参考本章内容进行故障处理求助。

6.1  故障处理求助准备

拨打故障处理求助电话前,请准备好以下信息:

·     故障现象记录表

·     基本信息收集表

·     H3C Workspace系统日志

·     基础测试记录表

·     自主排障操作记录

6.2  故障处理求助电话

用户支持邮箱:[email protected]

技术支持热线电话:400-810-0504(手机、固话均可拨打)



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3