概述
实例自助检测可检测云服务器实例的性能、费用、网络、磁盘等状态,并可帮助您了解实例的运行状态。您可通过该功能及时发现并解决实例的相关问题。
使用场景
以下两种场景推荐使用实例自助检测:故障处理:如在实例操作过程中遇到故障或问题,可使用实例自助检测进行问题排查及定位,并根据相应建议对异常情况进行处理。实例全面检测:日常运维过程中,可使用实例自助检测了解实例的整体运行状况,及时发现并解决问题,保障业务正常运行。
检测项说明
实例自助检测项目说明如下:本地网络检测
检测项 | 检测说明 | 风险等级 | 解决方案 |
网络延迟 | 本地网络延迟是指您的电脑与腾讯云服务器的 PING 值(电脑发送数据到服务器反馈数据的时间),用于检查网络之间的传输延迟。通过发送 HTTP 请求检测实例网络延迟是否过高。标准如下:大于600ms则判断为网络较差超过5s没有响应则认为此请求超时请求全部超时则判断为网络不通 | 异常 | 建议您检查本地网络,并对应具体问题进行修复,或者切换到其他网络。 |
| 网络抖动 | 获取相邻请求的延时值差,其平均值为网络抖动值。网络抖动值/网络延时值小于等于0.15则表示网络稳定,大于0.15则表示网络有波动。 | – |
| 上行带宽 | 上传数据包至实例,以计算实例上行带宽 | – |
| 下行带宽 | 从实例下载数据包,以计算实例下行带宽 | – |
安全组规则检测
检测项 | 检测说明 | 风险等级 | 解决方案 |
安全组规则是否放通常用端口 | 是否为安全组原因导致入方向的 TCP 协议的22、3389等常用端口的请求被禁止。 | 警告 | 实例安全组中入站(Ingress)规则的 TCP 协议的22端口的请求被禁止,可能会导致无法正常 SSH 登录。可放通所需端口,详情请参见 安全组应用案例。 |
账户费用检测
检测项 | 检测说明 | 风险等级 | 解决方案 |
云硬盘是否过期,实例与云硬盘到期时间是否一致 | 实例关联的云硬盘是否已过期,是否无法读写使用云硬盘 | 异常 | 该实例的云硬盘已经过期,请前往 云硬盘控制台 尽快续费。 |
| 按量计费实例与非自动续费包年包月的云硬盘,是否因云硬盘过期而无法使用云硬盘 | 警告 | 该实例的云硬盘未设置自动续费,可能出现云硬盘过期导致不可用,建议前往 云硬盘控制台 设置云硬盘自动续费。 |
| | 自动续费的包年包月实例与非自动续费的包年包月云硬盘,是否因云硬盘过期而无法使用云硬盘 | 警告 |
| 非自动续费的包年包月实例和非自动续费的包年包月云硬盘,是否因两者的截止日期不一致,导致云硬盘过期无法使用 | 警告 | 该实例与其挂载的云硬盘到期时间不一致,可能出现云硬盘过期导致不可用,建议前往 云硬盘控制台 设置云硬盘自动续费。 |
实例存储检测
检测项 | 检测说明 | 风险等级 | 解决方案 |
云硬盘是否出现高延时 | IO 性能 svctm 指标是否异常 | 警告 | 该实例云硬盘出现了高延时问题,建议您关注云硬盘使用情况。 |
云硬盘是否出现 IO HANG | 云硬盘是否出现 IO HANG | 警告 | 该实例云硬盘出现了 IO HANG 问题,建议您关注云硬盘使用情况。 |
系统盘 inode 使用率 | 云硬盘的 inode 使用率是否已达100% | 警告 | 请您关注云硬盘使用情况,故障处理请参见 内核及 IO 相关问题。 |
系统盘是否只读 | 云硬盘当前是否处于只读状态 | 异常 | |
系统盘空间使用率 | 云硬盘的磁盘使用率是否已达100% | 警告 | |
磁盘分区有 IO 操作的时间与总时间的百分比 | 云硬盘的 io_util 是否已达100% | 警告 | |
实例网络检测
检测项 | 检测说明 | 风险等级 | 解决方案 |
外网 IP 是否欠费不通 | 外网 IP 是否欠费隔离 | 异常 | 外网 IP 可能因为欠费导致无法与外网互通,建议您前往 费用中心 尽快对账户进行充值续费。 |
是否有外网 IP | 实例是否有外网 IP | 警告 | 该实例没有外网 IP,如您需要外网 IP 进行外网访问,可前往 弹性公网 IP 控制台 绑定 EIP。 |
外网 IP 是否被 DDOS 封堵 | 外网 IP 是否被 DDOS 封堵 | 异常 | 该实例外网 IP 由于遭受 DDOS 攻击被封堵,请参考 解封防护 IP 文档进行处理。 |
外网带宽使用率 | 实例是否在最近12小时内出现过外网入带宽过高 | 警告 | 为避免成为业务瓶颈,建议您检查网络使用情况。故障处理请参见 带宽占用高导致无法登录。 |
| | 实例是否在最近12小时内出现过外网出带宽过高 | 警告 |
| 内网带宽使用率 | 实例是否在最近12小时内出现过内网入带宽过高 | 警告 |
| | 实例是否在最近12小时内出现过内网出带宽过高 | 警告 |
丢包情况 | 实例最近12小时内是否触发限速导致 TCP 丢包 | 警告 | 为避免成为业务瓶颈,建议您检查业务健康情况。详情请参见 云服务器网络访问丢包。 |
| | 实例最近12小时内是否触发限速导致 UDP 丢包 | 警告 |
| | 实例最近12小时内是否触发软中断丢包 | 警告 |
| 内核网络情况 | 实例是否在最近12小时内出现过 UDP 发送缓冲区满 | 警告 |
| | 实例是否在最近12小时内出现过 UDP 接收缓冲区满 | 警告 |
| | 实例是否在最近12小时内出现过 TCP 全连接队列满 | 警告 |
| | 实例是否在最近12小时内出现过 TCP 请求溢出 | 警告 |
| 连接数使用情况 | 实例是否在最近12小时内出现过连接数达到上限 | 警告 |
Linux 主机内部检测
检测项 | 检测说明 | 风险等级 | 解决方案 | |
SSH登录相关 | sshd 是否禁止密码方式登录 | /etc/ssh/sshd_config 文件中 ssh_password_authentication 是否为 yes | 警告 | sshd 配置已禁止密码登录,如需开放密码方式登录,请参考 处理步骤。 |
| sshd 是否禁止 root 用户登录 | /etc/ssh/sshd_config 文件中 ssh_permit_root_login 是否为 yes | 警告 | sshd 已禁止 root 用户登录,如需开放 root 用户登录,请参考 处理步骤。 |
| sshd 私钥文件权限 | /etc/ssh/ssh_host_rsa_key 文件权限是否有误 | 警告 | ssh_host_rsa_key 权限配置有误,请参考 处理步骤 进行修复。 |
| /var/empty/sshd 权限 | /var/empty/sshd 权限是否错误 | 严重 | /var/empty/sshd 权限配置有误,导致无法登录,请参考 处理步骤 进行修复。 |
| hosts_deny 配置 | /etc/hosts.deny 配置文件是否包含特殊登录规则 | 警告 | /etc/hosts.deny 配置文件中包含特殊限制规则,可能导致无法登录,请参考 处理步骤 进行修复。 |
| root 用户 shell 配置 | /etc/passwd 文件中 shell 配置是否错误 | 严重 | /etc/passwd 文件 root 用户的 bash 配置有误,导致无法登录,请参考 处理步骤 进行修复。 |
| wtmp 或 btmp 文件 | /var/log/wtmp 或 /var/log/btmp 文件是否过大 | 警告 | /var/log/wtmp 或 /var/log/btmp 文件过大可能会导致登录缓慢,需清空对应文件,请参考 VNC 登录输入正确密码后无响应 进行修复。 |
| sshd 进程依赖的动态库 | sshd 进程依赖的动态库是否存在 | 严重 | sshd 进程依赖的动态库不存在,导致无法登录,请参考 处理步骤 修复。 |
| /etc/profile 调用 /etc/profile | 是否存在 /etc/profile 调用 /etc/profile 死循环 | 严重 | /etc/profile 调用 /etc/profile 死循环,导致无法登录,请参考 /etc/profile 死循环调用问题 修复。 |
| sshd 进程 | sshd 进程是否存在 | 严重 | sshd 进程不存在,需启动对应的 sshd 服务,请参考 处理步骤 修复。 |
网络配置相关 | 网卡队列数 | 网卡队列数是否未能全部开启 | 警告 | 网卡队列数是能全部开启,导致实例无法发挥最大网络性能,请参考 网卡多队列配置错误问题 修复。 |
| NAT 环境内核参数 | 是否因内核网络配置不规范,导致 NAT 环境丢包 | 警告 | 配置了 tcp_tw_recycle,则在 NAT 环境可能导致丢包,请参考 Linux 实例常用内核参数介绍 临时去除。 |
操作系统环境相关 | 系统 limits 设置 | /etc/security/limits.conf 配置是否异常 | 警告 | /etc/security/limits.conf 配置异常,可能导致无法登录,请参考 处理步骤 修复。 |
| 系统 OOM | 系统最近是否出现过 OOM | 严重 | 系统出现过 OOM,建议评估内存使用是否合理或提升机型配置,请参考 实例内存使用率过高 排查及解决。 |
| selinux 是否开启 | 实例 selinux 是否开启 | 警告 | 开启 selinux 可能导致无法登录,建议先参考 处理步骤 关闭 selinux。 |
| pid 是否耗尽 | 实例 pid 是否耗尽 | 严重 | 系统 pid 即将耗尽,可能导致系统异常。建议评估系统启动的线程是否合理或调大系统的 pid_max,请参考 处理步骤 修复。 |
| cloud-init 环境 | cloud-init 环境是否正常 | 严重 | cloud-init 环境异常,可能会导致无法正常重置密码、修改主机名等,建议参考 Linux 系统安装 cloud-init 重装 cloud-init。 |
| 文件系统基本信息 | /etc/fstab 相关配置及文件系统检查 | 警告 | /etc/fstab 配置了不存在的分区,实例重启后会导致启动失败,请参考 Linux 云服务器重启后云硬盘未自动挂载 排查及解决。 |
| 系统进入紧急模式 | /etc/fstab 相关配置是否异常 | 严重 | /etc/fstab 相关配置异常可能导致系统进入紧急模式,请参考 /etc/fstab 配置错误导致无法登录 排查及解决。 |
| 防火墙检测 | 防火墙规则是否异常 | 警告 | iptables policy 设置了 drop 规则,则会导致网络联通异常,请参考 iptables policy 设置相关规则 排查及解决。 |
启动配置相关 | bin lib 软链接 | bin lib 软链接是否缺失 | 严重 | bin lib 软链接有缺失,可能导致系统异常,请参考 系统 bin 或 lib 软链接缺失 重建对应软链接。 |
| 大页内存配置 | 是否开启了大页内存 | 警告 | 系统内开启了大页内存,可能导致系统异常。请参考 sysctl.conf 配置大页内存 排查是否为业务程序配置,若不是则实例可能已被入侵。 |
| 动态库劫持配置 | 是否配置了动态库劫持 | 警告 | 系统内配置了动态库劫持,可能导致系统异常。请参考 ld.so.preload 增加动态库劫持 排查是否为业务程序配置,若不是则实例可能已被入侵。 |
系统资源使用率相关 | CPU 使用率是否过高 | 是否存在 CPU 使用率超过80%的进程 | 警告 | CPU 使用率过高,建议评估是否合理或提升机型配置,请参考 CPU 或内存占用率高导致无法登录 排查及解决。 |
| 内存使用率是否过高 | 是否存在内存使用率超过80%的进程 | 警告 | 内存使用率过高,建议评估是否合理或提升机型配置,请参考 CPU 或内存占用率高导致无法登录 排查及解决。 |
| 文件系统 inode 使用率是否过大 | 文件系统 inode 使用率是否已超过95% | 警告 | 磁盘空间使用率过大,可能导致系统异常,无法写入数据。建议评估是否可以删除部分文件或扩容硬盘大小,请参考 解决硬盘空间已满问题 修复。 |
| 文件系统空间使用率是否过大 | 磁盘空间使用率是否已超过95% | 警告 | 磁盘 inode 使用率过大,可能导致系统异常,无法写入数据。建议评估是否可以删除部分文件或扩容硬盘大小,请参考 解决文件系统 inode 满问题 修复。 |
Windows 主机内部检测
检测项 | 检测说明 | 风险等级 | 解决方案 | |
操作系统环境相关 | Windows 操作系统版本 | Windows 操作系统是否为 Windows Server 2008 R2及更早版本系统 | 警告 | Windows Server 2008 R2及更早版本系统在安全性、稳定性和兼容性方面均较差,且微软和腾讯云也已不再进行维护。建议参考 处理步骤 备份数据并重装 Windows Server 2016或更高版本系统。 |
| 内存限制 | 是否设置了内存限制 | 警告 | 系统安装内存未得到充分利用,解除内存限制请参考 处理步骤。 |
| CPU 限制 | 是否设置了 CPU 限制 | 警告 | 系统分配 CPU 未得到充分利用,解除 CPU 限制请参考 处理步骤。 |
| 句柄泄露 | 句柄数是否正常 | 警告 | 可能存在进程句柄泄露,请参考 处理步骤 排查及解决。 |
| 系统暴力破解和攻击 | 系统是否存在大量暴力破解和攻击 | 警告 | 系统可能因暴力破解或攻击存在卡顿或打挂影响正常业务,甚至有丢数据风险。请参考 安全组概述 通过控制台合理设置安全组策略,只放通必要的 IP 和端口。 |
| 系统环境变量 | 系统环境变量是否正常 | 警告 | 缺少系统环境变量或环境变量异常,请参考 处理步骤 进行修复。 |
| 系统激活 | 系统是否已被激活 | 警告 | 系统未激活,请参考 处理步骤 进行系统激活。 |
| 系统时间 | 系统时间是否正确 | 警告 | 系统时间异常,请参考 处理步骤 进行修复。 |
| 系统路由表 | 系统默认路由是否缺失 | 警告 | 系统缺少默认路由,请参考 处理步骤 进行修复。 |
| 系统 IE 代理 | 系统是否设置 IE 代理 | 警告 | 系统已设置 IE 代理,请参考 处理步骤 进行排查。 |
| CD-ROM 状态 | 系统 CD-ROM 设备是否正常 | 警告 | CD-ROM 异常,控制台重置密码需使用 CD-ROM,请参考 处理步骤 进行修复。 |
系统资源使用率相关 | 内存使用率是否过高 | 是否存在内存使用率超过80%的进程 | 警告 | 系统内存使用率过高,请参考 处理步骤 进行排查。 |
| 虚拟内存使用率是否过高 | 虚拟内存资源是否不足 | 严重 | 系统虚拟内存使用率过高,请参考 处理步骤 进行修复。 |
| 总 CPU 使用率过高 | 是否存在总 CPU 使用率超过80%的进程 | 警告 | 系统 CPU 使用率过高,请参考 处理步骤 进行排查。 |
| 单 CPU 使用率过高 | 是否存在单 CPU 使用率超过80%的进程 | 警告 | 单个逻辑 CPU 使用率过高,请参考 处理步骤 进行排查。 |
| 磁盘可用空间不足 | 磁盘使用率是否超过95%或者磁盘可用空间不足5GB | 警告 | 磁盘可用空间不足,请参考 处理步骤 进行修复。 |
| NTFS 系统元文件 | NTFS 元文件磁盘占比是否过高 | 警告 | NTFS 元文件占比过高,请参考 处理步骤 进行修复。 |
远程连接相关 | 远程桌面服务状态 | 远程桌面服务状态是否异常 | 警告 | 远程桌面服务状态异常,请参考 处理步骤 进行排查。 |
| 远程桌面服务端口 | 远程桌面服务端口是否监听默认3389端口 | 警告 | 远程桌面服务端口未监听,请参考 处理步骤 进行修复。 |
| RDP 侦听器 | RDP 侦听器是否启用 | 严重 | RDP 侦听器未启用,无法远程登录,请参考 处理步骤 进行修复。 |
| 允许远程桌面连接 | 是否允许远程桌面连接 | 严重 | RDP 被禁用,无法远程登录,请参考 处理步骤 进行修复。 |
| RDP 自签证书到期时间 | RDP 自签证书是否到期 | 严重 | RDP 自签证书过期,可能无法远程登录,请参考 处理步骤 进行修复。 |
| 远程桌面服务角色安装及授权 | 是否具备安装远程桌面服务角色和导入授权 | 警告 | 已开启多用户登录功能,且未导入 License,请参考 处理步骤 进行修复。 |
| 网络访问账户 | 网络访问本地账户的共享和安全模型是否为 forceguest | 严重 | 网络访问账户仅为来宾,无法远程登录,请参考 处理步骤 进行修复。 |
| 远程桌面服务端口防火墙放通 | 防火墙是否放通远程桌面服务 | 警告 | Windows 内部防火墙未放通远程桌面服务端口,无法远程登录,请参考 处理步骤 进行修复。 |
网络配置相关 | 端口耗尽 | TCP 和 UDP 端口数是否已耗尽 | 严重 | 可用端口已耗尽,请参考 处理步骤 进行修复。 |
| Timewait/Closewait 连接数 | Timewait/Closewait 连接数是否正常 | 警告 | Timewait/Closewait 连接数异常,可能导致无法远程登录,请参考 处理步骤 进行修复。 |
| 网关状态 | 网关状态是否正常 | 警告 | 网关状态异常,请参考 处理步骤 进行修复。 |
| MAC 地址 | 是否为系统默认 MAC 地址 | 严重 | MAC 地址非系统默认,请参考 处理步骤 进行修复。 |
| 内网域名解析 | 腾讯云内网域名是否可以正常解析 | 警告 | 内网域名无法解析,请参考 处理步骤 进行修复。 |
实例状态检测
检测项 | 检测说明 | 风险等级 | 解决方案 |
实例是否已关机 | 目前实例是否已关机 | 警告 | 实例已关机,您可前往 云服务器控制台 开机。 |
实例是否重启 | 实例是否在最近在12小时内出现过重启 | 警告 | 该实例在最近12小时内出现重启,请您关注实例运行状态。 |
实例内核崩溃 | 实例是否在最近12小时内出现过 hungtask | 异常 | 该实例在最近12小时内出现 hungtask/panic/软死锁,请您关注实例运行状态。故障处理请参见 内核及 IO 相关问题。 |
| | 实例是否在最近12小时出现过 panic | 异常 |
| | 实例是否在最近12小时内出现过软死锁 | 异常 |
实例性能检测
检测项 | 检测说明 | 风险等级 | 解决方案 |
CPU 使用情况 | 实例是否在最近12小时内出现过 CPU 负载过高 | 警告 | 为避免成为业务瓶颈,建议您检查 CPU 使用情况,并及时调整配置。故障处理则请对应实例操作系统,参考以下文档:Windows 实例:CPU 或内存占用率高导致无法登录Linux 实例:CPU 或内存占用率高导致无法登录 |
| 内存使用情况 | 实例是否在最近12小时内出现过内存负载过高 | 警告 |
| 基础 CPU 使用情况 | 实例是否在最近12小时内出现过 CPU 负载过高 | 警告 |
相关操作
您可参考 使用实例自助检测 生成实例检测结果报告,或查看历史检测报告。
对腾讯云CVM服务器有疑惑?想了解产品收费? 联系解决方案专家
腾讯云限时活动1折起,即将结束: 马上收藏
同尘科技为腾讯云授权服务中心,购买腾讯云享受折上折,更有现金返利:同意关联,立享优惠
阿里云解决方案也看看?: 点击对比阿里云的解决方案
本文来自投稿,不代表新手站长_郑州云淘科技有限公司立场,如若转载,请注明出处:https://www.cnzhanzhang.com/16069.html