腾讯云CVM服务器实例自助检测_新手站长网_云淘科技

概述

实例自助检测可检测云服务器实例的性能、费用、网络、磁盘等状态,并可帮助您了解实例的运行状态。您可通过该功能及时发现并解决实例的相关问题。

使用场景

以下两种场景推荐使用实例自助检测:故障处理:如在实例操作过程中遇到故障或问题,可使用实例自助检测进行问题排查及定位,并根据相应建议对异常情况进行处理。实例全面检测:日常运维过程中,可使用实例自助检测了解实例的整体运行状况,及时发现并解决问题,保障业务正常运行。

检测项说明

实例自助检测项目说明如下:本地网络检测

检测项 检测说明 风险等级 解决方案
网络延迟 本地网络延迟是指您的电脑与腾讯云服务器的 PING 值(电脑发送数据到服务器反馈数据的时间),用于检查网络之间的传输延迟。通过发送 HTTP 请求检测实例网络延迟是否过高。标准如下:大于600ms则判断为网络较差超过5s没有响应则认为此请求超时请求全部超时则判断为网络不通 异常 建议您检查本地网络,并对应具体问题进行修复,或者切换到其他网络。
网络抖动 获取相邻请求的延时值差,其平均值为网络抖动值。网络抖动值/网络延时值小于等于0.15则表示网络稳定,大于0.15则表示网络有波动。
上行带宽 上传数据包至实例,以计算实例上行带宽
下行带宽 从实例下载数据包,以计算实例下行带宽


安全组规则检测

检测项 检测说明 风险等级 解决方案
安全组规则是否放通常用端口 是否为安全组原因导致入方向的 TCP 协议的22、3389等常用端口的请求被禁止。 警告 实例安全组中入站(Ingress)规则的 TCP 协议的22端口的请求被禁止,可能会导致无法正常 SSH 登录。可放通所需端口,详情请参见 安全组应用案例。


账户费用检测

检测项 检测说明 风险等级 解决方案
云硬盘是否过期,实例与云硬盘到期时间是否一致 实例关联的云硬盘是否已过期,是否无法读写使用云硬盘 异常 该实例的云硬盘已经过期,请前往 云硬盘控制台 尽快续费。
按量计费实例与非自动续费包年包月的云硬盘,是否因云硬盘过期而无法使用云硬盘 警告 该实例的云硬盘未设置自动续费,可能出现云硬盘过期导致不可用,建议前往 云硬盘控制台 设置云硬盘自动续费。
自动续费的包年包月实例与非自动续费的包年包月云硬盘,是否因云硬盘过期而无法使用云硬盘 警告
非自动续费的包年包月实例和非自动续费的包年包月云硬盘,是否因两者的截止日期不一致,导致云硬盘过期无法使用 警告 该实例与其挂载的云硬盘到期时间不一致,可能出现云硬盘过期导致不可用,建议前往 云硬盘控制台 设置云硬盘自动续费。


实例存储检测

检测项 检测说明 风险等级 解决方案
云硬盘是否出现高延时 IO 性能 svctm 指标是否异常 警告 该实例云硬盘出现了高延时问题,建议您关注云硬盘使用情况。
云硬盘是否出现 IO HANG 云硬盘是否出现 IO HANG 警告 该实例云硬盘出现了 IO HANG 问题,建议您关注云硬盘使用情况。
系统盘 inode 使用率 云硬盘的 inode 使用率是否已达100% 警告 请您关注云硬盘使用情况,故障处理请参见 内核及 IO 相关问题。
系统盘是否只读 云硬盘当前是否处于只读状态 异常
系统盘空间使用率 云硬盘的磁盘使用率是否已达100% 警告
磁盘分区有 IO 操作的时间与总时间的百分比 云硬盘的 io_util 是否已达100% 警告


实例网络检测

检测项 检测说明 风险等级 解决方案
外网 IP 是否欠费不通 外网 IP 是否欠费隔离 异常 外网 IP 可能因为欠费导致无法与外网互通,建议您前往 费用中心 尽快对账户进行充值续费。
是否有外网 IP 实例是否有外网 IP 警告 该实例没有外网 IP,如您需要外网 IP 进行外网访问,可前往 弹性公网 IP 控制台 绑定 EIP。
外网 IP 是否被 DDOS 封堵 外网 IP 是否被 DDOS 封堵 异常 该实例外网 IP 由于遭受 DDOS 攻击被封堵,请参考 解封防护 IP 文档进行处理。
外网带宽使用率 实例是否在最近12小时内出现过外网入带宽过高 警告 为避免成为业务瓶颈,建议您检查网络使用情况。故障处理请参见 带宽占用高导致无法登录。
实例是否在最近12小时内出现过外网出带宽过高 警告
内网带宽使用率 实例是否在最近12小时内出现过内网入带宽过高 警告
实例是否在最近12小时内出现过内网出带宽过高 警告
丢包情况 实例最近12小时内是否触发限速导致 TCP 丢包 警告 为避免成为业务瓶颈,建议您检查业务健康情况。详情请参见 云服务器网络访问丢包。
实例最近12小时内是否触发限速导致 UDP 丢包 警告
实例最近12小时内是否触发软中断丢包 警告
内核网络情况 实例是否在最近12小时内出现过 UDP 发送缓冲区满 警告
实例是否在最近12小时内出现过 UDP 接收缓冲区满 警告
实例是否在最近12小时内出现过 TCP 全连接队列满 警告
实例是否在最近12小时内出现过 TCP 请求溢出 警告
连接数使用情况 实例是否在最近12小时内出现过连接数达到上限 警告


Linux 主机内部检测

检测项 检测说明 风险等级 解决方案
SSH登录相关 sshd 是否禁止密码方式登录 /etc/ssh/sshd_config 文件中 ssh_password_authentication 是否为 yes 警告 sshd 配置已禁止密码登录,如需开放密码方式登录,请参考 处理步骤。
sshd 是否禁止 root 用户登录 /etc/ssh/sshd_config 文件中 ssh_permit_root_login 是否为 yes 警告 sshd 已禁止 root 用户登录,如需开放 root 用户登录,请参考 处理步骤。
sshd 私钥文件权限 /etc/ssh/ssh_host_rsa_key 文件权限是否有误 警告 ssh_host_rsa_key 权限配置有误,请参考 处理步骤 进行修复。
/var/empty/sshd 权限 /var/empty/sshd 权限是否错误 严重 /var/empty/sshd 权限配置有误,导致无法登录,请参考 处理步骤 进行修复。
hosts_deny 配置 /etc/hosts.deny 配置文件是否包含特殊登录规则 警告 /etc/hosts.deny 配置文件中包含特殊限制规则,可能导致无法登录,请参考 处理步骤 进行修复。
root 用户 shell 配置 /etc/passwd 文件中 shell 配置是否错误 严重 /etc/passwd 文件 root 用户的 bash 配置有误,导致无法登录,请参考 处理步骤 进行修复。
wtmp 或 btmp 文件 /var/log/wtmp 或 /var/log/btmp 文件是否过大 警告 /var/log/wtmp 或 /var/log/btmp 文件过大可能会导致登录缓慢,需清空对应文件,请参考 VNC 登录输入正确密码后无响应 进行修复。
sshd 进程依赖的动态库 sshd 进程依赖的动态库是否存在 严重 sshd 进程依赖的动态库不存在,导致无法登录,请参考 处理步骤 修复。
/etc/profile 调用 /etc/profile 是否存在 /etc/profile 调用 /etc/profile 死循环 严重 /etc/profile 调用 /etc/profile 死循环,导致无法登录,请参考 /etc/profile 死循环调用问题 修复。
sshd 进程 sshd 进程是否存在 严重 sshd 进程不存在,需启动对应的 sshd 服务,请参考 处理步骤 修复。
网络配置相关 网卡队列数 网卡队列数是否未能全部开启 警告 网卡队列数是能全部开启,导致实例无法发挥最大网络性能,请参考 网卡多队列配置错误问题 修复。
NAT 环境内核参数 是否因内核网络配置不规范,导致 NAT 环境丢包 警告 配置了 tcp_tw_recycle,则在 NAT 环境可能导致丢包,请参考 Linux 实例常用内核参数介绍 临时去除。
操作系统环境相关 系统 limits 设置 /etc/security/limits.conf 配置是否异常 警告 /etc/security/limits.conf 配置异常,可能导致无法登录,请参考 处理步骤 修复。
系统 OOM 系统最近是否出现过 OOM 严重 系统出现过 OOM,建议评估内存使用是否合理或提升机型配置,请参考 实例内存使用率过高 排查及解决。
selinux 是否开启 实例 selinux 是否开启 警告 开启 selinux 可能导致无法登录,建议先参考 处理步骤 关闭 selinux。
pid 是否耗尽 实例 pid 是否耗尽 严重 系统 pid 即将耗尽,可能导致系统异常。建议评估系统启动的线程是否合理或调大系统的 pid_max,请参考 处理步骤 修复。
cloud-init 环境 cloud-init 环境是否正常 严重 cloud-init 环境异常,可能会导致无法正常重置密码、修改主机名等,建议参考 Linux 系统安装 cloud-init 重装 cloud-init。
文件系统基本信息 /etc/fstab 相关配置及文件系统检查 警告 /etc/fstab 配置了不存在的分区,实例重启后会导致启动失败,请参考 Linux 云服务器重启后云硬盘未自动挂载 排查及解决。
系统进入紧急模式 /etc/fstab 相关配置是否异常 严重 /etc/fstab 相关配置异常可能导致系统进入紧急模式,请参考 /etc/fstab 配置错误导致无法登录 排查及解决。
防火墙检测 防火墙规则是否异常 警告 iptables policy 设置了 drop 规则,则会导致网络联通异常,请参考 iptables policy 设置相关规则 排查及解决。
启动配置相关 bin lib 软链接 bin lib 软链接是否缺失 严重 bin lib 软链接有缺失,可能导致系统异常,请参考 系统 bin 或 lib 软链接缺失 重建对应软链接。
大页内存配置 是否开启了大页内存 警告 系统内开启了大页内存,可能导致系统异常。请参考 sysctl.conf 配置大页内存 排查是否为业务程序配置,若不是则实例可能已被入侵。
动态库劫持配置 是否配置了动态库劫持 警告 系统内配置了动态库劫持,可能导致系统异常。请参考 ld.so.preload 增加动态库劫持 排查是否为业务程序配置,若不是则实例可能已被入侵。
系统资源使用率相关 CPU 使用率是否过高 是否存在 CPU 使用率超过80%的进程 警告 CPU 使用率过高,建议评估是否合理或提升机型配置,请参考 CPU 或内存占用率高导致无法登录 排查及解决。
内存使用率是否过高 是否存在内存使用率超过80%的进程 警告 内存使用率过高,建议评估是否合理或提升机型配置,请参考 CPU 或内存占用率高导致无法登录 排查及解决。
文件系统 inode 使用率是否过大 文件系统 inode 使用率是否已超过95% 警告 磁盘空间使用率过大,可能导致系统异常,无法写入数据。建议评估是否可以删除部分文件或扩容硬盘大小,请参考 解决硬盘空间已满问题 修复。
文件系统空间使用率是否过大 磁盘空间使用率是否已超过95% 警告 磁盘 inode 使用率过大,可能导致系统异常,无法写入数据。建议评估是否可以删除部分文件或扩容硬盘大小,请参考 解决文件系统 inode 满问题 修复。


Windows 主机内部检测

检测项 检测说明 风险等级 解决方案
操作系统环境相关 Windows 操作系统版本 Windows 操作系统是否为 Windows Server 2008 R2及更早版本系统 警告 Windows Server 2008 R2及更早版本系统在安全性、稳定性和兼容性方面均较差,且微软和腾讯云也已不再进行维护。建议参考 处理步骤 备份数据并重装 Windows Server 2016或更高版本系统。
内存限制 是否设置了内存限制 警告 系统安装内存未得到充分利用,解除内存限制请参考 处理步骤。
CPU 限制 是否设置了 CPU 限制 警告 系统分配 CPU 未得到充分利用,解除 CPU 限制请参考 处理步骤。
句柄泄露 句柄数是否正常 警告 可能存在进程句柄泄露,请参考 处理步骤 排查及解决。
系统暴力破解和攻击 系统是否存在大量暴力破解和攻击 警告 系统可能因暴力破解或攻击存在卡顿或打挂影响正常业务,甚至有丢数据风险。请参考 安全组概述 通过控制台合理设置安全组策略,只放通必要的 IP 和端口。
系统环境变量 系统环境变量是否正常 警告 缺少系统环境变量或环境变量异常,请参考 处理步骤 进行修复。
系统激活 系统是否已被激活 警告 系统未激活,请参考 处理步骤 进行系统激活。
系统时间 系统时间是否正确 警告 系统时间异常,请参考 处理步骤 进行修复。
系统路由表 系统默认路由是否缺失 警告 系统缺少默认路由,请参考 处理步骤 进行修复。
系统 IE 代理 系统是否设置 IE 代理 警告 系统已设置 IE 代理,请参考 处理步骤 进行排查。
CD-ROM 状态 系统 CD-ROM 设备是否正常 警告 CD-ROM 异常,控制台重置密码需使用 CD-ROM,请参考 处理步骤 进行修复。
系统资源使用率相关 内存使用率是否过高 是否存在内存使用率超过80%的进程 警告 系统内存使用率过高,请参考 处理步骤 进行排查。
虚拟内存使用率是否过高 虚拟内存资源是否不足 严重 系统虚拟内存使用率过高,请参考 处理步骤 进行修复。
总 CPU 使用率过高 是否存在总 CPU 使用率超过80%的进程 警告 系统 CPU 使用率过高,请参考 处理步骤 进行排查。
单 CPU 使用率过高 是否存在单 CPU 使用率超过80%的进程 警告 单个逻辑 CPU 使用率过高,请参考 处理步骤 进行排查。
磁盘可用空间不足 磁盘使用率是否超过95%或者磁盘可用空间不足5GB 警告 磁盘可用空间不足,请参考 处理步骤 进行修复。
NTFS 系统元文件 NTFS 元文件磁盘占比是否过高 警告 NTFS 元文件占比过高,请参考 处理步骤 进行修复。
远程连接相关 远程桌面服务状态 远程桌面服务状态是否异常 警告 远程桌面服务状态异常,请参考 处理步骤 进行排查。
远程桌面服务端口 远程桌面服务端口是否监听默认3389端口 警告 远程桌面服务端口未监听,请参考 处理步骤 进行修复。
RDP 侦听器 RDP 侦听器是否启用 严重 RDP 侦听器未启用,无法远程登录,请参考 处理步骤 进行修复。
允许远程桌面连接 是否允许远程桌面连接 严重 RDP 被禁用,无法远程登录,请参考 处理步骤 进行修复。
RDP 自签证书到期时间 RDP 自签证书是否到期 严重 RDP 自签证书过期,可能无法远程登录,请参考 处理步骤 进行修复。
远程桌面服务角色安装及授权 是否具备安装远程桌面服务角色和导入授权 警告 已开启多用户登录功能,且未导入 License,请参考 处理步骤 进行修复。
网络访问账户 网络访问本地账户的共享和安全模型是否为 forceguest 严重 网络访问账户仅为来宾,无法远程登录,请参考 处理步骤 进行修复。
远程桌面服务端口防火墙放通 防火墙是否放通远程桌面服务 警告 Windows 内部防火墙未放通远程桌面服务端口,无法远程登录,请参考 处理步骤 进行修复。
网络配置相关 端口耗尽 TCP 和 UDP 端口数是否已耗尽 严重 可用端口已耗尽,请参考 处理步骤 进行修复。
Timewait/Closewait 连接数 Timewait/Closewait 连接数是否正常 警告 Timewait/Closewait 连接数异常,可能导致无法远程登录,请参考 处理步骤 进行修复。
网关状态 网关状态是否正常 警告 网关状态异常,请参考 处理步骤 进行修复。
MAC 地址 是否为系统默认 MAC 地址 严重 MAC 地址非系统默认,请参考 处理步骤 进行修复。
内网域名解析 腾讯云内网域名是否可以正常解析 警告 内网域名无法解析,请参考 处理步骤 进行修复。


实例状态检测

检测项 检测说明 风险等级 解决方案
实例是否已关机 目前实例是否已关机 警告 实例已关机,您可前往 云服务器控制台 开机。
实例是否重启 实例是否在最近在12小时内出现过重启 警告 该实例在最近12小时内出现重启,请您关注实例运行状态。
实例内核崩溃 实例是否在最近12小时内出现过 hungtask 异常 该实例在最近12小时内出现 hungtask/panic/软死锁,请您关注实例运行状态。故障处理请参见 内核及 IO 相关问题。
实例是否在最近12小时出现过 panic 异常
实例是否在最近12小时内出现过软死锁 异常


实例性能检测

检测项 检测说明 风险等级 解决方案
CPU 使用情况 实例是否在最近12小时内出现过 CPU 负载过高 警告 为避免成为业务瓶颈,建议您检查 CPU 使用情况,并及时调整配置。故障处理则请对应实例操作系统,参考以下文档:Windows 实例:CPU 或内存占用率高导致无法登录Linux 实例:CPU 或内存占用率高导致无法登录
内存使用情况 实例是否在最近12小时内出现过内存负载过高 警告
基础 CPU 使用情况 实例是否在最近12小时内出现过 CPU 负载过高 警告



相关操作

您可参考 使用实例自助检测 生成实例检测结果报告,或查看历史检测报告。

对腾讯云CVM服务器有疑惑?想了解产品收费? 联系解决方案专家

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心,购买腾讯云享受折上折,更有现金返利:同意关联,立享优惠

阿里云解决方案也看看?: 点击对比阿里云的解决方案

本文来自投稿,不代表新手站长_郑州云淘科技有限公司立场,如若转载,请注明出处:https://www.cnzhanzhang.com/16069.html

(0)
匿名
上一篇 2023年9月1日 上午10:06
下一篇 2023年9月1日 上午10:36

相关推荐

新手站长从“心”出发,感谢16年您始终不离不弃。