工程师接到客户报修电话,一台Linux系统磁盘使用率异常。df -h 发现磁盘使用率为100%,重启后再次尝试df -h,磁盘使用率仍为100%。通过lsof查看没有应用程序占用已删除的数据;du -sh /查看/目录下占用的空间与实际磁盘使用率不一致,相差很大,磁盘无可用空间存储数据。
客户一台Linux系统频繁重启,工程师接到报修电话后登录查看,发现日志中大量的oom,内存溢出告警,每次重启后,不启动任何应用程序,主机内存很快被占满;同时其余客户端使用sftp传输数据,经常因内存溢出导致传输失败,影响业务。
某客户TSM备份值班人员报告TSM server 某个驱动器工作异常,备份仅一个通道可以使用,部分schedule因没有通道导致备份失败。
客户反馈一套业务数据库经常出现卡慢,甚至输入字符也会出现延迟效果,重新启动后,数据库查询速度得到提升,但随着使用频次增加,速度再次变慢。检查所有JSP网页发现,记录集、statement和数据库连接都已被释放。
合法买球平台接到客户服务请求,到达现场发现ceph状态报警,提示其中某一个pg状态报错,造成服务响应缓慢,涉及osd.1。
客户一台IBM P750主机,PowerVM 环境,其中一个VIOC在日常监控中发现CPU使用率有上升趋势。
某客户应用生产系统是使用两节点Oracle RAC数据库环境,6月19日应用运维人员对其进行数据清理和导数操作后,两个数据库节点的CPU使用率频繁达到90%以上,并持续了近10天,严重影响后续任务的执行。
GbE2c以太网刀片交换机需要变更并备份配置,但交换机的管理密码丢失,无法登录对设备进行管理,所以需要重置交换机管理密码。
合法买球平台接到IBM P780小型机故障报修,工程师远程诊断后,推断是稳压模块故障。进行更换后,小型机开机,但资源缺少,造成部署在此小型机的部分业务系统不能运行。
某客户对一套VMware上的Linux主机进行内存扩容,但在VMware端操作完成后,系统内无法完整识别新增加的内存,容量缺失一部分。