运维常见软件问题排查与修复

更新的补丁导致系统或者应用软件崩溃

案例: 微软 Win10频频翻车,多个补丁都引发了较大数量的蓝屏故障,其实重启后,卸载补丁也就没事了。但是当年赛门铁克误杀门,崩溃的电脑和服务器,真是不计其数。

 

正确的做法是 :补丁要先给测试机更新,两三天后,没什么问题,再大面积部署,即便如此,还是要定期做好系统的状态备份,万一有事儿,还能快速恢复。

 


No.2 病毒及恶意程序的破坏

尽管部署了企业级的硬件防火墙、专业级的安全软件,对于病毒及恶意程序,也不能掉以轻心。

 

病毒和恶意程序破坏,往往是不可修复的,常见的病毒或者恶意程序,我们能用防火墙成功隔离或者安全软件成功查杀。

 

但是每隔一段时间,总会有个超级病毒,能穿过各种安全设备和软件,对我们的系统造成破坏,致使我们蒙受巨大的损失:

 

比如疯狂的勒索病毒,很多公司的服务器都中招了,有的迫于数据的重要性,只能给黑客付钱,还必须是比特币!也有的付了钱,都没能拿回所有的数据。

 

所以重要的数据文件,冷备份很有必要 !即准备一台电脑或者服务器,只在定期备份的时候开机,备份完毕立即关机,确保数据安全。

 


No.3 同时安装多个功能类似的安全软件

有些 IT盲目自信,服务器上不安装任何安全软件,也有些IT人员在服务器(或者电脑)上安装功能类似或者重复的安全软件。

 

殊不知,这会造成系统混乱、不稳定,有的在服务器同时安装两款国产的杀毒软件后,操作系统直接无法启动了,只能进入安全模式强制卸载其中一款,才解决问题。

 

所以说, 杀毒软件、安全助手类软件,同一台服务器或者电脑上,最好只安装一款

 


No.4 同时安装同一软件的多个版本

案例: 经常接到客户的求助,说是 xx软件突然打不开了,细问才知,原来是同一软件装了两三个版本,卸载其中一个版本后,另一个版本也无法运行了。

 

其实这种情况应该是在软件卸载的时候,删除了相关的系统文件,导致另外一个版本缺少关键文件,也就无法运行了;

 

想要覆盖安装还不一定能行,有时候会提示软件已存在,那就只能卸载重装,或者选择修复。

 

个人电脑无所谓,最多麻烦一点,几次重装而已,但是服务器上要安装同一软件的多个版本,就要慎重了。

 

强烈建议 先用虚拟机测试,确定没问题,再正式安装

 

 


总结

 

以上故障修复的一般思路和通用策略,而现实遇到的问题都是千差万别的,每个问题的处理都不尽相同。

 

只有理解故障发生的规律、掌握故障管理的方法,做好复盘和改进,持续归纳总结和反思,才能做好对故障的管理。

 

既然无法彻底摆脱它,那就理解它、掌控它吧!


请使用浏览器的分享功能分享到微信等