2月16日凌晨,MOC值守的合肥某三甲医院接到告警信息。
查看服务器的硬盘使用指标详情页面时,看到F盘的容量是100G, 当前剩余磁盘空间400G,磁盘空间应该足够满足业务需求。然而打开F盘使用情况时序图,却发现F盘存在一个异常现象:
就这样,F盘空间不足,数据备份失败,但是运维工程师浑然不知。
案例中,MOC专家通过指标参数时序图发现F盘空间不足。时序图方便运维工程师掌握在无人值守时,IT设备的运行情况;同时也能做到智能异常检测;容量趋势告警等。
医院运维的难点在于业务系统错综复杂,数据庞大、资产分布广,数据安全敏感。高度依赖信息系统稳定和安全运营。具有以下特点:
-
设备多、分布广,巡检工作量大,极易错检、漏检;
-
缺乏系统预警,无法预知设备运行状况;
-
故障处理无序状态,依赖个人技术、手工,分散运维,风险系数高。
医院拥有硬件设备、网络设备、数据库、中间件等多种资产,分别由不同的供应商提供维护服务。 LinkSLA智能运维管家通过统一部署实现数据中心一体化监控和智能化运维,将所有的监控资源和对象统一采集,建立底层基础架构到上层业务应用的关联关系,在设备发生故障时,快速分析设备对业务系统造成的影响,有效降低故障风险。
LinkSLA智能运维管家可开箱即用,省去大量分级部署,迅速完成数据库、中间件、容器环境。大大提高运维效率。
AI学习算法围绕业务指标及数据规律,自动调整阈值,减少大量的误报、漏报、重复报。在业务数据上,提供一套完整的、处理分析与发现问题的算法。通过智能算法或规则实现异常监测,告警降噪,避免传统工具带来的告警风暴,集成告警事件工单,让故障得到快速响应。
分类清晰、逻辑简单,提高巡检效率,降低人力消耗。
集成微信、邮件消息引擎,及时接收告警信息。
报表中心提供自助式图标和看板,帮助运维人员展示工作量,总结汇报。
声明:本文由南京林科斯拉原创发布,转载请注明。
联系我们:电话 400-828-1855。