ITSS运维能力
运维基础
信息技术服务标准(ITSS)
- 标准化意义
- IT服务相关标准
ITSS系列标准介绍
运维阶段的主要任务包括对系统和服务的调研评估、例行操作、响应支持和优化改善以及性能监视、事件和问题识别和分类,并报告系统和服务的运行情况等。
- 通用要求
-
交付规范
-
交付内容
例行操作
响应支持
优化改善
调研评估
-
- 交付方式
远程或现场
- 交付成果
- 应急响应规范
能力模型与能力管理
运维能力模型
概述:
运行维护服务时供方依据需方提出的服务级别要求,采用相关的方法、手段、技术、制度、过程和文档等,针对运行维护服务对象提供的综合服务。
要素:
四个关键要素,人员、资源、技术和过程
关键指标:
参考要素
管理原则:
通过策划、实施、检查和改进实现运行维护服务能力的持续提升
策划
【标准规定】
根据自身业务定位和能力,策划运行维护服务对象的服务内容与要求,形成服务目录
依据组织的业务发展需求来建立组织结构和管理制度,支持服务目录的实施或实现
对人员、资源、技术和过程进行规划,建立与之相适应的指标体系和服务保障体系
策划如何管理、审核并改进服务质量,建立内部审核评估机制
- 服务目录
- 能力计划
- 能力指标
实施
【标准规定】
制定满足整体策划的实施计划,并按计划实施
建立与需方的沟通协调机制
按照服务能力要求实施管理活动并记录,确保服务能力管理和服务过程实施可追溯,服务结果可计量或可评估
提交满足质量要求的交付物
- 实施计划
- 沟通方式
检查
【标准规定】
定期评审服务过程及相关管理体系,以确保服务能力的适宜性和有效性
调查需方满意度,并对服务能力策划实施的结果进行统计分析
检查各项指标达成情况
- 质量管控
改进
【标准规定】
建立服务能力管理改进机制
对不符合策划要求的行为进行总结分析
对为达成的指标进行调查分析
根据分析结果确定改进措施,指定服务能力改进计划
人员
人员储备
- 关键岗位
- 主备模式
-
储备方式/计划
增量机动储备
人才梯队储备
持续招聘储备
合作机构储备
岗位与角色备份
轮岗储备
外联与外协储备
-
人员培养
公开选拔标准
建立人才模型
放权(承担责任、风险)
核心人才、专业人才、通用人才、辅助人才
骨干(综合能力强)
- 监控优化
人员培训
-
培训需求
服务发展需求
技术发展需求
人员发展需求
被动产生的需求
-
培训内容
管理培训
技术培训
工具培训
过程培训
公共技能培训
- 培训资源
- 培训实施/效果
绩效考核
-
策划(目标和方法)
职责识别法
工作要求识别法(态度、能力、规范)
重点工作或重点任务识别法
- 实施(制定标准)
-
反馈(结果应用)
发现问题
引导人员行为并激励人员
制定人员的绩效改进计划
岗位调配和职位管理
利益分配(薪酬、奖级、职级等)
员工培训
新员工转正定级
通报、分析、沟通、确认
- 改进
岗位结构
- 建立岗位结构
-
岗位职责说明书
文件信息
基本信息
岗位概述
工作关系
岗位职责
岗位权限
任职资格
过程角色对照
工作条件
绩效考核
能力说明
【标准规定】
知识要求:
技术知识
专业知识
综合知识
技能要求:
确定维护服务人员在运行维护服务中所必备的能力
要求运行维护服务人员具备从事相关运行维护服务的资格
特殊环境运行维护服务人员应具有相关资格
经验要求:
运行维护服务人员应具备所从事运行维护服务活动的经验
供方应具备一定的从事运行维护服务活动的经验
-
能力模型
-
知识
基础知识
专业知识
相关知识
-
- 技能
基本技能
专业技能
软技能
- 经验
- 评价体系
资源
运维工具
【标准规定】
监控工具,对运行维护服务对象进行数据的采集和监控,评估可能导致运行维护服务对象故障的因素
过程管理工具,按照商定的SLA管理运行维护服务的交付过程,过程管理工具包括日常运行维护管理、记录、测量、监督和评估等功能
专用工具,根据服务要求配备的安全工具和用于特殊要求的工具
- 过程管理工具(服务门户)
- 专业工具及使用手册
服务平台(support/400电话)
【标准规定】
设置专门的沟通渠道作为与需方的联络点,沟通渠道可以是热线电话、传真、网络、邮箱等
设定专人负责服务请求的处理
针对沟通渠道整合服务过程,建立管理制度,包括服务请求的接收、记录、跟踪和反馈等机制,以及日常工作的监督和考核
制定相关制度、服务管理平台
服务平台管理制度,如运营管理、投诉管理、质量管理、信息管理。
VIP通道、普通通道
各类专家(可提供支持)
知识库
【标准规定】
针对常见问题的描述、分析和解决方法建立知识库
确保整个组织内的知识是可用的、可共享的
选择一种合适的知识管理策略
知识库具备知识的添加、更新和查询功能
针对知识管理要求制定相关管理制度,并进行知识生命周期管理
相关建议
知识库平台搭建完善
知识库内容编写、审核
知识库内容变更
知识库索引优化,方便查询
知识库分类(尤其岗位相关知识,传承、优化)
知识库安全保障、知识培训
知识库入库奖励
备件库
入库标准
软件分级
存储管理
传输管理
备件说明
技术
技术研发
【标准规定】
根据业务和市场分析,制定研发规划、包括新技术和前言技术的应用、技术储备等
配备与规划相适应的研发环境
配备与规划相适应的研发队伍
-
服务产品研发
对外提供的相关产品
-
服务工具研发
根据运维需求,如面向内部的服务过程管理工具、面向业务服务的监控工具和专用工具
-
技术规范研发
IT运维务规范,如风险管理、应急管理、日常服务管理等
技术规范,如安装部署、巡检等
与发现问题相关的技术
【标准规定】
具有信息采集和监控的手段
具有诊断和分析问题的方法
相关技术的应用和管理
建立发现问题技术的管理机制
应用发现问题的技术提升服务质量
定期检查评估发现问题技术和应用的有效性
不断完善和改进发现问题的技术及应用
-
工具类
如监控软件
-
技术资料类
技术资料主要指为了诊断故障、发现问题而使用的一些技术资料,包括故障代码表、故障分析诊断技术文档和相关技术文档、指导书、知识库案例等
-
方法类
为发现问题而安排的一些或或工作过程,如定期巡检、预防性维护等
与解决问题相关的技术
【标准规定】
解决问题的技术指标或标准
解决问题的方案或手册
测试环境、测试标准和方法
-
相关技术类型
分析方法(5W2H分析法、排除法、交叉测试法等)
专业技术
解决工具
知识库
测试环境
-
相关技术应用和管理
建立解决问题相关技术的管理机制
解决问题技术的实施应用
对解决问题技术的适宜性和执行质量进行检查
对解决问题的技术不断进行优化和改进
-
问题解决的验证指标
是否发现了问题发生的根本原因并解决
是否达到了服务需求方的要求
是否达到了已定义的基线要求
过程
任何使用各种条件将输入转化为输出的活动或一组活动可视为一个过程,过程包括6个要素:输入、输出、活动、活动之间的关系、需方、过程产生的价值。(过程经理、过程管理员)
服务级别管理
【标准规定】
建立服务目录
与需方签订SLA
根据需方的考核评估要求,建立SLA考核自评估机制,包括SLA完成情况、达成率等
在SLA评估后指定改进内容及改进措施
-
服务级别目标
定义、记录、写上、监视、衡量、报告和审查提供的IT服务级别
维护并保持与需方的关系和沟通
确保为所有IT运维服务指定了具体可衡量的模板
监视并改进服务质量,以提升需方满意度
确保IT运维服务人员和用户对于所提供的服务级别有着明确的期望
确保在成本合理的情况下,采取主动措施来改进服务级别
-
服务流程
识别获取需方需求
定义服务级别
SLA准备
SLA的签订
SLA的实施和监控
服务级别绩效跟踪与评审
服务报告管理
【标准规定】:
与服务报告过程一致的流程,包括建立、审批、分发、归档等流程
服务报告计划,包括提交方式、时间、需方接受对象等
服务报告模板,包括格式、提纲
-
服务报告过程
规划
创建
发布(审批、发送、沟通反馈、优化定稿)
-
服务报告类型
常规报告:包含IT运维服务效果和效率的综合考量,是需方考察供方服务能力及服务价值的主要信息来源
事件报告:事件、问题、发布、变更等产生的绩效,如变更和发布带来的效果
专题报告:特定事件(如组织IT服务合规工作)产生的影响与对策等信息
事件管理
【标准规定】
确保供方具有检测事件、尽快解决事件的能力。
与事件管理过程一致的活动,包括事件受理、分类和初步支持、调查和诊断、解决、进展监控与跟踪、关闭等
事件分类、分级机制
事件升级机制
满意度调查机制
事件解决评估机制,包括事件解决率、事件平均解决时间等
-
事件流程
事件接收和记录
初步归档和支持
启动服务请求程序
事件匹配
调查和分析
解决和恢复事件
跟踪和监控
关闭事件
- 输入输出标准
- 事件升级管理
-
常见问题
需方不警告一系列的处理过程而是自己解决错误或直接联系一些专业人员帮助他来解决
事件与问题概念混淆,事件管理包罗万象(如问题管理、变更管理等过程整合在一起执行)
忽视目标解决时间,需要具有不找出原因誓不罢休的精神
问题管理
【标准规定】
供方通过识别引起事件的原因并解决问题,预防同类事件重复发生。供方应根据问题管理的过程要求建立:
与问题管理过程一致的活动,包括问题建立、分类、调查和诊断、解决、错误评估、关闭等
问题分类管理机制,包括问题的影响范围、重要程度、紧急程度并确定优先级
问题解决评估机制,包括问题解决率、问题平均解决时间等
-
问题流程
问题检测和记录
问题分类和优先级
问题的调查和诊断
规避措施
创建已知错误记录
问题解决
问题关闭
主要问题审查
- 问题录入知识库
- 长期问题跟进更新
配置管理
【标准规定】
供方维护运行维护服务对象的必要记录,并保证配置数据的可靠性和时效性,关联支持其他服务过程。供方应根据配置管理过程的要求建立:
与配置管理过程一致的活动,包括识别、记录、更新和审核等
配置数据库管理机制
配置项审核机制
-
配置管理目标
所有配置项能够被识别和记录
维护配置项记录的完整性
为其他服务管理过程提供有关配置项的准确信息
核实有关运维对象的配置记录的正确性并纠正发现的错误
配置项当前和历史状态得到汇报
确保运维对象的配置项的有效控制和管理
-
配置管理流程
配置管理规划
配置项识别
配置项控制
配置状态报告
配置项审核
配置管理回顾及改进
变更管理
【标准规定】
供方通过管理、控制变更的过程,确保变更有序实施。根据变更管理要求:
建立与变更管理过程一致的活动,包括请求、评估、审核、实施、确认和回顾等
建立变更类型和范围的管理机制
对变更完成情况进行统计分析,包括未经批准变更数量及占比、不同类型的变更数量及占比、不成功的变更数量及占比、取消的变更数量及占比、变更关联的配置数。
-
变更管理目标
确保使用标准的方法和过程
迅速、平衡、负责任地处理变更,将变更对服务产生的影响降到最低
使变更可以跟踪
-
变更管理流程
记录变更请求
审批和筛选变更请求
对变更请求进行分类和确定优先级
制定变更实施计划
实施变更
- 变更风险评估
发布管理
【标准规定】
为确保一个或多个变更的成功导入,供方应根据发布管理的过程,要求:
建立与发布管理过程一致的活动,包括规划、设计、建设、配置和测试等
建立发布类型和范围的管理机制
指定完整的方案,包括发布计划、回退方案、发布记录等
对发布完成情况进行统计分析,包括发布成功率、发布及时率、是否更新配置管理数据库等
-
发布管理目标
设计和监督,以确保软件及其他相关硬件的首次运行能够成功进行
设计和实施有效的过程来发布和安装IT系统变更
确保硬件和软件的变更是可追踪的,安全的,并且只有正确的、被授权的和警告测试的版本才能安装
在新版本的规划和首次运行过程中,沟通并管理需方的期望值
联合变更管理,确定发布的确切内容和首次发布计划
利用配置管理和变更管理中的控制过程,在实际IT环境中实施IT系统的新发布
确认所有最终软件库中软件正本的副本是安全可靠的,并且在配置管理数据库中得到了更新
确保所有的运维对象均已得到发布,所有的变更是安全的和可追踪的。
-
发布管理流程
制定发布政策
制定发布计划
发布的设计、构建和配置
发布测试的验收
制定首次运行计划
沟通和培训
分发及部署
安全管理
【标准规定】
供方应建立运行维护服务过程中的信息安全管理过程,要求:
符合相关法律法规的规定,满足需方对运行维护服务过程的信息安全要求和供方本身的信息安全需求;
建立与信息过程一致的活动,包括识别、评估、处置和改进等
-
运维安全管理机制
策划(制定策略、方针,规划)
评估
实施
改进
- 风险管理
- 应急管理
过程管理注意事项
运维过程的规划和实施应结合供方和需方的经营环境、组织结构、IT资源和管理过程的特点,从过程、人员、技术、资源四方面来规划运维过程及框架,以期将供方、需方的运营目标、业务需求与服务提供协调一致,达到通过运维过程提升供方和需方的业务支撑能力,进而保证供方、需方业务目标的实现。