可打印 可编辑 某某项目运维方案
目录
1. 文档介绍................................................................................................................................... 3 1.1 1.2 1.3 1.4 1.5
文档目的 ........................................................................................................................... 3 文档范围 ........................................................................................................................... 3 读者对象 ........................................................................................................................... 3 参考文献 ........................................................................................................................... 4 术语与缩写解释 ............................................................................................................... 4
2. 人员与责任............................................................................................................................... 5 2.1 2.2 2.3
项目建设管理机构 ........................................................................................................... 5 驻场人员工作时间 ........................................................................................................... 6 人员培训 ........................................................................................................................... 6 2.3.1. 培训需求管理 ...................................................................................................................7 2.3.2. 培训内容管理 ...................................................................................................................8 2.4
绩效考核 ........................................................................................................................... 9
3. 运维过程内容........................................................................................................................... 9 3.1. 运维模型 ......................................................................................................................... 10 3.2. PDCA服务建设 ................................................................................................................ 10
3.2.1.
3.2.2. 3.2.3. 3.2.4.
策划设计 ......................................................................................................................... 10 实施转换 ......................................................................................................................... 11 检查运营 ......................................................................................................................... 11 持续性改进 .................................................................................................................... 11
4. 运维资源................................................................................................................................. 12 4.1. 运维环境 ......................................................................................................................... 12 4.2. 驻场服务 ......................................................................................................................... 13 4.3. 服务器备件 ..................................................................................................................... 13 4.4. 运维知识库 ..................................................................................................................... 13
4.4.1. 知识库构建 .................................................................................................................... 13
4.4.2. 运维问题分析 ................................................................................................................ 14
5. 运维服务规划保障................................................................................................................. 14 5.1. 组织级质量规划及保证 ................................................................................................. 15 5.2. 项目级质量规划及保证 ................................................................................................. 15 5.3. 运行维护部人员质量保证 ............................................................................................. 16 5.4. 质量控制 ......................................................................................................................... 16 5.5. 质量审计 ......................................................................................................................... 16
5.5.1. 5.5.2. 5.5.3. 5.5.4. 5.5.5.
目的 .................................................................................................................................. 16 运维服务质量内审 ...................................................................................................... 17 管理评审 ......................................................................................................................... 17 组织级质量审计检查点 ............................................................................................. 17 项目级质量检查点 ...................................................................................................... 24
6. 事件处置................................................................................................................................. 26 6.1. 造成系统中断的安全事件处置: ................................................................................. 28 6.2. 造成数据丢失或更改的安全事件处置: ..................................................................... 29 6.3. 造成信息泄密的安全事件处置: ................................................................................. 29 7. 质量改进................................................................................................................................. 29 8. 运维边界及内容..................................................................................................................... 30
1. 文档介绍
1.1 文档目的
本文档是运行维护部制定的运维服务质量管理规范,作为项目运维服务质量管理的总纲,规范和指导公司运维服务质量管理,加强运维服务质量管理的有效性。保证运维服务的整体质量,提升公司运维服务的整体质量水平。使公司能够为客户提供更高质量的运维服务,保障公司运维服务业务的快速发展。是项目建设方对运维服务质量管理的总体要求和执行指导。
本文档描述了运维服务质量管理的整体框架,通过本文档,可以帮助项目运维团队明确运维服务质量管理的总体方针政策,确定运维服务质量管理实施的必需步骤及产生的文件,指导运维服务质量相关的程序、计划、报告的编制或生成。从而能够保证运维服务的整体质量,有助于提升公司运维服务的整体质量水平。进而能够为客户提供更高质量的运维服务,保障公司运维服务业务的快速发展。
1.2 文档范围
本文档是对运维服务质量管理规范的整体概述。说明本项目中,具体运维工作的依据、目的、范围等。明确质量管理的人员安排个责任分工简述了质量管理工作流程示意图,根据项目运维工作设计,约束质量方面相关内容,依次叙述下列方面的内容: • • • •
质量规划 质量保证 质量控制 质量改进
1.3 读者对象
提示:列出本文档的所有读者,如项目管理办公室(PMO),运维团队,第三方公司,机房等; 1.4 参考文献
按照国家标准《信息技术服务 分类与代码》(GB/T 29264)的规定,IT服务是指供方为需方提供开发、应用IT的服务,以及供方以IT为手段提供支持需方业务活动的服务,具体包括咨询设计、集成实施、运行维护、数据处理和存储等大类。
图1-4 项目运维服务体系
ISO9001质量管理体系
ITSS运维系列标准《项目管理知识体系》
1.5 术语与缩写解释
缩写、术语 SPP ITSS … 解 释 精简并行过程,Simplified Parallel Process 信息技术服务标准,Information TechnologyService Standards 2. 人员与责任
2.1 项目建设管理机构
项目运维小组都有明确的工作职责,所有小组人员协作完成该项目的建设任务,对项目团队的管理原则是:职责清晰、责任共享;灵活敏捷、主动应变及开放式沟通,通过这些原则来促进团队成员的工作激情,提升团队的工作效率。建议成立以用户甲方主要负责,相关部门共同参与的项目运行维护团队领导组,联合组成项目管理办公室(PMO)。制定定期项目进展汇报制度,一方面对项目运维工作进行检查和监督,另一方面,以规范的方式确立项目的权威性和重要性,并集中解决一些重大和难点问题。
项目运行维护团队
客户服务经理SAM项目经理PM质量经理QA驻场运维工程师XX 人二线支持工程师XX 人支持资源池备份人员系统运维工程师运维项目经理UI美工
图2-1 项目维护团队组织结构
项目运维分为一线团队与二线团队两部分,一线团队为操作岗,由运维项目经理与项目运维人员组成,执行运维服务的各个过程,主要满足用户在较短时间内的页面修改及功能性诉求。
二线团队主要为技术支持岗,负责对一线团队进行远程支持,解决需要进行功能变更、开发修改等工作量的较大的诉求。
在一二线团队中还设有客户服务经理、项目经理、质量经理等管理岗,主要工作内容有两个方面:一是对项目需求的管理,二是对运维服务工作过程和结果的规划管理。本项目中,还特别重点在于对用户真实需求的挖掘、分析和信息传递。
表2-1 项目运维服务团队
序号 1 2 3 4 5 6 7 8 姓名 张三 李四 王五 赵六 马七 杨八 … … 在本项目中但当职位 年龄 40 40 40 40 40 40 从业经历 15年 15年 15年 15年 15年 15年 客户服务经理 运维项目经理 系统运维工程师 UI美工 团队负责人 项目管理工程师 2.2 驻场人员工作时间
表2-2 项目驻场维护团队
周一 周二 周三 周四 周五 周六 周日 张三 李四 王五 张三 李四 王五 张三 李四 王五 张三 李四 王五 张三 李四 王五 A岗:张三 B岗:李四 A岗:王五 B岗:李四 注:在工作日工作时间为(上午8:30 — 11:30,下午 14:00 — 18:00)非工作日A、B岗轮值,驻场人员7x24小时手机保持开机畅通。
2.3 人员培训
人员培训是提高运维服务人员能力的必备手段,组织需要实施获取培训的内容、制定培训内容、实施培训过程、管理培训资源、评估与改进培训工作等内容。
在本项目中,根据实际情况按年度制定培训计划,包括对驻场运维岗位人员及项目管理岗位的培训安排。保障培训讲师库和培训教材库,培训教材覆盖管理、资源、技术、过程以及交付和应急响应等内容;针对培训结果具体分析和改进,分析至少包括培训目标实现率、培训有效率,形成培训实施的记录;对培训管理、讲师库和培训资料的可用情况进行定期评估与改进。
2.3.1.
1)
培训需求管理
培训需求来源管理
本项目中,对运维服务人员的培训分为主动产生的培训需求和被动产生的培训需求。主动产生的培训需求是在实际运维活动过程中为适应项目的发展和项目规划,确定的培训需求。被动产生的培训需求是在项目中为了应对出现的问题而采取的培训。例如,陕西省招考招录期间,服务主机支持能力不足以满足实际情况时采取的旨在提高主机维护技术水平所进行的培训,可归为被动培训需求。
2)
培训需求获取
本项目中,培训需求的获取方法采用管理层访谈和问卷调查的方法: 管理层访谈
通过管理人员与具体运维人员进行面谈以确定培训需求的方法,通过进行沟通问题、共同分析、确认需求。在多人范围进行时,会采取会议的形式收集需求。
问卷调查
本项目中通过定期发放问卷进行调查培训需求的方法,对培训内容关切成都以及培训形式进行了解。如下表:
表2-3 培训需求调查表样例 培训需求调查(请在您认可的答案“□”内打“√”,如选择“其他”,请在空格内简要描述) 1 您认为有利于本项目运维能力提升的课程是哪方面? 您认为通过培训自己提升最大的是什么? 您认为本项目中运维发展的培训重点是什么: □管理类 □技术类 □工具使用 □综合 □ 观念 □技能 □态度 □知识 □技术 □团队合作 3 □规章制度 □服务意识 □团队建设 □项目整体规划 □人才储备 □其他 4 您认为本项目的培训讲师来源最好是: □项目内部 □管理咨询公司 □行业专家 □其他 □课堂讲授 □案例分析 5 您喜欢的培训方式是: □模拟操作 □音像多媒体 □游戏竞赛 □研讨会 □其他 6 您希望培训讲师的风格是: □知识丰富 □口才好 □生动幽默 □理性 2 7 8 您希望培训时间安排在: 您认培训频率多久一次: □晚上时间 □周末时间 □其他 □一月 □一季 □半年 □一年 □其他 □内部兼职讲师队伍建设 9 结合本项目目前实际,您认为组织应该把培训资源重点放在哪里? □外派与梯队人才培养 □基层员工的技能提升 □管理层领导力的提升 □其他,请说明 10 您是否愿意成为项目内部讲师? □愿意 □不愿意 □其他意见: 11 您希望通过培训解决工作中遇到的哪些困难或困惑? 请写出您认为参加过的最好的一次培训,好的方面在哪里? 针对项目目前工作中的困难,您希望今后举办或参加哪些培训项目? 您对改进培训工作有何其他建议(如培训内容、重点、规模、时间、牝鹿、费用、方式等) 12 13 14 2.3.2. 培训内容管理
本项目中,具体培训内容按照其内涵分为管理培训、技术培训、工具培训、过程培训以及公共技能类(应急处理、公文写作等)培训等。
1)
管理培训
本项目中设有驻场运维项目经理一岗,在管理方面主要培养该运维项目管理人员的沟通能力、执行额能力、合理规划能力、过程控制能力以及在运维过程良好的承上启下的能力等。
2)
技术培训
本项目在针对不同的岗位专业领域,在要求每一个运维服务人员扎实专业基础的同时,以项目过程中的请求、事件和问题为契机,不断提升技术人员的专业技能和实践能力,进而全面提升运维服务能力。
3)
工具培训
生产力的提升离不开工具,在陕西省项目运维所使用工具(监控工具、过程管理工具、专业工具等)的培训是一个必不可少的要素。同时,在运维人员的流动及交接工作时,通过使用规范性的工具进行交接能够让运维交接更有保障。
4)
过程培训
针对各个业务系统的考核指标、检查过程、考核制度等工作的培训。
5)
公共技能类培训
通过公共类软技能培训提供综合素质,更好地辅助运维工作。包括有沟通技巧、公文写作、信息安全知识、行业安全知识、法律法规等。
2.4 绩效考核
本项目中驻场服务人员绩效考核主要从岗位职责、工作目标入手,结合项目具体要求,对绩效进行识别。通过职责识别服务内容、服务方式、服务标准。(如, 服务内容为修改页面、服务方式当面确认8小时内开始、服务标准达到每需必接,每接必响应且形成记录。)按照工作要求视角识别绩效目标、锚定服务等级,通过行为观察与用户反馈的服务质量结果进行考核。 3. 运维过程内容
本项目运维建设为聚焦组织的能力体系建设方式,通过能力体系的建设、运行以及改进等实现项目的战略目标。本项目中运维工作的主要目标体现在:
提升运维质量——通过量化和精细化运维体系管理,提升运维质量。
优化运维成本——对不可预测的运维内容进行控制,同时通过不断清晰运维内容与驻场运维人员的技能培养的方式达到优化成本的目的。
强化运维效能——合理分配和使用运维资源,对项目中的运维项进行模块化分解。 降低运维风险——实施运维期间,促进内外部服务资源相互信任和契合,为一体化管理奠定基础。
在运维过程中,质量、成本、效能、风险之间互相制约、平衡各方面均衡对项目的运维工作整体效益最高,任何局部的突出或低洼都会造成不必要的浪费。
3.1. 运维模型
结合国内外运维理论与项目实际情况应用,本次项目采用运维模型如下图所示。
图3-1 运维能力模型
在模型外围定义能力管理主要活动,即策划、实施、检查、改进,从项目目标的顶层和管控层来持续管理并提升项目的IT运维能力。
3.2. PDCA服务建设 3.2.1.
策划设计
通过对服务的策划规划,对服务及服务管理过程设计、对运维开发工作的指导,它包括将战略目标转变成服务投资组合和服务资产的原则和方法,服务设计的范围不仅限于新的服务,它还包括为保持和增加客户价值而实行服务生命周期过程中必要的变更和改进,服务的连续性,服务水平的满足,以及对标准,规则的遵从性。它指导组织如何开发设计服务管理的能力。
3.2.2. 实施转换
将服务转换为如何将新的或变更的服务转换到运营过程中有关能力的开发和改进的指导,服务战略需求通过服务设计进行编码,而服务转换则是探讨如何将这种编码有效导入到服务运营的体系中,与此同时,还应控制失败的风险和服务的中断。
3.2.3. 检查运营
服务运营包含了在服务运营方面的实践,它对如何达到服务支持和交付的效果与效率,确保客户与服务供应商的价值提供了指导,最终通过服务运营实现运维内容目标。
3.2.4. 持续性改进
服务改进为创造和保持客户价值而用更优化的服务设计、转换和运营提供指导。它结合了质量管理、变更管理和能力改进方面的原则、实践和方法。组织要学会在服务质量、运营效率和业务连续性方面的不断提高和改进意识。
此外,它还为改进所取得的成就与服务战略、服务设计和服务转换之间如何建立关联提供指导,为基于戴明环(PDCA)形成计划性变更的闭环反馈系统的建立提供思路。
4. 运维资源
4.1. 运维环境
从基础设施说起,其实IT基础设施与IT技术本身没有太大关系,机房、空调、电源等设备都是有专业的厂商提供的,比如机房的空调一般都是精密空调,能够对机房温度进行精准控制,配备多路电源和UPS,重要的机房还配有柴油发电机,这方面的运行维护交由专业的厂商进行运维,做好日常维护就可以了。
主机、存储方面,主机和存储设备目前都有几大专业厂商把持,相对较成熟,PC服务器主要有联想、HP、Dell、华为等,存储主要有IBM、HP、NETApp等,使用起来都差不多,主要在性能和容量上差别。这里需要补充说的是,目前大部分企业都上云计算了,目前云计算也作为企业信息系统运维重要的技术方向之一。
平台层:主要是构建各应用系统的通用平台,数据库主要包括oracle、mysql、sqlserver等,中间件主要包含tomcat、weblogic、IIS等,套装软件主要包括SAP ERP、专业数据挖掘和分析软件,这方面主要是企业信息运维的重点,因为技术的多样化,导致相同的软件功能,不同的技术都可以实现,但不同的技术需要不同的运维技术技能,,而且企业的业务不同发展导致应用系统的越来越多,运维的人员越来越多,初步梳理,需要数据库、主机操作系统、中间件等专业技术人员,各方向都有专业厂商做认证和培训。
应用层:主要分业务运维和系统运维,这里不解释业务运维了,系统运维主要是基于数据库和中间件之上开发的各种各样的业务系统,多样化,重点说一下成熟套装软件,这些软件相对叫专业,且基本上是大型软件,典型的就是SAP ERP系统,每一天软件都自成体系,需要专业技术人才进行维护,门槛较高。
再来说说信息安全,可以说国家把信息安全上升到战略层面,可以想想重要程度,信息安全贯穿IT架构每一个层次,涉及到方方面面,且技术日新月异,变化很快,如果一个企业还不重视信息安全,在这时代有可能分分钟就被干掉。作为现代企业因充分重视信息安全的投入,构建企业安全防护体系,投入一定的资金用于技术、设备和人员的开支,加强企业安全防护能力。
4.2. 驻场服务
运维服务目标根据具体实际情况描述。
4.3. 服务器备件
运维服务目标根据具体实际情况描述。
4.4. 运维知识库 4.4.1.
知识库构建
运维知识库作为知识核心部分,是管理中心,有至关重要的功能。构建过程中以业务流程为导向,坚持规范业务方便运维团队,以数据价值最大化与团队运维管理为目标。
01 收集知识02 分享学习03 知识应用04 评价反馈05 迭代更新
按照知识来源可分为静态知识和动态知识,静态知识是通过定制标准化的文档模板,将知识内容形成细目分类,通过检索的方式进行知识查询。如,操作手册、常见问题案例、特殊业务脚本、解决方案等基于标准化管理的,实现机构化知识存储。
动态知识是日常运维活动中,通过用户问题提交,针对无法在既有知识库中匹配问题进行标记结果并及时反馈至运维团队,运维人员定期对问题进行评审评估,形成新的问题词条达到完善健壮现有知识库的目标。
4.4.2. 运维问题分析
通过问题模版库的建立,在实际运维过程中解决用户的问题提报多种多样的特性。且针对相同的问题,不同的人也存在语义差异极大的表述,因此需结合不同用户的提问习惯进行梳理、提炼并建立问题模版库,在用户问题提报过程中使系统能准确的定位用户的提问。
5. 运维服务规划保障
运维服务工作主要包括以下部分:
服务报告管理 事件管理
问题管理 配置管理 变更管理 信息发布管理 安全管理 过程管理注意事项
5.1. 组织级质量规划及保证
年度质量管理规划由项目运维管理部负责编制,其编制依据为项目质量保证和质量控制所用的相关程序,根据这些程序同时参考上年度的年度质量报告,结合上年度质量工作中发现的问题,明确经由相关程序进行改进的计划和流程。尤其针对改进效果不佳的问题,要着重安排整改计划。
年度质量计划根据质量保证和质量控制两个方面,分别制定《年度质量保证计划》和《年度客户满意度调查计划》,后续的质量改进环节也分别生成相关的报告。
5.2. 项目级质量规划及保证
项目质量计划由项目经理负责编写,编写依据根据项目实际情况以及项目相关的流程、标准,并结合公司的相关质量制度和流程以及指标体系形成。完稿后由质量管理部的质量经理进行审查。审查合格后由上级领导批准后,定稿并整合进项目计划中,同时由公司项目部存档备查,作为项目验收以及审计的依据。
1. 项目级质量保证由运维经理和质量管理部质量专员共同负责,相关计划、报告等质量专员直接汇报给质量管理部质量经理。
2. 质量保证活动贯穿整个服务生命周期, 质量经理应在运维服务项目立项时和运维经理一起策划项目的质量保证活动,在整个过程中,支持并协助运维经理的部分管理活动,质量专员的主要工作是对项目过程的评审和工作服务的审计,发现不符合项,同时也要接受客户代表、质量保证专家及第三方评审机构的评审。
5.3. 运行维护部人员质量保证
目标:达成《年度质量保证总体指标》中各项指标,不需要对过程进行改进。 计划:项目组成员按照《运维服务指标体系》文件中规定的运行维护部的职责和权限,完成相关工作。
实施:运行维护部人员严格遵从质量保证计划,完成年度质量保证总体指标,配合质量管理部进行过程、服务评审,并对过程评审中发现的不符合项进行处理、跟踪,直至问题关闭为止。
5.4. 质量控制
公司对运维服务采用多种手段进行质量控制,其主要目的为提高客户满意度而进行的满意度调查。这些满意度调查包括事件级满意度调查、项目经满意度调查、客户级满意度调查等。服务质量管控指标的收集和分析
目标:通过阶段性(月度、季度)的服务工作总结,对公司运维服务过程中的问题和偏差做出有效评估,并进行调整和优化,保证年度运维服务目标的实现。
计划:按《项目质量保证计划》,每个季度由质量经理发起,经过总结后,需要向总经办汇报。实施时间为每个月度末。
实施:每个季度末,由运维经理发起对运维服务相关部门的工作总结和下季度工作计划。 各种质量控制手段的结果经由一定的规则折算后形成每个运维服务项目的客户满意度,然后公司再综合得出整体的运维服务满意度。
客户满意度调查:核实服务过程中每个项目实施结果以及客户的感受,为服务持续改进树立目标。方法由《客户满意度调查管理制度》规定,具体操作实施办法参考该文件实施。
5.5. 质量审计 5.5.1.
目的
审计的目的是确保公司提供的运维服务满足客户所需的服务质量,达到客户满意,寻找公司服务实施过程中存在的问题和缺陷,为服务改进活动的有效实施提供目标和方向,进而保证组织的服务质量稳定可控并持续提升。
5.5.2. 运维服务质量内审
目标:运维体系的内容目标为验证质量/运维服务管理是否持续符合标准和本公司体系文件的规定,确保体系的持续有效。
计划:质量管理部每年初编制公司年度内审方案,交总经办批准后由运行维护部组织实施。内审一般每年进行两次,年中、年末各一次。
实施:由质量管理部负责对运维体系进行内审,按照首次会议、现场审核、确定审核结论、末次会议、出具审核报告的过程进行实施。执行上结合公司内部审计,针对阶段性质量管理工作进行检查、总结、评估和改进。
质量审计由质量管理部统一负责,重大问题直接上表公司总经办。一般性问题进入质量改进流程。
5.5.3. 管理评审
目标:管理评审的目的是通过对公司服务体系运行的适宜性、充分性和有效性进行评价,确定公司服务体系的改进方向。
计划:定于每年召开一次正式管理评审会议,时间安排在每年的5月份。
实施:由运行维护部发起,相关部门负责人配合参与;管理评审的输入包括内审报告、各项指标检查、客户满意度调查报告等。
5.5.4. 组织级质量审计检查点
根据运维服务工作的特点,检查点分为组织级和项目级二类,依分类在具体实施过程中分专项检查各常规检查,组织级的检查,要有质量管理小组统一安排,项目级的检查,主要由项目管理部来实施审计。
1)
组织级质量管理检查
组织级运维服务质量管理,检查点如下:
1) 是否根据公司业务模式及能力,制定了运维服务管理范围。 2) 是否有对运维服务管理手册的管理。
3) 是否制定了公司运行维护业务组织架构及各岗位职责。 4) 是否针对公司的运行维护服务,制定了公司运维服务管理方针。 5) 是否制定了公司运维服务目标。
6) 公司运维服务目标是否与公司的业务相结合,并通过程序持续改进不断提高绩效。 7) 管理层是否与相关部门及时有效地沟通,在公司中积极贯彻实施运维服务管理体系,达到持续改进的目的,从而实现运维服务管理目标。
8) 各部门总监是否组织相关部门按照PDCA的要求,通过对所属业务的规划,适时优化和提供资源,以计划、实施、监控、评审和改进运维服务的交付过程。
2)
运维服务能力检查
运维服务能力是通过运维体系、能力整体策划、实施、检查、改进形成的。所以对于运维服务能力的质量检查,主要是针对PDCA的循环进行,PDCA是否能够有效地运作,真正地提升运维服务能力。
运维服务能力,质量检查点如下:
1) 公司是否对运行维护服务能力进行了整体策划。
2) 公司是否实施运行维护服务能力管理和按服务等级协议(SLA)规定交付服务内容提供必要的资源支持,保证交付质量满足服务等级协议(SLA)的要求,对运行维护服务结果、服务交付过程以及相关管理体系进行监督、测量、分析和评审,并实施改进。
3) 是否根据公司自身业务定位和能力,建立了组织级运维服务目录。
4) 是否每年,根据公司运维计划和能力,制定了《年度运维服务能力管理计划》。 5) 公司是否考虑了公司提供运行维护服务所需要的公司各方面能力,包括但不限于对人力资源、备品备件采购、支撑系统等
6) 项目部、运行维护部规划了现有运维服务对象能力水平,是否根据《能力管理手册》的要求制订了运维能力指标体系计划。
计划中是否包含以下内容: 1) 当前和预计的能力和性能需求。
2) 针对服务升级所定义的时间表、阈值和成本。
3) 评估预期的服务升级、变更请求、新技术和技术能力的效果。
4) 预计外部变更的影响,如法律影响等。 5) 对数据和程序进行预先分析。
6) 定义监控服务能力、调整服务性能和提供充分能力的方法、程序和技术。 7) 为达到服务级别协议所要求的服务级别目标和业务需求所应具备的资金条件。 8) 是否,运行维护部协助收集、统计当前运维基础设施的实际性能和预期要求的运行信息,以支持服务业务的开展。
9) 是否,根据服务特点、服务量、服务报告和客户业务等信息,组织对能力管理计划行评审,并保留评审相关的纪录。
10) 是否,当出现临时的新服务或变更服务时,项目部、运行维护部应及时对相关内容进行评估和更新。
11) 是否,制定了服务管理计划的依据。
12) 是否,公司向运维项目提供了相应的人力、物力、信息和财务支持。
13) 是否,在运行维护服务执行过程中,所有的阶段性成果都以文档的形式予以保留。 14) 是否,不断对从业员工进行风险意识教育,主动识别风险、规避风险。
15) 公司管理层是否定期听取运行维护项目执行情况的汇报,监督项目执行状况,及时发现问题、解决问题。
16) 公司是否每年对员工进行绩效评审,评审结果计入年终考核,与个人年终绩效奖金挂钩,并作为评定次年加薪比例的依据。
17) 公司是否定期进行管理评审,对不符合本运维服务质量体系要求的现象及时提出改正意见。
18) 是否,建立了服务能力管理的目标。 19) 是否,制定了服务能力管理的范围。 20) 是否每年制定了年度质量保证计划。
21) 是否,每年在年度公司质量保证计划中,包括了质量管理日常工作、项目审计、项目客户回访、客户满意度调查等内容。
22) 是否在年度公司质量保证计划实施中,进行客户满意度调查和客户服务回访,来了解客户满意度。
23) 是否根据公司服务类型、服务量、服务报告和客户业务等信息,对年度运维服务能力管理计划进行评审,并保留评审相关的纪录。
24) 是否,对于运维服务管理体系审计发现的不符合项要进行跟踪管理,直到解决。
25) 是否,制定了服务能力管理体系的改进措施。
26) 是否,针对每年制定的改进措施,制定了改进计划,保证了改进措施的落实。
3) 人员检查
为满足公司运行维护业务的开展,保证和提升运维服务人员的能力,根据公司运行维护业务的年度经营目标,需要在人员招聘、人员储备、人员培训和人员的绩效管理等方面进行检查确认,保证人员能力活动的落实和公司年度经营目标的完成。
运维服务人员能力,质量检查点如下:
1) 是否,人力资源部在每年年初,根据公司运行维护业务的年度经营目标,评估现有的人力资源状况,提出全年的人力资源计划,包括人员招聘、人员储备、人员培训和人员的绩效管理。
2) 是否,编制了《运维服务相关岗位职责说明》。
3) 是否,在《运维服务相关岗位职责说明》中,包括了岗位结构、知识、技能、经验的要求。
4) 是否,员工入职后,必须通过新员工培训,掌握基础的工作技能和工作程序后,方可上岗。
5) 是否,新员工培训包含以下内容:
a) 职业道德教育;
b) 运维服务和项目管理基本理论培训; c) 有针对性的网络技能培训;
d) 商务礼仪培训,包括拜访礼仪、电话礼仪、邮件书信礼仪等; e) 工具的使用培训; f)
服务与沟通技巧培训。
6) 是否,针对所有员工,每年定期评审每个员工的绩效,并组织有关部门采取相应的改进措施。
人力资源部是否按照人力资源管理的要求,对运行维护部员工进行适当的教育、培训、技能和经验的记录,与运维服务相关的各部门负责定期对培训、绩效等结果进行评价、分析和报告。
4) 资源检查
为了提供有效的运维服务,确保与其匹配的资源能够高效利用,对工具、服务台、知识库、备件库等四个方面进行检查。
运维服务能力资源,质量检查点如下:
1) 是否,在提供运维服务时,使用了正确的运维工具,保证了运维体系流程和标准的确实落地。
2) 是否,使用的运维工具,包括了监控工具和过程管理工具。
3) 是否,建立了《服务台管理制度》,并得到实施,发现问题进行改进,保证服务的及时性和质量。
4) 是否,建立了《备件库管理制度》,并得到实施,确保备件可用。
5) 是否,建立了《知识库管理制度》,并得到实施,确保知识在组织内得到有效的使用。
5)
技术检查
为了促使公司的运维人员对其服务过程中的业务需求进行总结,形成一个良好的技术管理机制,指导服务团队、研发团队开展工作,提高服务水平,为其它管理流程提供支持,对技术研发、发现问题、解决问题等,三个方面进行检查。
运维服务技术能力,质量检查点如下:
1) 是否,每年对公司业务和市场分析,制定了研发规划,形成了计划文档,并实施。 2) 是否,在研发规划中,规定了执行部门。
3) 是否,运行维护部和技术开发组根据需求和优先级编制研发计划,年初报总经办审批。年末需在管理评审会上汇报计划执行完成情况。
4) 是否,对发现问题的技术进行了研究,形成了相应的研究成果。 5) 是否,对解决问题的技术进行了研究,形成了相应的研究成果。 6) 是否,对当年的研发成果进行了有效评估。
7) 是否,项目部和运行维护部通过例会等各种手段,普及并总结公司相关技术工具的使用。由运行维护部经理定期汇总、提交管理层进行决策、编制、研发及推广。
6) 过程检查
为了规范化运行维护服务的日常工作流程,对以下8个过程进行质量检查:
1) 服务级别管理; 2) 服务报告; 3) 事件管理; 4) 问题管理; 5) 配置管理; 6) 变更管理; 7) 发布管理; 8) 信息安全管理。
运维服务过程能力,质量检查点如下:
1) 是否,建立了《服务级别管理》制度,并得到实施,确保SLA得到有效使用和评估。
2) 是否,通过通过变更管理程序对《服务目录》进行更新与维护。
3) 是否,每年至少一次对服务目录进行审核,根据行业动态和业务发展情况决定对服务目录的增删修订。
4) 是否,服务级别协议、服务目录均处于变更管理过程的控制之下,服务级别协议变更后,服务目录被修改以确保它们描述的内容的一致性。
5) 是否,项目组按照服务级别协议执行。
6) 是否,建立了《服务报告管理》制度,并得到实施,确保服务报告得到客户认可。 7) 服务报告是否分为外部服务报告和内部服务报告。
8) 是否,外部服务报告由运维经理负责编写,内部服务报告以工程师、事件经理、问题经理、配置经理、变更经理、级别经理等的月度报告形式提交上一级管理者。
9) 是否,建立了事件管理制度,并得到实施,确保事件得到有效记录、跟踪解决和客户满意评价。
10) 是否,所有事件均在服务台正式记录,并可检索和分析。 11) 是否,制定了运行维护部门各角色的职责。 12) 是否,包含对重大事件的处理路程。
13) 是否,服务台在证实事件已经解决并且服务已经恢复的时候,再关闭事件。
14) 是否,建立了《问题管理》制度,并得到实施,确保问题得到有效记录,彻底解决。 15) 是否,运行维护部根据日常巡检、测试、事故数量和类型的趋势分析等纠正措施,识别潜在问题。所有被识别的问题都应该得到记录。
16) 是否,在问题得到解决后,运行维护部将相关信息加入问题知识库,运行维护部同时应升级所有相关文件。
17) 是否,记录对服务或问题管理程序的改进,并作为服务改进计划的输入。 18) 是否,建立了《配置管理》制度,并得到实施,有效指导配置管理活动,并定期进行审计,形成了配置审计报告。
19) 是否,制定了配置管理必须遵循的策略。 20) 是否,运行维护部保存了有效的配置记录。 21) 是否,配置项信息被保存在一个安全环境。
22) 是否,运行维护部确保了系统环境及配置信息的变更、发布符合其合同约定或事先约定的要求而且配置记录是准确的。
23) 是否,在审核中出现的缺陷或不符合项应被记录、评估和改进。
24) 是否,建立了《变更管理》制度,并得到实施,有效地控制了变更,保证了变更管理的有效性。
25) 是否,所有变更请求都应被记录、分类,包括紧急变更、常规变更和标准变更。 26) 是否,对于非标准变更需要评估其影响与风险。 27) 是否,变更管理包括了变更失败时的恢复及补救措施。 28) 是否,变更实施的效果得到验证才能对变更请求进行关闭。 29) 是否,建立了策略和程序,以控制紧急变更的授权和实施。
30) 是否,定期分析变更记录,检查变更频繁发生的类型、呈现的趋势和分布等信息,记录变更分析的结果和结论。
31) 是否,运行维护部在变更实施后,组织对变更效果和改进记录进行评审。 32) 是否,运行维护部对变更分析结果和结论采取相应的纠正、预防措施,并保存相关的记录。
33) 是否,建立了发布管理制度,并得到实施,有效地规范了发布流程,保证了发布的正确性。
34) 是否,建立了信息安全管理的相关制度,并得到实施,有效地控制了信息安全的风险。
5.5.5. 项目级质量检查点
公司每个运维服务项目,都需要有质量专员来进行指导、检查、审计和报告,保证项目重大工作的质量和有效性。
根据运维服务工作的特点和运维服务管理手册的要求,明确运维服务工作中质量检查点,对质量检查点,都是运维服务工作中重大和重要的节点,必须要进行的检查,不能遗漏,如有特殊情况不需要检查的,要单独说明情况。
1) 项目启动检查
运维服务项目启动阶段,是重要的里程碑,需要进行质量检查,确保项目工作有一个良好的开始。
项目启动阶段,质量检查点如下:
1) 是否,质量经理、质量专员在项目策划阶段介入,了解项目信息。
2) 是否,根据公司的运维服务目录和项目服务的需要,制定了项目的运维服务目录,并形成了合同的一部分。
3) 是否,在项目启动时,与客户共同进行了项目启动会议,明确了项目的目标、服务内容,服务时间及主要人员,并形成会议纪要。
4) 是否,在项目启动阶段,公司质量管理部为项目分配了专职的QA人员。 5) 是否,在项目启动阶段,根据配置管理要求,建立了项目的配置库。
2) 项目计划检查
项目计划阶段,主要是针对项目规划工作的质量进行检查。 项目计划阶段,质量检查点如下:
1) 是否,编制了《运维服务项目计划》,在计划中明确了运维服务的主要工作,人力资源投入,考核要求,运维工具的使用,服务报告提交的形式及频率等。
2) 是否,质量经理会同运维经理共同制定项目质量保证计划。
3) 是否,根据公司的各项工作过程,结合项目实际需要,修订形成了项目的工作流程,如:事件、问题、服务台、变更、发布等流程。
4) 是否,制定了项目审计计划。 5) 是否,制定了项目质量保证培训计划。 6) 是否,制定了项目质量审计检查表。
7) 是否,制定了服务质量评估标准,并有相关计算公式。
3) 项目实施检查
项目实施阶段,是整个运维服务项目,时间最长的阶段,也是最重要的阶段,要进行检查,确保项目实施的质量。
项目实施阶段,质量检查点如下:
1) 是否,根据运维服务项目计划在进行实施,实施过程得到有效的记录。
2) 是否,根据运维服务项目计划的要求,定期提交了服务报告(周报、月报、年度维护服务总结等),说明SLA得到有效达成。
3) 是否,根据项目信息安全的要求,进行了信息安全培训和检查工作。 4) 是否,对服务台的工作,进行了有效的记录,跟踪解决,确保客户满意评价。 5) 是否,对事件、问题、变更、配置、发布等工作,进行了有效地管理。 6) 是否,正确使用了运维各项工具,有效地支持了运维服务的各项工作。 7) 是否,根据项目审计计划进行了定期审计。 8) 是否,根据项目质量保证培训计划进行相应的培训。
4) 项目监控检查
项目监控,是为了确保项目工作得到有效落实,同时需要检查项目监控的工作是否得到落实。
项目监控阶段,质量检查点如下:
1) 是否,运维经理针对运维服务项目计划中的要求,检查各项工作的完成和质量,确保计划的落实,要有相应的文档记录。
2) 是否,项目经理定期召开项目例会,检查各项工作的完成情况,针对实施中的困难和问题,进行协调解决,确保项目目标和SLA的达成。
3) 是否,项目中发现的问题,得到了记录、跟踪、解决,直到关闭。 4) 是否,项目组织了项目客户的回访活动,了解客户对项目的满意度。
5) 是否,对项目审计结果进行了有效的改进和执行。
5) 项目收尾检查
项目收尾阶段,是项目结束时的重要阶段,为确保项目最终成败,需要进行项目收尾工作的检查。
项目收尾阶段,质量检查点如下:
1) 是否,召开了项目总结会议,与项目干系人共同确认了项目目标的达成。 2) 是否,对项目客户进行年度客户满意度调查,了解客户对整个项目的满意程度。 3) 是否,对项目成员进行了考核,确保项目成员的绩效得到客观体现。
4) 是否,形成了项目文档清单,提交给公司级配置管理,纳入到组织过程资产库。
6. 事件处置
根据《中华人民共和国计算机信息系统安全保护条例》、《中华人民共和国网络安全法》等相关法规、规定、文件精神, 信息系统突然遭受不可预知外力的破坏、毁损、故障,发生对项目资产造成损害的。
事件分类
根据安全事件的发生过程、性质和特征,安全事件可划分为网络安全突发事件和信息安全突发事件。
网络安全突发事件是指自然灾害,事故灾难和人为破坏引起的网络与信息系统的损坏;自然灾害是指地震、台风、雷电、火灾、洪水等。事故灾难是指电力中断、网络损坏或者是软件、硬件设备故障等。人为破坏是指人为破坏网络线路、通信设施、黑客攻击、病毒攻击、恐怖袭击等事件。
信息安全突发事件是指利用信息网络进行有组织的大规模的反动宣传、煽动和涌透等破坏活动。
事件分级
为提高处置网络信息安全突发事件处置能力,形成可续、有效、反应迅速的应急工作机制,确保重要计算机信息系统的实体安全,运行安全和数据安全,最大限度的减轻网络和信息安全突发公共事件的危害,进行危害事件的定义与分级。
名词定义
(一)网络信息安全事件等级:特别重大(I级)、重大(II级)、较大(III级)、一般(IV级) (二)重要信息系统:xx管理平台、xx系统等业务功能模块 (三)重要部门:PMO,运维小组、运维公司技术研发中心。 (四)一般部门:除重要部门外的其他所有部门 (五)重要数据:数据库 事件分类
(一)机房物理设备安全事件 (二)网络安全事件
(三)信息系统主机运行安全事件 (四)信息系统软件运行安全事件 (五)数据安全事件 定级原则
(一)根据造成信息系统中断的后果严重程度进行定级:
事件级别 安全程度 描述 网络与信息系统发生大规模瘫痪,事态发展超出自己的控制Ⅰ级 特别重大 能力,对国家安全社会秩序经济建设和公共利益造成特别严重损害的突发公共事件。 网络与信息系统造成全省性瘫痪,对国家安全、社会秩序、Ⅱ级 重大 经济建设和公共利益造成严重损害,需要跨部门协同处置的突发公共事件。 某一部分的网络与信息系统瘫痪,对国家安全、社会秩序、Ⅲ级 较大 经济建设和公共利益造成一定损害,但不需要跨部门、跨地区协同处置的突发公共事件。 网络与信息系统受到一定程度的损坏,对公民、法人和其他Ⅳ级 一般 组织的权益有一定影响,但不危害国家安全、社会秩序经济建设和公共利益的突发公共事件 (二)根据数据的丢失严重程度进行定级:
1.特别重大(I级):所有信息系统因为各种原因造成:近期的(一年内)重要数据丢失、不可逆转的更改导致与实际不符,涉及数据范围超过半小时业务产生的数据。所有信息系统有意篡改数据从中获利或造成严重后果。
2.重大(II级):所有信息系统因为各种原因造成:近期的(一年内)重要数据丢失、不可逆转的更改导致与实际不符,涉及数据范围超过2分钟业务产生的数据。所有信息系统有意篡改数据的行为。
3.较大(III级):所有信息系统因为各种原因造成:个别数据丢失或被不可逆转的更改导致与实际不符。
(三)根据造成信息泄密的安全事件严重程度进行定级:
1.特别重大(I级):
i、有意泄露信息系统中的重要数据谋取私利。
ii、无意泄露信息系统中的重要数据,但造成严重后果。如导致国家或蒙受重大损失,触犯国家法律。
iii、造成涉密文件泄密的安全事件。
2.重大(II级):无意泄露信息系统中的重要数据,使国家或公司蒙受损失,但在可控制范围内。
3.较大(III级):无意泄露信息系统中的重要数据,范围不大,影响小。
6.1. 造成系统中断的安全事件处置:
1.现场处理:运维团队接到安全事件的报告时,现场运维主管负责整个安全事件的处理和报告。首先应根据安全事件的情况进行技术上的分析,迅速拿出解决方案,对于安全事件的发展应有预判性,对于有可能升级为I级或II级,应第一时间向分管领导汇报,并根据事态发展确定是否启动应急预案。
2.事件报告:安全主管应通过书面报告的方式向分管领导汇报安全事件整个过程、原因、对安全事件发展处理方案。
3.后期恢复:对于运维技术中心能独立解决的安全事件,应立即进行恢复处理,并进行安全事件处理记录。对于需要其他部门配合的安全事件,分管领导应立即根据情况建立安全事件处置小组,由分管领导或运维技术中心对其他部门进行调度。直到安全事件处理完毕。安全主管组织人员对于造成系统中断的原因进行分析,并调整数据管理制度或使用新的技术方案,避免类似问题重复的发生。
6.2. 造成数据丢失或更改的安全事件处置:
1.现场处理:运维团队接到安全事件的报告时,安全主管负责整个安全事件的处理和报告。首先应根据数据丢失的情况进行技术上的分析,迅速对数据进行恢复。对于安全事件的发展应有预判性,对于有可能升级为I级或II级的安全事件,应第一时间向分管领导汇报。
2.事件报告:安全主管应通过书面报告的方式向分管领导汇报安全事件整个过程、原因、提出安全事件的处理方案。
3.后期恢复:对于运维技术中心能独立解决的数据恢复,应立即进行恢复处理,并进行安全事件处理记录。如果有数据不能恢复,需要其他部门配合进行数据的手工录入,分管领导应立即根据情况建立安全事件处置小组,由分管领导或运维技术中心对其他部门进行调度。直到安全事件处理完毕。安全主管组织人员对于造成数据丢失的原因应进行分析,并调整数据管理制度或使用新的技术方案,避免类似问题的发生。
6.3. 造成信息泄密的安全事件处置:
1.现场处理:运维团队接到安全事件的报告时,安全主管负责整个安全事件的处理和报告。通过技术手段确定泄密人员,并向分管领导汇报。如果是触犯国家法律的安全事件,应立即报警,并向分管领导汇报。
2.事件报告:安全主管应通过书面报告的方式向分管领导汇报安全事件整个过程、原因、对安全事件发展处理方案。
3.后期处理:安全主管组织人员对公司的安全制度、安全管理流程、安全管理技术手段进行分析,找到安全漏洞,拿出整改方案,避免类似事件发生。
7. 质量改进
质量改进包括两方面内容:
一方面是针对质量审计中发现的问题与不符合项,需要在质量审计相关的报告中列明并说明整改情况。
另一方面是针对公司质量管理体系自身的改进活动,是从质量管理实践中发现的一些体系自身的不完善、不严密的问题总结出来的改进计划,主要涉及制度、流程的丰富和修改等。
目标:服务改进规划的目的通过审核运行维护部所开展的各种服务管理活动,确保服务管理体系持续有效地运行、改进。
计划:根据公司质量方针和目标、公司的业务要求以及服务管理体系的运行状况,每年初制订《年度服务管理计划》。
实施:由运行维护部进行评审并发起,相关部门负责人配合参与;管理评审的输入包括内审报告、各项指标检查、客户满意度调查报告等。
8. 运维边界及内容
根据运维边界实际描述
因篇幅问题不能全部显示,请点此查看更多更全内容