第1章 项目概况 ........................................................ 4
1.1 项目背景 ............................................................. 4 1.2 项目目标 ............................................................. 4 1.3 需求分析 ............................................................. 4 第2章
运维服务管理体系建设 ............................................. 6
2.1 IT服务管理概述 ...................................................... 6 2.2 运维服务管理流程体系 ................................................. 7
2.2.1 服务支持 ........................................................ 8 2.2.2 服务提供 ....................................................... 14
2.3 运维服务管理规划 .................................................... 18
2.3.1 第一阶段:服务磨合阶段 ......................................... 18 2.3.2 第二阶段:主动服务阶段 ......................................... 21 2.3.3 第三阶段:战略规划阶段 ......................................... 24
2.4 运维服务质量管理 .................................................... 24 2.5 建立运维管理规范 .................................................... 26
2.5.1 运维管理规范概要 ............................................... 26
第3章
信息系统运行保障方案 ............................................ 28
3.1 统一服务台建设 ...................................................... 28 3.2 建立文档管理制度 .................................................... 29 3.3 一般信息化设备及相关软件运维管理 .................................... 33
3.3.1 一般信息化设备服务范围 ......................................... 33 3.3.2 一般信息化设备运维 ............................................. 33 3.3.3 例行维护流程图 ................................................. 34 3.3.4 一般设备服务方案 ............................................... 35
3.4 防(杀)病毒服务 .................................................... 40
3.4.1 防病毒服务需求 ................................................. 40 3.4.2 制定合理的防病毒策略和安全管理制度。 ........................... 40 3.4.3 客户端防病毒升级软件 ........................................... 41
。
1
。
3.4.4 防毒组件及时更新 ............................................... 41 3.4.5 每周防毒系统部署情况统计 ....................................... 42 3.4.6 每周对产生的病毒事件进行评估 ................................... 42
3.5 信息资产巡检及普查服务 .............................................. 42
3.5.1 主动巡检 ....................................................... 42 3.5.2 信息资产普查 ................................................... 43
3.6 其它有关说明及要求 .................................................. 43 第4章
运维服务计划方案 ................................................ 45
4.1 运维服务准备 ........................................................ 45
4.1.1 签定必要的协议和约定 ........................................... 45 4.1.2 人员准备 ....................................................... 45 4.1.3 工具准备 ....................................................... 45
4.2 项目人员组织 ........................................................ 46
4.2.1 人员结构 ....................................................... 46 4.2.2 人员职责与岗位要求 ............................................. 47
4.3 服务计划 ............................................................ 48
4.3.1 服务时间 ....................................................... 48 4.3.2 进场初始阶段 ................................................... 48 4.3.3 第一个服务阶段 ................................................. 49 4.3.4 第二个服务阶段 ................................................. 49 4.3.5 服务总结和延续阶段 ............................................. 50
第5章
应急服务方案 ................................................... 51
5.1 灾难应急措施 ........................................................ 51
5.1.1 应急措施体制图与总则 ........................................... 51 5.1.2 大型灾难紧急行动方案 ........................................... 52
5.2 运行服务应急方案 .................................................... 55
5.2.1 启动应急流程 ................................................... 55 5.2.2 成立应急小组 ................................................... 58 5.2.3 应急处理过程 ................................................... 58
。
2
。
5.2.4 应急处理结果评估 ............................................... 59 5.2.5 统计和报告 ..................................................... 59
第6章
服务水平质量承诺及服务管理 ...................................... 62
6.1 服务水平体系 ........................................................ 62
6.1.1 报告服务 ....................................................... 62 6.1.2 管理类服务 ..................................................... 62 6.1.3 主动式服务 ..................................................... 63 6.1.4 响应式服务 ..................................................... 63
6.2
服务承诺 ......................................................... 64
6.2.1 服务级别承诺 ................................................... 64 6.2.2 服务质量承诺 ................................................... 65
6.3
服务管理 ......................................................... 65
6.3.1 服务管理总则 ................................................... 65 6.3.2 服务流程管理 ................................................... 66 6.3.3 服务台支持管理 ................................................. 67 6.3.4 事件管理 ....................................................... 69 6.3.5 问题管理 ....................................................... 70 6.3.6 知识库管理 ..................................................... 71 6.3.7 服务记录管理 ................................................... 71
。
3
。
第1章 项目概况
1.1 项目背景
近年来为适应业务发展的需求,XX企业进行了大规模的电子商务建设,包括采购桌面PC约300台,打印机约100台,这些应用系统及硬件设备的投入使用极大的推动了XX企业信息化建设的进程。随着越秀工商局对整体IT系统(硬件、软件、网络通讯…)的可用性要求日益提高,系统运行保障和维护管理就成为确保业务系统安全稳定可靠运行的最有力的手段。
XX企业主要有一栋N层的办公环境,现阶段对设备维护主要采用自主维护的方式。由于人力有限,建设任务繁重,中心技术人员在接手新项目及日常工作的同时往往需要做大量的维护工作,不少技术人员长期处于满负荷,严重影响了工作效率。在当前有限的人力物力资源下,为了保障和提高IT服务质量,XX企业有必要将计算机、外设及网络的运行维护进行外包,派驻2名工程师进行维护,以解决当前IT服务个方面日益增长的需求和有限的提供能力之间的矛盾,提高XX企业办公区域内的软、硬件、业务应用软件的运行维护效率,确保信息系统正常运行。
1.2 项目目标
结合XX企业业务工作及信息化建设实际,完善运维管理体系的建设,加强信息系统正常运行保障,“以流程为导向,以服务为核心”提高服务质量水平、转变服务理念、拓宽服务范围、提高服务效率、提升用户服务满意度。
1.3 需求分析
本次项目XX企业需求主要包括两个部分,
。
4
。
1、运维管理体系建设要求; 2、信息系统正常运行保障服务。
其中运维管理体系建设应完善服务内控制度即服务质量管理,逐步建立起一套符合XX企业自身实际的运维管理标准及应用制度;建设IT运营维护管理平台,采用标准的IT运维管理流程,提供准确、详尽、专业的报告制度,通过客观分析运维过中出现的各种障碍及问题,为XX企业信息化建设提供决策依据。
信息系统正常运行保障涵盖了
1、一般信息化设备及软件的运维管理; 2、、防病毒服务;
3、办公区域内设备及软件巡检普查;
4、提供符合XX企业实际的服务响应水平及质量保障; 5、信息化资产管理
。
5
。
第2章 运维服务管理体系建设
2.1 IT服务管理概述
现今,随着计算机技术,特别是网络技术的飞速发展,对于许多行政单位,许多企业而言,IT技术越来越深入到核心业务,影响策略制定和企业的发展。从而对IT环境的可靠性,可用性和快速适应性提出了越来越高的要求,与此同时,IT环境(包括软/硬件及相关技术)却变得越来越复杂。因此,对于一个单位而言:
如何把有限的IT资源最有效的作用于核心业务的发展 如何最快地获取专业的支持能力
如何实现对系统的完善管理,提高系统的可靠性和可用性 如何提高用户的工作效率,增加最终用户满意度 如何跟上IT技术的发展,及时更新相关技术 如何提高对IT系统利用的灵活性 如何更好地管理IT运营成本
以提高服务能力,将会是单位可能面临的问题。
IT服务管理(ITSM)是一套帮助企业对IT系统的规划、研发、实施和运营进行有效管理的方法,是一套指导IT服务的方法论。ITIL是英国国家电脑局(CCTA)于八十年代开发的一套IT业界的服务管理标准库,它把业界在IT管理方面最好的方法归纳起来,形成规范,旨在为企业的IT部门提供一套从计划、研发、实施到运维的标准方法。它一经提出,便被欧洲各大公司纷纷采纳,随后在澳洲,美洲和亚洲流行开来,目前已成为IT服务管理事实上的标准。
。
6
。
通过参考这些标准,我们可以充分借鉴国际化标准的IT服务管理最佳经验,使我们“站在巨人的肩膀上”来设计、规划及运维IT服务,尽可能少走弯路,有效提高IT服务的质量。
ITIL框架图
ITIL是基于流程的方法论。IT部门可用其检查是否用一种可控的和可训练有素的方法为最终用户交付所需的IT服务。ITIL合并了一套最佳的实践惯例,可适用于几乎所有IT组织,无论其规模大小,或采取何种技术。
ITIL对IT服务管理实践中涉及的许多重要问题进行了系统的分析,包括全面的检查清单、任务、程序、责任等与任何IT服务组织密切相关的问题。这些概念的定义也涵盖了大多数IT服务组织的主要行为。IT服务组织可以借助ITIL的指导建立和拓展自己的IT服务流程。
2.2 运维服务管理流程体系
运维务管理最核心的是“服务支持”(ServiceSupport)和“服务提供”(ServiceDelivery)两个模块。各流程相互贯穿和作用,形成有机整体,共同建立一个健全的服务管理体系。 如下图所示:
。
7
。
2.2.1 服务支持
服务支持的内容描述了一个客户如何访问适当的服务,以支持其业务。服务支持包含以下内容:
2.2.1.1 服务台
我们为企业建设服务台,提供统一报障电话,统一报障、统一维修接口,越秀工商可以通过统一的报障电话申请服务、查询服务处理进程,监控服务质量。
服务台(ServiceDesk)是IT服务组织和用户相互联系的接入点。服务台曾经被称为帮助台(HelpDesk)。HelpDesk的主要任务是记录,分解和监控提出的问题。一个服务台可以具备更宽范的角色,如接收变更请求(RFC),并且可以支撑多种流程中的操作。
服务台是服务提供者和用户之间的日常工作的单一联系点。它也是报告突发事件和提交服务请求的焦点。正因为如此,服务台的职责是保持将服务相关信息,行为和契机通知用户,并追踪了解用户每日的行为。例如,服务台可能扮演用户提交变更请求的联系点,基于变更管理流程传达变更实施计划,并保持将变更实施进程通知用户。变更管理应该确保服务台随时保持对变更行为情况的掌握。
。
8
。
在任何对SLA产生影响的事件面前,服务台处于第一线,并维护高速的信息流通道。
围绕突发事件,服务台有可能在其权限范围被授权实施变更。此类变更的范围可能被预先定义。当所有相关变更发生时,变更管理流程将被告知。基本上,当对任何CI的规范做出修改之前,变更流程都需要对其进行预先审批。
2.2.1.2 突发事件管理
突发事件管理流程致力于解决突发事件,并快速恢复服务供应。突发事件被记录下来,并且事件记录的质量决定了相关的其它流程的效力。
服务台接近于突发事件管理流程和问题管理流程,并处于它们之间。如果没有适当的控制,变更有可能引入新的突发事件。因此需要建立有效途径对变更进行跟踪。这是为什么建议持续不断地将突发事件记录在同一个CMDB中,并分类为“问题”,“已知错误”,“变更记录”等信息,以促进服务台界面的信息沟通能力,简化事件调查和报告。
突发事件的优先权及其升级需要作为服务级别管理流程中的一部分进行协商,并在SLA中备案。
突发事件管理的目标:
突发事件管理的目标是尽可能迅速地根据SLA中定义的普通服务级别作出反应,使产生问题后对业务行为及组织和用户的影响最小。突发事件管理也应该保留对事件的有效记录,以便于衡量和改进流程,并向其它流程汇报。
突发事件流程如下图所示:
。
9
。
2.2.1.3 问题管理
对于突发事件有两种处理方法,一种是对其做出服务快速响应,尽快恢复其正常运行,另一种是鉴别和解决问题根源。这两种方法之间存在微妙的区别,而且经常被互相混淆。对其做好区分具有重要意义。
如果问题被怀疑存在于IT架构内部,问题管理流程将会瞄准其潜在的根源。一个问题可能是被突发事件暴露出来的,但是显然,问题管理的目标是解决问题根源,预防其可能产生的干扰,而不是迅速恢复系统运行。
当问题被识别后(被识别的问题通常称之为已知错误),通常需要进行一个业务决策,决定是否采取永久性措施改进系统架构,以预防再次发生新的突发事件。如果需要,提交一个变更请求来实现改进。
为了有效和高效地识别突发事件背后的问题根源及其发展趋势,问题管理流
。
10
。
程需要准确全面的突发事件的记录。问题管理流程同样需要和可用性管理流程密切联络,以确定这些趋势并明确补救措施的重要性。
流程:
2.2.1.4 配置管理
配置管理致力于控制一个变化中的IT架构(标准化和状态监控),鉴别配置项目(清册,相互关联,审核与注册),收集和管理有关IT架构的文档,为所有其它流程提供IT架构的相关信息。
配置管理是所有其它服务管理流程不可分割的一部分。拥有当前架构中所有部件的最新的,准确的,全面的和详细的信息,并管理其变更,使这些信息有效而高效地支持其它流程运行。变更管理可以与配置管理集成。至少,建议在配置管理系统中控制变更的登录和实施,并自在配置管理系统的帮助下对变更影响做出评估。因此所有变更请求应该被输入配置管理数据库(CMDB),并随着变更请求的进展随时更新记录,直至其实施。
配置管理系统识别一个变更项目和架构中其它部件的关系,将这些部件的所有人召集到影响评估流程中来。不管一个变更是否在架构中实施,相互关联的配置管理记录应该在CMDB中得到更新。最好在变更发生时,使用集成工具自动地更新记录。
CMDB应该开放给整个服务支持组,使所有人理解部件失效可能的原因,从
。
11
。
而使突发事件和问题可以被更容易地解决。CMDB还应当被用来把突发事件及问题记录和其它记录联系起来,比如失效的配置项目(ConfigurationItem-CI)和用户之间的联系。如果缺少了配置管理流程的集成,发布管理将难以实现,并可能错误连连。
服务交付流程同样依赖于CMDB中的数据。例如:
服务级别管理需要识别相互结合在一起的部件,并在此基础上设置支持协议,交付服务。
IT财务管理需要知道每个业务部门使用的IT架构部件,尤其是对于收费的项目。
IT服务持续性和可用性管理需要识别部件,用于问题风险分析和部件失效影响分析。
下图显示了配置管理和其它服务管理流程之间的关系:
图:能力管理,变更管理,配置管理和发布管理之间的关系
2.2.1.5 变更管理
变更管理专注于对IT架构实施可控的变更。此流程的目标是确定所需的变更,并决定这些变更如何在对IT服务产生最小的不利影响的范围内得以实施。同时确保其变更是可追溯的,而且是经过整个组织内部有效地磋商和协调的。在客户组织提交变更请求后,由配置管理流程监控其状态,与问题管理和若干其它
。
12
。
流程进行协调。变更实施履行一特定的路径,包括定义,计划,建立,测试,接受,实施,和评估。
变更管理流程依赖于配置数据的准确性,以确保获知所有实行 变更造成的影响。因此变更管理与配置管理之间有密切的联系。
变更流程的详细内容应在SLA中存档,确保用户知道提交变更申请的程序,项目目标及时间,以及实施变更造成的影响。
变更的详细内容需要通知服务台。即使变更经过了全面测试,仍然很有可能存在实施变更的过程中发生各种困难,这些困难可能缘于变更没有按需求或预期运行,或者对变更对功能造成的影响产生质疑。
变更咨询会议(ChangeAdvisoryBoard-CAB)由可向变更管理小组提供专家意见的人员组成。这个会议很可能由来自于所有领域的IT及业务单位的人参与。
2.2.1.6 发布管理
发布是指一组配置项目(ConfigurationItems–CI)经过测试被引入处于活动状态的环境中。发布管理的主要目标是确保发布信息被成功地公布,包括归纳综合,测试与存档。
发布管理确保只有经过测试和正确授权的软硬件版本才能提供给IT运行环境。发布管理与配置管理和变更管理的行为密切相关。真实的变更实施经常通过
。
13
。
发布管理行为得以贯彻。
变更的结果可能经常来自于新硬件,新版本软件,以及新的文档(自行建立,或购买而来)等。对它们进行控制,并打包和颁发。有关存档安全和公布程序应该和变更管理和配置管理流程紧密集成。发布的程序也可能作为突发事件管理和问题管理流程中不可分割的一部分,同时还和CMDB密切相连,以维护及时更新的记录。
2.2.2 服务提供
服务提供主要包括:服务级别管理、IT服务财务管理、能力管理、持续持续管理、可用性管理等。
。
14
。
2.2.2.1 服务级别管理
服务级别管理的目标是缕清与客户之间有关IT服务的协议,并付诸实施。 因此, 服务级别管理需要收集客户需求, IT服务组织可提供的设施,以及可用的财务资源。 服务级别管理针对提供给客户的服务 (聚焦客户的)。因此是基于客户需求建立服务 (需求拉动),而非单纯基于现有技术所及(供应驱动),从而使IT服务组织提高客户满意度。服务级别管理阐述的内容有:
如何在服务级别协议(Service Level Agreement – SLA)中清楚地定义
条款, 使其可优化IT服务成本, 并为用户所接受。 如何监控和讨论所提供的服务。
如何管理IT服务组织的供应商及其下包合同。
服务级别管理(Service Level Management -SLM)流程是用来确保服务级别协议,并支持运行级别协议及其它合同,保证所有对服务质量的影响减少到最小。此流程在服务质量和SLA基础上评估各种变更造成的影响,包含预期变更前的影响, 也包含评估实施变更后的影响。SLA中某些最重要的目标和服务可用性、以及在容许周期内对突发事件形成决策有关。
SLM是服务支持和服务交付的关键。由于它依赖于其它流程的存在性, 有效性及运行效率, 它不可孤立存在。一个缺乏基础支持流程的SLA是没有意义的, 缺乏支持的SLA就失去了承认其内容的基础。
2.2.2.2 IT服务的财务管理
财务管理针对于IT服务的谨慎从事。例如,当所提供的IT服务在进行中时,财务管理将提供其导致的成本信息。这样使考虑IT架构或IT服务的改变时,能够合理地考虑成本和利益(价格和性能)之间的关系。财务管理中对成本的鉴别、分配、预测和监控使成本成为可知因素,减少成本和预算的差距。 重点结合IT服务组织的赢利, IT服务的财务管理描述了多种支付方法,包括设立支付和定价的目标,以及预算计划。
。
15
。
财务管理负责对成本及IT服务投资回报的会计核算,并管理任何来自于客户的成本。财务管理需要与能力管理(Capacity Management),配置管理(Configuration Management,包含资产数据),以及SLM的良好接口, 来确定服务的真实成本。 在IT组织预算谈判阶段和客户的IT耗费核算阶段, 财务管理很可能与业务关系管理(Business Relationship Management)及IT组织密切相关。
2.2.2.3 能力管理
能力管理是优化成本,获得时间,以及开发IT资源的流程,来支持与客户签订的服务条款。能力管理针对资源管理,性能管理,需求管理,建模,能力计划, 负载管理,以及应用软件能力推测。能力管理强调用计划来确保所签订的服务级别可以被履行和成长。
能力管理负责确保在所有时间具备足够的可用能力,以满足业务需求。 能力管理不是简单地与系统部件的性能相关, 而是直接与业务需求相关。 在那些与能力问题相关的困难面前, 能力管理在突发事件决策和问题鉴别过程中被引入。
能力管理提交变更请求以确保得到适当的可用能力。 这些RFC被提交给变更管理流程, 其实施可能影响若干CI, 包括硬件, 软件和文档,并需要提供有效的版本管理。
能力管理应该在评估所有变更时被引入, 用来确定变更导致的在能力和性能上的影响。 这种影响在变更实施前后都有可能出现。 能力管理应该特别关注变更在一定周期后引起的累积性变化。 容易被忽略的单个的变更往往在经过累积后, 引起响应时间衰减, 文件存储问题, 和对处理能力的过度需求。
2.2.2.4 IT服务持续性管理
此流程在业务中断时对IT服务进行灾难恢复措施的准备和计划。 业务持续性管理为客户组织遇到灾难时准备好紧急预案, 根据此预案采取与IT服务相关
。
16
。
的预防灾难发生的措施。 IT服务持续性管理流程对技术, 财务和管理资源需求做好计划和协调, 确保灾难发生后可持续提供服务, 并就其内容达成客户同意。
IT服务持续性管理与一个组织在业务中断后在某个可允许范围内继续运作的能力密切相关。 至少要保证最基本的业务运行所需要的IT服务, 预先对其服务级别作出规定, 并和客户达成一致。 有效的IT服务持续性需要一个平衡的风险缩减措施, 例如有弹性的系统和备份恢复设施。 配置管理流程中的数据被用来辅助其计划和预防措施。 需要对架构和业务变更对持续性计划造成的潜在影响进行评估。 有关IT和业务的计划应该提交变更管理程序。 在持续性管理流程中, 服务台承担着重要角色。
2.2.2.5 可用性管理
可用性管理是确保资源, 方法和技术得以适当拓展的流程, 以支持与客户签订的IT服务条款。 可用性管理针对所遇到的问题, 如优化维护等, 并且设计测量指标, 最大程度减少意外突发事件的数量。
可用性管理与IT服务的设计, 实施, 测量和管理相关, 确保规定的业务需求中有关可用性的内容被贯彻。 可用性管理需要理解IT服务失效发生的原因和恢复服务所需的事件。 突发事件管理和问题管理提供了关键输入
SLA中描述的可用性的目标在可用性管理流程中被监控, 并包含在其报表中。 此外, 在支持服务核查制度所提供的测量和报表中, 可用性管理对服务级别管理(SLM)流程提供了支持。
。
17
。
2.3 运维服务管理规划
2.3.1 第一阶段:服务磨合阶段
第一阶段,又称为运维服务磨合阶段,工作目标主要是通过服务管理,将客户现有的无序救火式突发事件服务有序化,实现突发事件管理,所有的突发事件将运用技术、管理与流程相结合的方式,做到统一管理,统一任务分发,安排合适的人员处理合适的事件。所有的突发事件全过程可控制、跟踪、即时回馈,让每一个客户能够随时查询到事件处理过程,不会出现焦虑、服务要求长时间无人响应或服务要求根本无人响应的情况,从而提高客户满意度,提高运行维护效率,提高客户使用业务信息系统的效率,从而做到提高总体生产力。
现今客户大都没有真正意义上的配置管理系统。配置管理系统,顾名思义,含有业务信息系统及终端设备详细清单,配置情况,针对于业务信息系统的操作
。
18
。
系统服务运行情况,终端运行软件情况,使用软件资产情况等,以及每一次配置改变的记录,做到配置的改变都有迹可查,将软硬件资产系统化的管理起来。
用一句话概括我们上述两项服务:将无序的突发事件有序化,将纸制的配置管理信息化。就是我们突发事件管理以及配置管理的目标。
ITSM所定义处理突发事件的工作目标是规避与尽快恢复。运维服务的目标不是尽可能多,尽可能快的完成服务,而应该是尽量避免事件的发生,当然,这不是一步可以到位的,因此,在第一阶段,我们需要做到尽快恢复客户的正常使用,故:在处理突发事件时,我们不分析事件发生的原因,只收集有价值的事件/故障信息,并在最短的时间内将客户的设备恢复到正常使用状态。针对于重复/频繁发生的突发事件,我们需要转问题管理流程,予以处理。问题管理,也就是事件的原因分析以及根除此事件的解决方法管理,我们需要对突发事件发生的原因,使用专业的方式予以分析,如使用国际QA标准,使用鱼骨图,使用柏拉图等方式来分析出可能的原因,并对原因予以检测和测试,提出根本解决事件的方案。
鱼骨图分析法
柏拉图分析法
。
19
。
问题管理,仅提出解决问题之道,也就是根除某突发事件的方案,具体的处理步骤,交由实施管理来执行。
实施管理,又叫做发布管理,因根除故障特别是信息系统缺陷时,需要严格处理过程,避免在线运行业务受到不可预计的影响。我们在发布过程中都会预计到一些可能的影响,如更改交换机配置可能导致部分终端无法使用网络;修改某一个数据库字段可能导致数据混乱;修改某段代码可能导致整个程序陷入死循环等。因此实施管理必须能有效并切实的分析大部分存在或者隐含的风险。试想我们在更改交换机配置前经历过充分测试,将中断网络时间缩短为五分钟并且通知到全部/大部分可能受影响的客户;修改数据库字段或代码前在虚拟测试平台或访真数据库中反复测试,而后予以发布;将发布的时间定在非使用高峰期。这样,可以规避大量风险,保证问题解决的安全可靠。
越维风险控制模型
风险识别风险分析风险应对计划编制风险监控
。
20
。
凡涉及到解决问题,必然关联到变更。变更管理的作用,是保证每一步的配置更改,都有迹可查,有人可寻。在工作中是否遇到过有人修改了系统代码,您却不知道是谁改动了哪些地方?验收后提供的系统原代码不知道是否与在线系统原代码相符?有哪些地方不同?是哪些人修改的?您的设备是否与刚采购的时候配置情况相同?保修情况始终保持不变?变更后的资产是否已经更新配置库?变更管理将为您解答上述问题。
第一阶段的服务,就涵盖上述五个方面的服务内容,总结描述:将无序的突发事件有序化,将纸制的配置管理信息化,问题管理科学化,实施管理风险可控制化,以及变更管理记录化。
2.3.2 第二阶段:主动服务阶段
重点是在改良前一阶段的服务基础上,将前一阶段的大量响应式服务,部分主动式服务,转换为主动服务为主导,科学的规避故障发生,做到故障可控制化。因此,第二阶段的服务内容,主要包括:实施&测试、安全管理、IT服务规划,以及规模管理、可用性管理、服务级别管理和成本管理。
实施&测试:前面我们讲实施管理,包含有上线前的充分测试等工作,那这一个实施&测试是否重复呢?此处的实施&测试,是与业务信息系统开发质量管理相关的实施管理和测试管理工作。
随着业务信息化需求的不断提高,业务系统的升级也随之产生。是Down掉原有系统建设新的,还是在原有系统基础上进行修改?是用新的服务器替换掉原有服务器,还是在原有服务器上升级?这些处理,都面临一个必不可少的阶段:切换。客户往往不愿意更换已经使用习惯了的系统,除非系统已经不能满足他的实际工作需求,但老系统总是存在大量缺陷,且运行效率低下,导致业务部门的工作效率也随之下降。那么,为什么客户不愿意更换系统?原因是不熟悉。已经开顺手的车不会容易出事故,已经用顺手的手机可以方便的找到每一个联系电话,而新系统的培训,是否进行得完善?新的业务流程讲解,是否让每一个业务部门人员熟悉了?新系统是否有这样那样的缺陷而导致更低下的效率?新系统是否能够承载足够多的用户访问?新采购的硬件是否能够保证质量?业务系统
。
21
。
可以通过分析代码来找寻缺陷,但是需要的时间过长,可以在测试平台上对每一个功能进行测试,但是无法满足压力测试,只有将多种测试手段有机结合起来,才能保障新系统的质量,如使用Winruner予以界面测试,使用Loadruner进行压力测试,并管理好开发商的培训工作,将给实施与测试工作带来实质性效果。另外,选择合适的发布时间,做好发布计划,也是实施管理工作的重点。
安全管理,指服务过程的安全类服务、风险控制以及与客户的数据安全协议。安全类服务如网络病毒防治,网络反黑,入侵检测等技术类服务,风险控制如服务过程中各种风险的分析、规避等管理。技术类工作可以通过软件等工具来实现,如系统补丁分发,防病毒软件升级及策略优化,网络安全性优化,增加入侵检测系统(IDS)等,这些服务也能够在第一阶段中开始,而风险控制和客户数据安全性协议,则完全通过人员管理、流程管理来实现。标准的ITSM流程是能够做到0风险的,但在实际处理过程中却往往不可能做到0风险。毕竟流程是靠人来运转,而人员是否能够完全遵照流程的指导来执行,就是管理方法的问题了。运维被称为People Business,就证明人员管理犹在流程管理之上。因此,运维人员素质是一个至关重要的条件。越维人员稳定,且大都经历过保密培训,这些都是实现安全管理的必要条件。另外,我们在项目启动前将与客户签定保密协议,确保客户数据的安全。
IT服务规划:此时我们对客户的情况已经有所了解,且积累的部分维护服务数据,如果进行了业务系统维护,更应该对客户的业务流程有了一定了解,此时可以针对客户目前使用的信息系统或设备提出服务规划,包括如何建立与推广运维服务系统平台,如何与多方监控软件整合形成集中管理,如何将运维部门由产出部门转换为产入部门等。
规模管理:客户除本部外,还设有系列分部,分布地理位置比较接近,在第一期项目中即可以组成2级服务结构,使用集中式服务台(Service Desk)统一报障以及任务分发,这在资源的充分利用上有很大意义。如越维的某客户单位正在策划将越维设立在总部的统一故障受理平台(Service Desk)服务范围扩充到涵盖全市范围内全市各区分局及所辖下属单位的集中式运维服务管理平台。同
。
22
。
样,规模的扩充将不限于服务台,整体的运维服务也可以在全市服务环境的建立基础上发挥其集中管理覆盖面广的特色。
可用性管理:通过对客户系统环境的了解与熟悉,以及在磨合阶段的系统改良,我们此时充分根据客户实际需求,做出符合客户成本,尽可能高的可用性管理承诺。可用性管理的目标是合理调配有限的资源,采用应急预案等手段保障核心系统的正常运行,可用性承诺是服务方对客户方系统情况的熟悉度结合自身技术承载能力所做出的质量保证。目前,越维对某客户做出的系统可用性承诺高达98%。
服务级别管理:同可用性管理,服务级别管理的目标是保证服务的提供按照服务级别协议(SLA)约定执行,如2小时响应4小时解决。通常在项目初始阶段会有一个初始服务级别(SLA)这是对服务商自身技术承载能力,服务初始资源安排以及客户基本需求的约定,不可能完全符合客户实际情况,那么在第二阶段,已有充分的时间分析客户实际需求,审视自身技术承载能力,两者相结合做出真正符合客户实际的服务级别承诺,并由服务级别调配相关资源。如越维与某客户的一期项目服务级别为所有故障2小时响应4小时解决,而在二期的2005年7至9月中,越维的平均故障恢复时间,仅为18分钟!
成本管理:前面提到了很多“资源”的调配问题,随着对客户系统环境的熟悉,我们能够分析出客户更为实际的需求。如核心业务不能发生故障,而某台不常被使用的普通终端也许两天内修复也不会影响工作,因此不需要提供过多的资源进行紧急维护,成本管理的目标是在客户能够接受的预算内尽可能高的提高系统可用性。运维不是多做突发事件处理,而是降低突发事件的发生率,因此善用工具,减少紧急事件,也能够有效控制成本;做好规模管理,有效合理使用整体资源,更是控制成本的好方案。综上,成本管理的意义,就在于资源的合理,充分使用。
。
23
。
2.3.3 第三阶段:战略规划阶段
第三阶段,客户已经与服务商紧密结合为战略合作伙伴关系,能够为客户制定IT战略规划,能够对客户业务投资建设的信息系统使用所创造的业务价值予以计算与评估,并能够协助业务部门对最终客户予以管理。
2.4 运维服务质量管理
与 “产品”不同,“服务”的提供贯穿于和客户的互动中。 只有当服务被提供时,才能体现其存在和价值。 服务的质量取决于服务提供者与其客户间互动过程中某些协议的实现程度。 客户如何感知服务的优劣, 服务提供者如何考虑所提供的服务,两者都很大程度上取决于他们的经验和期望。
提供服务的流程是生产和使用的一种组合方式,通过流程使服务提供者和客户同时参与服务的过程。客户对服务的感知主要来自于服务供应的过程。客户通常用以下问题评价服务的质量:
所提供的服务是否达到期望?(质量可衡量性) 能否在多次服务中得到同样的质量?(质量稳定性) 服务所需成本是否合理?(质量与成本)
服务是否达到客户期望主要取决于客户在多大程度上赞同所交付的服务内容, 而不是服务提供者提供了多“好”的服务。 因此开展有效的和持续的客户对话机制极为重要。
服务质量取决于服务完成客户需求和期望的程度。为了能够提供所需的质量, 服务提供者应该持续评估服务经验, 了解客户对未来的期望。不同客户考虑的内容和方式都不尽相同。因此优质服务都是为客“户量身定做”的,这也是服务区别于产品的主要特点。
。
24
。
ISO-8402对质量的定义是:“质量是一个产品或服务就其具有的能力满足确定的或暗示的需求的总体特性。”质量“高”往往意味着产品或服务在某种程度上超过了客户的期望。
在质量得以保证的同时,成本也是客户同时考虑的因素。或者说在就其对服务的期望达成协议之后紧接着的步骤就是对成本达成协议。服务成本必须是合理的 --- 对于服务提供者来说体现其实施成本与合理利润,对于客户来说是建立在对服务市场的合理理解与选择之上。
客户对服务质量评估的另一重要依据是服务的一贯性。如果服务提供者偶然能够提供超出客户期望的服务, 但在其它时间却常常让客户失望, 则显然不能称之为质量合格者。 “持续的质量”是最为重要的, 也常常是服务业最难以实现的目标。
服务(或产品)的提供是通过交付行为实现的。 而其质量很大程度上取决于组织这些行为的方式。 Deming质量轮提供了一个简单有效的质量控制模型:
这一模型假设要实现有效的质量控制, 必须重复履行以下步骤:
。
25
。
计划(Plan): 应该做什么?什么时候做?谁去做?如何做?借助什么
去做?
执行(Do): 实施计划的行为。
检查(Check): 确定执行行为是否提供了预期的结果。 效果(Act): 基于检查得到的信息修正计划。
有效和适时地推动此轮旋转, 意味着服务行为被按照各自的计划和检查机制分为各子流程。 必须清楚谁在组织中负有责任, 他们被授权修改哪些计划和程序, 不仅为某一个行为, 而且为每一个流程。
质量管理(Quality Management)是在提供服务的组织中工作的每一个人的责任。 每一个员工必须明白他对组织作出的成果如何影响工作质量, 影响其他同事作出的工作质量, 并且最终如何影响整个组织提供的服务质量。 质量管理同时意味着持续地寻找改进组织的机会,实施能够改进质量的行为。
质量保证(Quality Assurance)是组织内部的重要政策,用来保证质量管理的实施。 它集中体现了一整套质量衡量标准和履行程序,保证组织能够提供持久满足客户期望及相关协议的服务。质量保证确保质量管理所实施的成果处于可维护的状态。
综上所述,本次越秀工商运维项目的服务质量管理,围绕质量系统的服务流程是保证服务质量持久延续的有效方法。
2.5 建立运维管理规范 2.5.1 运维管理规范概要
我门与XX企业共同学习ITIL、ITSM、BS15000、ISO20000与ISO9000等国内外先进标准,运维管理规范采用ISO9000模式编写,涵盖服务管理体系、服务级别管理、服务台管理流程、突发事件管理、问题管理、变更管理、发布管理、配置管理等方面,如下图所示:
。
26
。
如上图所示,是一个金字塔结构。处于最高层的,是《客户满意度指引》,一切服务均以“保证客户最大满意度”为前提展开。与之同级的还有服务管理体系文件与总体文件,用以与服务管理体系相结合,并且维持服务管理规范的改良性原则。处于中层的,是ITIL核心的11个标准流程,均根据XX企业实际情况进行了修订和优化,以确保在XX企业实际工作中能够得到实际应用,运维管理规范是各种操作指南与巡检制度,包括日常管理制度等,确保提供给客户的服务,是统一形象的规范化标准服务。巡检制度的建立,为XX企业信息系统“提高系统可用性、提高系统健壮性、提高各级人员技能素质”的“三提高”目标奠定了坚实的基础。
。
27
。
第3章 信息系统运行保障方案
3.1 统一服务台建设
提供统一报障电话,统一报障、统一维修接口,XX企业可以通过统一的报障电话申请服务、查询服务处理进程,跟踪处理进度,确保服务时效、控服务质量、调查用户满意度。这个统一的服务接口,在国际上有个标准的称呼:服务台(Service Desk)。我们将为XX企业建立统一服务台,提供优质、专业的报障受理、跟进服务;
服务台总体架构如下:
服务台(服务台)在服务支持中扮演着一个极其重要的角色。完整意义上的服务台可以理解为其他IT 部门和服务流程的“前台”,它可以在不需要联系特定技术人员的情况下处理大量的客户请求。对用户而言,服务台是他们与IT 部门的唯一连接点,确保他们找到帮助其解决问题和请求的相关人员。
服务台不仅负责处理事故、问题和客户的询问,同时还为其它活动和流程提供接口。
这些活动和流程包括客户变更请求、维护合同、服务级别管理、配置管理、
。
28
。
可用性管理和持续性管理等,服务台还负责事件快速响应,使用已知问题、已知事件知识库对终端用户的突发事件予以快速恢复或规避事故发生。
3.2 建立文档管理制度
文档管理的目标是通过对运维服务过程中使用的文档进行统一管理,达到充分利用文档提升服务质量的目的,确保运维资源符合运维服务的要求。文档资源包括运维体系文档、项目(软硬件)文档资料、服务质量管理文档以及服务报告文档等。
双方的职责为:XX企业:负责批准运维文档的更改、删除和发布。XX企业运维部组织编写及更改运维文档;批准文档的借阅申请。运维服务商负责更新文件目录清单;负责保管文档资料;负责备份文档资料;检查各类在用文件的有效性,防止使用无效版本;负责定期提交服务质量管理文档以及服务报告文档等。
文档资源管理流程图
。
29
。
运维文档项目文档其他文件资料运维部组织编写【配置管理】流程中对项目文档的配置项进行登记登记《文件登记表》是否通过信息中心审批?运维文档发布,更新《文件目录清单》更新《文件目录清单》是否通过运维部审批?是否是否需要更改?是文件更改提出人填写《文件更改申请单》否是否需要删除?是否更新《文件目录清单》相关人员填写《报废申请单》否是否通过运维部、信息中心审批?是运维部组织人员进行文档更改,记录更改过程和结果是否通过运维部、信息中心审批?是在《文件目录清单》向将该文档删除否否是否通过运维部、信息中心审批?是更新《文件目录清单》是否借阅文档?是否是否需要备份?是否填写《文件借阅申请单》运维服务商对文档资料进行备份,填写《文件备份记录》否是否通过运维部审批?是借阅文档,并按期归还运维服务商不定期全面检查各类在用文件的有效性,防止使用无效版本结束图4-4 文档资源管理流程图
文档资源管理的工作程序
文档资源管理包括对以下五类文档进行管理:
运维文档:指运维体系文档,包括运维手册、程序文件、相关支持文件
及表单格式等。
。 30
。
项目文档:指交付运维的软硬件系统相关的文档。 质量管理文档 服务报告文档
其他文件资料:指文件、传真、外来资料等。 A、运维文档编码规则 文档分级 一级文件 (总体) 二级文件 (程序文件) 文档编号规则 A+两位一级文件序列号 B+两位二级文件序列号 说 明 示 例 三级文件 C+二级文件(支持性序列号+两位文件) 三级文件序列号 四级文件 D+二级文件(表单) 序列号+两位四级文件序列号 四级文件编无关号-日期+两联记位序列号 记录 录 编四级文件编号 关联 号-关联记录记录 编号 两位一级文件序列号从01A01:术语表 起顺序递增 A02:总纲 两位二级文件序列号从01B01:服务级别管理起顺序递增 程序文件 B02:服务台管理程序文件 三级文件均从某个二级文C0101:服务等级件产生,此处的二级文件序规划 列号是指与本文件对应的C0102:服务目录 二级文件序列号;两位三级文件序列号从01起递增 四级文件均从某个二级文D0201:运维工作件产生,此处的二级文件序单 列号是指与本文件对应的D0302:工单跟踪二级文件序列号;两位四级记录 文件序列号从01起递增 四级文件编号指该记录对D0201-2005031401: 应的四级文件的编号;日期运维工作单记录 按“yyyy+mm+dd”格式编写;两位序列号从01起递增 四级文件编号指该记录对D0302-D0201-200503于的四级文件的编号;关联1401: 记录编号指与本记录的产工单跟踪记录 生相关联的记录的编号 B、运维文档的更改、删除
运维文档由运维部负责组织编写,经XX企业信息主管部门批准后颁布执行。所有运维文档经批准后,由运维服务商统一归入《文件目录清单》中。
《文件目录清单》的内容包括文档类型、文档名称、编号、版本号、发布时间、内容说明、保管位置、保存期限等。
运维文档需要更改时,由文件更改提出人填写《文件更改申请单》,说明更改原因和更改内容。经运维部、信息中心批准后,由运维部组织人员进行文档的
。
31
。
更改,并记录更改过程、更改内容、更改结果等。更改结果经运维部、信息中心确认后由运维服务商更新《文件目录清单》。
若需删除运维文档,则需由相关人员填写《报废申请单》,说明删除内容、删除原因等,经运维部、信息中心批准后由运维服务商在《文件目录清单》中将该文档删除。
C、质量管理文档的应用
服务质量管理文档主要分为服务回访文档、服务满意度调查文档、服务投诉处理文档三类。三种文档均为保障与提高客户满意度为目标所制订的《客户满意度指引》中的部分,属于运行服务管理体系最高层指导文件,以确保“从服务的角度出发”为客户提供五星级的运行服务。
根据ITIL标准与《规范》的要求,所有的事件均由服务台受理,服务工程师处理完毕后,由服务台完成回访并关闭事件流程,因此回访动作将直接获得客户对当次服务的评价,并由客户的评价获得服务质量改良的依据。
在ISO20000戴明环的指引下,服务团队质量管理小组将分析运行服务过程中成功回访的客户对当次服务的直接评价,并收集尽可能完整的评价信息,通过每周的部门例会对客户的评价进行汇总分析,并提出可能的原因和可能的改进办法,回访与总结例会记录样本如下:
。
32
。
3.3 一般信息化设备及相关软件运维管理 3.3.1 一般信息化设备服务范围
本次项目的服务范围包括XX企业办公区域内的台式机、打印机以及客户端所有常用的办公软件(包括操作系统软件、系统应用软件、系统管理软件、办公软件、工具软件等)。
3.3.2 一般信息化设备运维
1、 根据实际需要,经XX企业同意准备相应数量的维护零配件,协助XX企业进行备件库的管理,并在零配件不足时及时补仓。
2、定期对计算机设备进行保养维护,定期进行用户满意度调查; 对一般信息化设备硬件进行定期巡检、保养,以保障设备运行正常; 按照越秀工商要求进行硬件设备普查工作,建设可实现动态维护的硬件
设备档案库,并实现与XXX企业的资产管理系统的衔接。 定期对公用信息化设备消毒除尘; 检查硬件实际配置与设备登记表是否相符。 3、对故障设备的维修
在响应时间内完成故障设备的维修,维修人员应严格遵守维修规程。 建立硬件应急维修小组,对关键重点岗位及紧急的故障及时响应并及时
汇报,对于故障设备的维修由越秀工商指定的具体技术人员组织监督进行;
对处于保修期内的故障设备,供应商在广州市工商局越秀分局授权的范
围内代表越秀工商协调产品供货商予以维修,并监督维修时效和质量; 对处于保修期外的故障设备维修,如需更换零配件,可由供应商提供多
家的报价,经用户选择审核确认后,方可进行更换;
。 33
。
3.3.3 例行维护流程图
运维服务商每月进行一次巡检运维工程师制定《巡检工作计划》,说明采巡检时间安排、巡检内容、巡检地点、资源配合等是否通过服务主管、运维部、信息中心审批?是否运维工程师按照《巡检工作计划》执行巡检工作,并将巡检过程和结果记录在《巡检记录表》中运维工程师在完成巡检工作后,对巡检结果进行评估,并提出意见和建议,形成《巡检报告》是否通过服务主管、运维部、信息中心审批?是巡检过程中是否发现问题?否是否转【问题管理】流程中系统存在问题流程处理巡检过程是否有不符合的配置项?否结束是转【配置管理】流程处理图4-3 例行维护流程图
。 34
。
3.3.4 一般设备服务方案
3.3.4.1 信息化设备资产调查及管理
资产标签应含有上图所注所有信息,包括资产名称、合同采购号、产品序列号、保修期限、IP地址、系统序列号以及供应商、联系人名称、电话,使用条形编码统一进行资产记录。条形码记录号应与数据库中记录对应,关联使用人、资产配件(如显示器、键盘、鼠标、打印机、音箱等型号信息),所有资产应落实到具体责任人,共用设备按照编码顺序先后指定责任人。
设备封条统一为纯白色易碎贴,使用设备封条将有效的保障客户设备的完整性,明确区分设备保管的责任性。服务工程师上门服务时一旦发现设备封条破损,将现场进行设备现状与资产清单的对比,避免出现保管责任不清的状况发生。
3.3.4.2 一般设备软件安装及维护
此部分主要解决在用户使用当中遇到的软件各种问题,在进行软件维护时应做好用户数据的备份,建立软件维护流程,通过现场解决及用户培训的多种方式提高用户的使用水平和解决一般问题的能力。
软件维护主要内容包括:
对WINDOWS操作系统的安装、调试及升级;
外设(打印机、扫描仪等设备)的相关驱动程序及软件的安装调试; 经越秀工商授权进行软件安装、升级并排除软件使用过程中的故障; 解决软件冲突造成的系统故障;
对计算机进行病毒检测和清除,防止病毒扩散;
计算机标配的软件备份,包括随机恢复光盘,附带赠送软件、驱动程序
等;
计算机外设的软件备份。
。
35
。
3.3.4.3 一般设备硬件日常保养及维修
计算机硬件维护:包括主机、硬盘、驱动器、显示适配卡及服务器等安装、调试和配置,充分利用现有设备,进行系统优化配置;对使用中的计算机存在或将要出现的故障进行及时的诊断、维修、替换,对客户原厂保修的机器(如计算机及配件、服务器等),我们代为联络维修,并跟踪维修情况。并根据越秀工商需要,对设备进行升级或更新,保证设备正常运行。
周边设备的维护:包括打印机、扫描仪、显示器等使用过程中出现的故障或不稳定因素排除,必要时对越秀工商原厂保修期内的机器,我们代为联络维修,跟踪维修情况,并根据客户需要,对设备进行升级或更新,保证工作任务的正常进行;
系统硬件设备(计算机、服务器,路由器,交换机、备份设备、MODEM等)、计算机线路连接、各种设备工作状态例行检查和维护;
操作项目
维护工程师每月的对XX企业计算机设备的巡检服务,了解和记录最新的使用情况,对各终端在用办公软件予以普查并核对运维软件资产记录,通过月服务报告上报XX企业普查情况;对经常出现问题的设备进行登记和记录,并且制定知识库,对常出现的设备要重点检查、消除隐患,最大限度降低计算机设备的故障率。
维护工程师在对用户维护的时候,必须按照服务流程来进行,给用户提供快速、标准、满意的服务。对保内的计算机硬件进行免费的更换,时间方面按照原厂商的服务标准时间来进行。对保外的设备,由工商局申请须更换的设备,有工商局提供硬件费,维修费情况按照合同约定执行。
对经过维修或已更换配件的设备,根据具体情况延长保修期并更新资产库记录,更新配置库记录。
。
36
。
对终端用户的输入设备以及公用设备予以定期消毒处理。
对终端用户的在用办公软件、资产使用情况普查,并汇总巡检报告提交给越秀工商。
运维服务商每月进行一次巡检运维工程师制定《巡检工作计划》,说明采巡检时间安排、巡检内容、巡检地点、资源配合等是否通过服务主管、运维部、信息中心审批?是否运维工程师按照《巡检工作计划》执行巡检工作,并将巡检过程和结果记录在《巡检记录表》中运维工程师在完成巡检工作后,对巡检结果进行评估,并提出意见和建议,形成《巡检报告》是否通过服务主管、运维部、信息中心审批?是巡检过程中是否发现问题?否是否转【问题管理】流程中系统存在问题流程处理巡检过程是否有不符合的配置项?否结束是转【配置管理】流程处理图4-3 例行维护流程图
一般信息化设备硬件服务还包括:
供应商根据实际需要,经XX企业同意准备相应数量的维护零配件,
协助越秀工商进行备件库的管理,并在零配件不足时及时补仓。
。 37
。
定期对计算机设备进行保养维护,定期进行用户满意度调查; 对一般信息化设备硬件进行定期巡检、保养,以保障设备运行正常; 按照越秀工商要求进行硬件设备普查工作,建设可实现动态维护的
硬件设备档案库,并实现与越秀工商的资产管理系统的衔接。 定期对公用信息化设备消毒除尘; 检查硬件实际配置与设备登记表是否相符。 对故障设备的维修
在响应时间内完成故障设备的维修,维修人员应严格遵守维修规程。 建立硬件应急维修小组,对关键重点岗位及紧急的故障及时响应并
及时汇报,对于故障设备的维修由越秀工商指定的具体技术人员组织监督进行;
对处于保修期内的故障设备,供应商在广州市工商局越秀分局授权
的范围内代表越秀工商协调产品供货商予以维修,并监督维修时效和质量;
对处于保修期外的故障设备维修,如需更换零配件,可由供应商提
供多家的报价,经用户选择审核确认后,方可进行更换;
3.3.4.4 客户端病毒处理
在越秀工商授权下,使用越秀工商已有的Symantec企业版,对存在病毒的终端予以隔离,生成事件安排工程师予以处理。
3.3.4.5 第三方维修管理
当运维过程中需要转由维修商提供服务时,由运维工程师填写《维修商服务工作单》,描述需维护的产品名称、问题描述、问题类型、优先级、服务级别以及服务要求等内容。《维修商服务工作单》经服务主管审批通过后提交给维修商,维修商在收到《维修商服务工作单》后应签收确认,并向投标人返回一份副本。
当《维修商服务工作单》经服务主管审批不通过时,由运维工程师修改《维修商服务工作单》并重新提交;如果审批意见为不采用维修商服务方式,则转【问题管理】流程处理。
。
38
。
维修商按照《维修商服务工作单》的要求提供服务,在工作单中记录维护处理、处理建议及维护处理结果,并得到客户的签字确认。维修商在维护服务工作完成后将填写好的《维修商服务工作单》提交给运维工程师。
运维工程师根据维修商提交的《维修商服务工作单》对维修商服务过程和结果进行验证。验证通过的,运维工程师签字确认,与本次维护对应的《运维工作单》一起提交给服务主管。验证不通过的,则在《维修商不合格情况记录表》中记录该维修商不合格服务时间、原因和对应工单编号后,由运维工程师重新提交《维修商服务工作单》,再次发给维修商。
若维修商每月不合格服务次数超过2次(不含2次),则由服务主管填写《增加维修商黑名单申请表》,说明将该维修商列入黑名单的理由,并提交给运维部、信息中心审批。经审批同意后,由服务主管将该维修商的编号、名称、列入黑名单时间、列入黑名单原因等内容登记在《维修商黑名单》中。建议列入黑名单的维修商不得参与工商局任何项目的投标和建设工作。
当该维修商每月不合格服务少于2次(不含2次)时,服务主管填写《撤销维修商黑名单申请表》,说明将该维修商从黑名单中撤销的理由,并提交给运维部、信息中心审批。经审批同意后,由服务主管将该维修商从《维修商黑名单》中删除。
3.3.4.6 知识库管理
问题处理完成后,由服务主管对问题处理过程和结果进行总结分析,并进行归类,将相关信息登记在《运维知识库》中。加入《运维知识库》的信息应正确归类,并保证各项内容描述简洁、清晰、易懂,同类相似的问题应归类到同一条知识库记录中。
《运维知识库》主要内容如下:
问题类型:分为系统软件、应用软件、硬件、咨询、其他等。
软硬件系统类型:对问题类型中的分类再根据软硬件系统的不同进行细分,
例如:
系统软件:WINDOWS操作系统、LINUX操作系统、数据库系统、办公系统软件等;
。
39
。
应用软件:广告管理子系统软件、内资注册登记系统、外资注册登记系统等;
硬件:PC机、服务器、笔记本电脑、打印机等; 咨询:使用操作咨询、安装操作咨询等; 其他:不属于上述类型的其他情况。
故障类型:根据软硬件系统类型按故障现象进行分类,例如对于PC机,可
能的故障类型包括死机、频繁重启、无法启动、光驱不能正常操作、显示器不能正常显示等。
故障现象:故障现象的简要描述,同类相似的故障现象尽量保持同一描述。 故障原因:故障原因的简要描述。
解决方案:排除此故障的处理措施的简要描述。
关联表单编号:列举本条知识库记录是从哪些相关表单中获取的信息。
服务主管应不定期地检查《运维知识库》,发现相似的故障描述时应合并成一条知识库记录,如果发现有更好的解决方案时,应将该方案更新到《运维知识库》中。
3.4 防(杀)病毒服务 3.4.1 防病毒服务需求
在用户的指导下完成防杀病毒工作。
(1)、范围包括办公区域内的客户端及服务器;
(2)、对XX企业现有的XX杀毒软件客户端进行升级维护;
(3)、无法解决的病毒问题需在得到具体用户和XX企业技术管理部门即分局信息室确认后才能进行系统重装。
3.4.2 制定合理的防病毒策略和安全管理制度。
运维团队协助用户制定合理防病毒策略和安全管理制度,并设立防病毒管理员,他的工作职责是:
收集和整理整个网络内防毒相关信息
。
40
。
配合防病毒厂家专职服务人员建立用户数据库档案
在病毒事件中,第一时间与防病毒厂家专职服务人员进行联系,
并通过Web方式在线提交可疑文件
与防病毒厂家专职服务人员进行沟通,发出远程支持或现场支持
的申请
接收到防病毒厂家专职服务人员提供的预警信息后,及时在全网
内部进行通告
与防病毒厂家专职服务人员一道制订定期巡检计划 推行全网病毒防护管理策略
负责防病毒服务器总控管中心的管理,实时了解全网病毒防护状
况,并做出安全评估,对出现管理漏洞的管理节点提出相应的改进建议
转发防病毒厂家专职服务人员递交的相关技术文档 防病毒产品的日常维护 防病毒产品及时更新确认
分析已产生的病毒事件,确定传播源 定期的系统安全漏洞评估
3.4.3 客户端防病毒升级软件
登记所有客户机、服务器,包括主机名、IP地址、操作系统类别、使用者等,并查明是否安装防病毒软件,是何产品。这样在发生病毒事件后,可迅速确定病毒传播源,并进行有效清除。对于没有安装防病毒软件的终端协助安装。
无法解决的病毒问题需在得到具体用户和XXXX企业技术管理部门即分局信息室确认后才能进行系统重装。
3.4.4 防毒组件及时更新
定期(每天)通过控制台查看各类防病毒软件,确保病毒码、扫描引擎已更新至最新,包括服务器端或客户端。
。
41
。
通过趋势防病毒软件的集中管理功能实现管理工作,如发现有未及时更新的情况,应迅速处理。同时协调员可通过总控管中心每周了解全网的防病毒软件的更新状况。
3.4.5 每周防毒系统部署情况统计
使用防病毒厂家扫描工具定期(每周)对所辖网络中的不同网段进行扫描,确保在线的客户机或服务器均已部署趋势的防病毒软件,且病毒码及扫描引擎已更新至最新,同时生成未安装防毒软件机器的列表,对未安装防毒软件的机器进行强制安装或通知安装。
3.4.6 每周对产生的病毒事件进行评估
将每周发生的病毒事件在管理控制台以CSV文件格式导出,并进行详细评估,查找病毒感染原因,并将此报告提交至感染较严重者的部门管理人员,督促相关人员增强自身管理。
收集各病毒管理员提交的安全评估报告,进行总结,提交上级领导。
3.5 信息资产巡检及普查服务 3.5.1 主动巡检
为了确保XX企业IT资产长期、稳定的工作,最大限度和降低计算机的运行故障及延长计算机设备的使用寿命,为XX企业管理人员提供辅助决策的有效数据,项目组服务工程师对越秀工商的计算机设备提供定期的巡查及保养服务。
项目IT设备维护工程师在日常工作中,除了处理日常维护工作以外,由被动服务变主动服务,主动到进行日常巡检巡查服务,通过日常巡检巡查服务排除故障隐患,降低故障率。并通过以往XX企业维护数据分析,详细总结XX企业各使用部门的具体故障情况,并及时对故障多发和高发地点进行预防性巡查。
日常巡查主要包括以下内容:
应用系统的优化、数据的整理、常见故障的排除。 升级防病毒软件,检查系统软件补丁情况。
。
42
。
协助用户备份重要资料,对用户进行指导。 系统软件补丁升级,数据备份与恢复。 计算机病毒的查杀与升级。
调试计算机,将设备调试到最佳状态。
设备清洁保养:通过清洁保养服务,最大限度降低设备的故障率,延长设备的使用寿命,同时为越秀工商的工作人员提供一个整洁、干净的工作环境。
硬件设备运行情况巡检:了解和记录XX企业计算机设备的最新使用情况(包括新增设备情况、已有设备的维修情况、耗材的使用情况、关键设备的运行情况等),检测设备的运行情况,排除故障发生隐患,最大限度的降低计算机硬件设备的故障发生率,对一些经常出现故障的设备和关键设备要进行重点的检查。同时对一些已老化需淘汰的计算机设备进行记录并向越秀工商信息主管部门进行反映、提出备机建议。
系统及软件运行情况巡查:系统的优化、数据的整理、常见故障的排除;计算机病毒的查、杀、防毒软件的定期升级;根据使用人员的要求、提供系统软件的升级。系统数据的备份与恢复。服务小组的工程师将利用母盘克隆、网络备份、存储备份等方法把重要部门的系统和数据安全备份,出现故障时在最短时间内进行数据的恢复。
3.5.2 信息资产普查
为全面掌握越秀工商的信息资产情况,每半年进行一次资产普查工作,并提交资产清单。包括硬件的配置、数量、使用人、保修期限、软件类型、软件系统序列号、软件授权、软件光盘及说明书等。
在运维服务的日常工作中,采用《服务工作单》记录资产变更情况,汇总变更情况,更新资产记录。
在服务期满前应再协助采购人进行一次资产普查工作,并核对资产记录,提交最终资产清单。
3.6 其它有关说明及要求
XX企业为本次项目提供运维办公场地、电话、运维后台操作计算机设备。
。
43
。
我们提供全套设备维修、保养、检测工具,调测仪器。
同时我们提供了相应的服务水平质量保障承诺文件。(见第6章《服务水平质量承诺及服务管理》)
我们提供完整可行的运维实施方案,并保证可在入场15个工作日内向XX企业提供整体运维方案及实施计划(其中应包括标书所要求的功能点,并具有相应运维工作成效评估方案),并确保相应资源准备到位。协助XX企业制订可持续的信息系统运行维护发展战略。
44
。
。
第4章 运维服务计划方案
4.1 运维服务准备
做好运维服务项目的准备工作是项目顺利完成的前提条件。在运维服务项目开始前,越维将积极做好前期准备工作,在这个阶段,有三个主要步骤:
4.1.1 签定必要的协议和约定
我们将配合XX企业,考虑服务外包可能产生的信息安全风险,并签署信息保密协议;同时对项目中涉及的各类软硬件资产、工具的知识产权做出明确规定与声明。
4.1.2 人员准备
越维依据服务方案,培训相应数量、具备相应技术资质的专业服务人员,并向越秀工商提供这些服务人员的:
身份证明; 健康证明; 劳动关系证明; 保险证明;
学历和技术专业资质证明;
4.1.3 工具准备
依据服务方案,针对企业的IT资产类别、数量等为服务外包项目准备相应的备机、备件以及工具。
服务工具包括软性工具和硬性工具,软性工具包括服务商开发的各类服务管
。
45
。
理软件系统、知识库系统、针对客户方IT资产的文档和驱动程序库等;硬件工具指维修、保养、检测工具及调测仪器等。
4.2 项目人员组织 4.2.1 人员结构
根据越秀工商的信息系统运维要求,越维派出长期驻场服务人员2人,项目驻场服务组按工作类型分为服务台人员(由硬件维护人员兼任),硬件维护人员。
服务台人员:负责项目服务中客户服务申请受理,已知故障/问题快速解决,客户回访,客户情绪安抚,资产标签制作,数据统计整理,运维项目文档管理以及运维场地整理工作。
硬件软件维护人员日常工作包括硬件设备维护及软件维护。 硬件维护管理日常任务:
1) 运维服务中的定期硬件巡检、日常维护与保养、定期输入设备消毒除尘、
资产标签张贴、硬件维修、终端网络维护、第三方设备维修管理,备品备件管理工作。
2) 对越秀工商终端用户的设备进行病毒查杀工作,且按照越秀工商要求每
月末提交病毒处理服务统计分析报告。
3) 对越秀工商不同处室部门终端人员使用的终端设备,以及各业务系统数
据库形成基线,并进行基线管理以及配置管理,并对基线的调整以及配置的改变在每月底对XX企业进行报告。 软件维护管理日常任务: 4) 操作系统的安装、调试及升级;
5) 外设(打印机、扫描仪等设备)的相关驱动程序及软件的安装调试; 6) 经XX企业授权进行软件安装、升级并排除软件使用过程中的故障; 7) 解决软件冲突造成的系统故障;对计算机进行病毒检测和清除,防止病
。
46
。
毒扩散;
8) 计算机标配的软件备份,包括随机恢复光盘,附带赠送软件、驱动程序
等;计算机外设的软件备份。
为配合驻场服务,我们还提供了强大的场外支持队伍。项目场外支持人员包括:含项目总监、服务经理、质量管理经理等。
项目总监由技术专家担任,负责批准项目总体方案、实施计划、验收方案,必要时刻的资源调度,与XX企业高层领导交流。
项目经理由部门主管担任,负责编写项目的总体计划,服务实施计划,验收方案并根据项目进度,以及质量要求,安全要求分配各种资源,对项目风险予以控制,代表我们与XX企业沟通,对项目合同的变更有决策权,接受XX企业投诉。
服务经理:负责越维运维服务团队的日常运作管理、工作安排,分析越秀工商服务要求,并分派给具体的运维工程师处理;审查、验证和评估各项运维工作结果,资产管理,运维文档材料审核,向越秀工商汇报工作,各项资源调配,投诉管理工作。
质量管理经理由客户服务主管担任,按照戴明改良PDCA循环方式,负责检查环节,充分与客户沟通,对目前运行服务质量提出待改良点,督促服务改良计划的执行情况,同时负责运维服务全过程的质量跟踪与越秀工商投诉受理、处理、跟踪、汇报工作;同时负责。
4.2.2 人员职责与岗位要求
驻场服务组的要求为:
维护工程师:本科学历,至少3年信息化建设经验,至少2年IT服务管理经验,熟悉ITIL管理标准,至少2年团队领导经验
服务台人员:专科学历,至少1年呼叫中心工作经验,至少1年计算机行业客户服务工作经验,,有良好的客户情绪管理能力。
场外支持组的要求为:
项目总监:至少5年IT服务管理经验,至少5年团队领导经验,市级工商
。
47
。
运维管理经,验熟悉ITIL管理标准,且具有ITIL、ITSM认证,。
服务经理:至少5年信息化建设经验,3年IT服务管理经验,至少3年团队领导经验,市级工商运维管理经验,熟悉ITIL管理标准,并拥有ITSM认证。
4.3 服务计划 4.3.1 服务时间
服务期为从签定合同之日起一年。
4.3.2 进场初始阶段
在服务项目组进场后的1个月,属于资源转移和项目过渡阶段,越维将以充足资源保证项目平滑过渡:
1、XX企业向我司进行的资源转移
XX企业应在服务商项目组正式入场开始服务前进行必要的资源移交和提供工作,以使得项目组尽快开始高质量服务工作,降低前期磨合带来的风险,需要进行资源转移的工作包括:
准备好必要的证件、卡牌;
准备必要的工作地点和工具(依据服务合同);
在维护系统和项目可能涉及的应用系统中开设测试用或维护用账号; 提供项目涉及服务对象的通讯录和不同对象的服务注意事项; 提供项目涉及服务资产的类别、数量、分布情况说明;
提供项目涉及专用系统的使用与维护说明书,并安排对服务商项目组服
务人员的专用系统使用及维护培训; 提供项目涉及资产的过往服务记录;
提供项目涉及服务资产的逻辑地址、口令等信息;
。
48
。
2、我司向XX企业进行的资源转移工作
服务人员接受证件、卡牌并办理必要的登记手续; 现场备机、备件的登记(依据服务合同);
服务工具的登记,尤其是可用于数据存储工具的登记和检查;
4.3.3 第一个服务阶段
在为期一年的服务项目中,第一季度年必须从管理与技术两个方面打好基础。除了日常的服务响应之外,其他重要工作包括:
1、知识库建立
完成时间:入场后第一个月
内容与目的:自入场开始,越维的服务人员将承担各类技术服务请求,这些信息,将被完整的录入越维在线知识库系统。
2、技术文档和驱动程序库的建立 完成时间:入场后第二个月
内容与目的:技术文档和驱动程序库包括了XX企业应用设备及软件系统的软硬件兼容性列表;PC操作系统的备份; PC及外设的全部所需驱动程序以及配套补丁;XX企业计算机系统的病毒防护列表以及预防性解决方案;
3、整理《IT基础架构服务工作指南》 完成时间:入场后第六个月
内容与目的:全面形成《IT基础架构服务工作指南》,确保服务质量的持续稳定。
4.3.4 第二个服务阶段
在IT服务外包项目中,必须以3个月为单位定制切实可行的服务目标。在本项目的前6个月服务期内,越维的总体服务目标是帮助XX企业建立完善的服
。
49
。
务管理体系,确保服务的标准化和客户满意度的持续提升。
在前9个月服务期内,总体服务目标是在继续保证服务质量提升的基础上,对服务所获得的丰富信息进一步分析增值,使之起到辅助决策的重要作用。
4.3.5 服务总结和延续阶段
在服务期结束前一个月开始,我司将全面整理整个服务项目内完成的各项文档、数据,进行必要的资源移交工作,形成下一期服务的整体规划方案。为服务项目的延续做好充分准备。
。
50
。
第5章 应急服务方案
5.1 灾难应急措施
5.1.1 应急措施体制图与总则
一旦发生灾难,由负责人XXX主导:首先保人员安全;其次保关键设备、
数据安全;三是保一般设备安全。
人员疏散的程序是:运行人员立即按响火警警报,并通过119电话向公
安消防请求支援,所有人员戴上防毒面具,所有不参与灭火的人员按照预先确定的线路,迅速从机房中撤出。
人员灭火的程序是:首先切断所有电源,启动自动喷淋系统,运行人员
戴好防毒面具,从指定位置取出泡沫灭火器进行灭火。
人员若在疏散时如有受伤情况,立刻拨打120电话向近邻的医院请求支
援。
。
51
。
5.1.2 大型灾难紧急行动方案
5.1.2.1 发生水害、火害等自然灾害时报警措施:
严格遵守火警处理流程; 关闭供电总闸;
启用灭火设备进行灭火,并打火警电话119; 全力保护重要的数据备份,并转移到安全地点; 完全灭掉各种明火;
尽量保护好火灾现场,协助有关方面勘察分析火灾发生的原因、造成的
损失、提出批评防范措施和需要改进的地方;
对发生火灾造成的损失、原因等做好记录,经部门负责人、联社领导审
阅后,向上级主管部门全面汇报。
5.1.2.2 防雷措施
一旦被雷击后,使设备无法正常运行。由运职人员立刻通知越秀工商主
管部门,叙述情况。
由越秀工商指派相关负责人主导。 现地防雷措施:
为防止高压雷电波侵入设备,可在设备前端采用多种防雷装置。例如,在网络设备前设三级避雷装置可有效分流限压,防止感应雷电波的侵入,三级避雷装置指电源端、UPS端、服务器端。
防雷措施主要针对直击雷和感应雷,一般做法是装设避雷针。
由于广州雨季约在4月——8月,在这段期间必须每月做一次防雷设备的测试。除4月——8月外,必须4个月做一次防雷装置的测试。避雷针接地的接地电阻应≤4Ω。
5.1.2.3 断电处理措施
通讯
。
52
。
1、市电中断后,运行人员应立即切换到备用电源-UPS。 2、运行人员应立即查明原因,并向上一级汇报。 3、立即致电资源调度组长,并协助恢复电源。 现地的设备检查 1、巡查内部设备是否损坏。
2、如有损坏,将设备型号及生产日期记录,向设备抢救员汇报,若设备未过保修期,应立即联系厂家进行送修。
备用工具
1、应定期1个月报一次备件需求,以防网络中断后,备件烧损,能立即更换。
2、备件可存放在库房,由库管做为保管。 市电中断演习
1、所有市电中断后,运行人员应立即关闭所有从UPS取电的不必要电气设备,检查UPS状态、所剩电量,然后检查设备运行情况。
2、向上一级汇报初步情况。
3、致电资源调度组长共同查明原因,尽可能缩短断电时间。时刻与上级保持联系反映最新情况。
4、故障解决。向上级报告故障已处理以及报告处理全过程。 5、撰写文档——做好故障发生时间、处理方法和故障原因的记录。
5.1.2.4 设备入水措施
通讯
1、发生设备入水后,可由服务工程师向越秀工商汇报入水后机器情况。 2、汇报后主要由服务工程师组织人力,进行实施。 场地需求
1、负责人应立即向上一级领导申请场地。 2、人力(包括司机) 3、运输工具(车一辆) 工具需求
。 53
。
1、机器入水后需要向资源调度领取螺丝刀、插线板、硬件备件等工具。 2、用电吹风将机体及零件吹干。 设备入水预演 一、设备入水
1、机器因天灾造成计算机入水,首先第一步机器不能通电,避免硬件烧损。 2、将机器存放在干处,不得放在燥湿,有水处。 3、主机入水立即将水倒出,这样才能将损害减低到最低。
4、将主机机箱盖开启,用电吹风将机体及零件吹干,请注意将电吹风与机体保持一定距离,以免高温对元器件的损伤。
5、确认零件吹干后,插电点燃确认机器能否正常进入系统,如有出现软硬故障、需要立即更换,使机器能正常进入正常工作状态。
6、机器确认完好正常后,运往现场。 二、笔记本入水
1、立即取下笔记本电脑的电源及电池,如有外接或抽换式模块零件(如光驱、硬盘、软驱、扩充内存等)一并取下。
2、千万不要再开机了,否则会对笔记本电脑造成更严重的损害。 3、将笔记本电脑体内的水尽量倒光,并在第一时间内送到服务站由受过训练的专业工程师处理,这样才能将损害减低到最低程序。
(如条件不允许,无法及时联络到服务站,可先采取一列应急处理措施后再送至服务站处理。)
4、找一条柔软的湿纸巾或软布将污渍轻轻擦去,并尽量避免磨损表面。 5、用电吹风将机体及零件吹干,请注意将电吹风与机体保持一定距离,以免高温对元器件的损伤。
三、汇报情况
1、由负责人向上一级汇报这一次抢修情况进入反馈。 2、对这次工作做出总结。
5.1.2.5 数据及设备撤离计划
将数据备份磁带、UNIX系统及SYBASE系统软件转移到安全地方;
。
54
。
将服务器、阵列、集线器转移到安全地方; 将前置机及远程数据通讯器转移到安全地方; 将有关外部设备转移到安全地方。
5.1.2.6 资源备份(硬件、软件、数据)
单机及外部设备采用硬件备份。
5.1.2.7 快速恢复
环境正常以后,将硬件设备恢复到原来状态,若数据有错误,利用最近日期的数据备份磁带进行恢复。
5.2 运行服务应急方案
紧急故障应急措施应以快速恢复客户使用为目标,第一时间将客户使用状态恢复到正常,避免或尽量减少因故障而导致的损失。 5.2.1 启动应急流程
在【问题管理】流程中,当服务主管收到服务台人员或助理提交的《运维工作单》,并判断该问题属于重大事故时,则启动应急处理流程。重大事故包括以
。
55
。
下几种情况:
大范围系统中断 区域性系统崩溃 关键业务中断 大范围病毒爆发 系统严重破坏 数据严重破坏
根据重大事故的紧急程度和状态不同,服务主管可采取以下方式启动应急流程:
当紧急事件发生时,投标人的运行人员首先要进行故障分析,确定故障
。
56
。
的范围和程度,确认为紧急故障的,在查找原因和解决问题的同时,要同步将故障解决情况通报给部门领导、及向客服中说明事件发生的状况。如需其他部门协助的,需要请求相关部门共同尽快解决故障。 对于病毒突发事件,当病毒大面积地感染终端,投标人的现场服务人员
将已感染的终端从局域网中断开,投标人的运行人员将第一时间收集病毒信息,并向现场人员提供有针对性的应急方案;如果应急方案没有效果,要立即和杀毒软件厂方联络,由双方共同协同提供有效的应对措施。 对于网络中断事件,投标人的运行人员首先要判断中断原因,如果是局
域网本地设备或线路造成的,依网络运行处理流程优先快速处理;如果是电信服务提供商造成的,要立即联络电信技术部门解决问题。 对于系统故障事件,投标人的运行人员首先要启用备用系统,再判断故
障类型:硬件损坏、操作系统故障、软件故障。硬件损坏的情况,首先向服务器供应商报障;操作系统故障多数情况都和硬件故障同时出现,处理方式相同;软件故障如果是由购买的软件造成的,立即向软件厂商寻求技术支持;如果是公司自行开发的软件,立即向相关人员联系并排除故障。。
对于自然灾害性事件,运行管理人员要尽可能将设备转移到安全地带,
将损失降低到最少。
对于电力中断事件,由于机房多采用UPS防止断电带来的系统停机现象,
在UPS还能供应电力期间恢复供电,对系统使用不会有影响;但遇到特殊情况导致供电部门在短期内不能恢复供电时,如有备用发电设备要启用备用发电设备供电,否则要关闭所有设备,确保突然断电造成设备损坏。
在故障排除之后,运行管理人员要填写故障记录,如果故障是由于项目
实施中存在的隐患造成的问题,具体操作请参见上层文件《网络系统维护管理指引》。故障记录汇总到“系统运行故障记录表”,重大事故由故障处理人填写故障报告。
。
57
。
5.2.2 成立应急小组
《启动应急流程申请单》获批准后(包括口头批准),由信息主观部门负责组建应急小组。应急小组由多方人员组成,例如信息中心代表、运维部代表、服务主管、客户代表、供应商代表以及其他第三方人员等。
应急小组对发生的重大事故进行讨论分析并制定应急处理方案。
运维小组会根据实际人员需求情况从公司本部调配足够人员加入到应急小组。
运维小组会根据实际需求情况从公司本部调配足够的资金以保障事件处理经费需求。
5.2.3 应急处理过程
运维服务商根据应急小组制定的应急处理方案具体实施应急处理活动,并将实施过程和结果记录在《应急处理过程记录》中。涉及到客户现场服务的应取得客户的签字确认。
应急处理实施过程中涉及需要协调配合的工作由服务主管填写《资源申请单》,说明需要获得的资源、需要协调配合的工作等,经应急小组审批通过后由相关人员代表配合实施。
应急处理实施过程中涉及需要采购的,由服务主管填写《资源申请单》,说明需要采购的产品名称、型号/规格/功能、厂商/供应商、费用等。《资源申请单》经应急小组审批通过后由运维工程师实施采购,并将采购过程和结果记录在《资源申请单》中,应急小组对采购结果进行确认。
应急处理实施过程中涉及需要变更的,由服务主管填写《变更请求表》,说明变更内容、变更原因、变更方案等,经应急小组批准后直接由运维工程师根据《变更请求表》中的变更方案实施变更,并将变更过程和结果记录在《变更日志》中。
所有应急处理活动均应记录在《应急处理过程记录》中。 具体涉及到网络紧急故障处置,我们以恢复使用为第一目标。 在确认设备故障情况下,将第一时间采用备机备件恢复网络功能; 在链路故障情况下,启动备用链路进行通讯恢复,并积极配合链路运营商恢
。
58
。
复链路;
在大面积病毒爆发情况下,利用趋势病毒爆发阻止功能,首先阻止网络病毒传播途径,阻止病毒源,并积极联系厂商获取最新病毒码对全网进行病毒处置。
5.2.4 应急处理结果评估
应急处理过程完成后,服务主管向应急小组提交应急处理过程相关表单,包括《启动应急流程申请单》、《应急处理过程记录》、《资源申请单》、《变更请求表》、《变更日志》等。应急小组对应急处理结果进行评估和确认,并在《应急流程评估单》中填写评估意见。
如果应急小组评估意见为达到要求(即问题得到解决并恢复服务),则应急流程结束。
如果应急小组评估意见为未达到要求,则由应急小组讨论分析原因,根据分析结果可采取以下措施:
如果需要继续进行应急处理,则由应急小组提出应急处理方案,进行应
急处理过程;
如果不需要继续进行应急处理:
如果有新的问题产生,则由服务主管填写《运维工作单》,转【问题管理】流程处理;
如果有新的变更需求,则由服务主管填写《变更请求单》,转【变更管理】流程处理; 否则应急流程结束。
应急流程结束时,由服务主管在《运维工作单》中记录应急处理结果及关联表单编号。配置管理员对应急处理结果进行检查,登记新的配置项或更改后的配置项。
5.2.5 统计和报告
由助理每月或每季度对应急流程情况进行统计,形成《应急流程管理报告》,并提交给服务主管。《应急流程管理报告》内容包括:启动应急流程次数(不同
。
59
。
类别的次数)、原因分析、影响分析、完成情况、所需时间、各项资源利用情况、费用情况、意见和建议等。
《应急流程管理报告》经服务主管确认后提交数据部。
。
60
。
应急流程管理报告填写指南
编号:(格式为D0405-日期+两位序列号,其中日期按“yyyy+mm+dd”格式,2位序列号根据日期从01起顺序递增,例如D0405-2005031401,表示2005年3月14日第1张应急流程管理报告。)
报告日期: 年 月 日至 年 月 日(统计时间段) 应急流程 (分类统计应急处理次数、完成次数、应急处理分布范围等) 完成情况 统计 应急流程 (对引起应急流程的原因以及重大事故影响进行分类统计分析) 原因及影响统计 应急处理 (对应急处理所需时间进行统计) 时间统计 资源利用 (对应急处理所需资源进行统计) 情况统计 费用统计 (对应急处理所需费用进行统计) (根据上面的统计数据,对应急流程管理提出出现的问题以及对应急处理工作进行优化的建议。) 出现的问题和建议 备注 报告人签名: 服务主管签名: 时间: 时间:
。 61
。
第6章 服务水平质量承诺及服务管理
6.1 服务水平体系
我司的服务水平体系分四大类:报告服务、管理类服务、主动式服务及响应式服务。
6.1.1 报告服务
主要内容如下: 服务 日常运维服务报告 重大事件服务报告 巡检报告 设备维修 服务质量自检 系统安全分析 系统/网络优化分析
交付内容 运维月/季/年报告 重大事件服务报告 巡检工作记录 设备维修单 服务质量自检报告 安全分析报告 系统/网络优化建议 服务级别 月度/季度/年度 按事件发生情况 月度 5X8驻场/其余时间电话 每月 每月 按客户计划 6.1.2 管理类服务
主要内容如下:
服务 现状评估 标准化 基线建立 标准镜像文件预装 资产标签 文档、知识管理 交付内容 评估报告 标准与流程定制 基线建立报告 按客户使用的基准镜像 资产标签 文档管理库/知识库 服务级别 1次 1次 1次 随建设更新 1次 每周更新 。 62
。
6.1.3 主动式服务
主要内容如下:
服务 服务所需备配件购买、设置 资产标签张贴 日常巡检、维护保养消毒除尘 设备采购性能质量评测 运维服务流程规范编撰 交付内容 配置库/配置清单 资产库/资产清单 巡检记录 测试报告 管理规范建议书 服务级别 每月补充 1次 每季度 按客户计划 按客户计划 终端服务
6.1.4 响应式服务
主要内容如下: 服务 客户服务申请受理 现场维护 备件紧急服务 设备维修 第三方维修管理 其他支持服务
交付内容 日常维护单 日常维护单 日常维护单/备件领用单 设备维修单 设备送修单 支持服务记录 服务级别 5X8驻场/其余时间电话 5X8驻场/其余时间电话 5X8驻场/其余时间电话 5X8驻场/其余时间电话 5X8驻场/其余时间电话 5X8驻场/其余时间电话 。 63
。
6.2 服务承诺 6.2.1 服务级别承诺
越维承诺如下服务级别:
服务级别 服务承诺 5*8 2小时响应,4小时内解决 7*24电话支持 用户响应率100% 用户满意度>95% 非工作时间,如有需要,须现场解决 5*8 1小时响应,4小时内解决 7*24电话支持 用户响应率100% 用户满意度>95% 非工作时间,如有需要,须现场解决 5*8 1小时响应,2小时内解决 7*24电话支持 用户响应率100% 用户满意度>100% 非工作时间,如有需要,须现场解决 标准 高级 VIP VIP 级别服务: 高级级别服务:
标准级别服务:其他级别客户;其他设备。
发生设备硬件故障,按照服务级别采取以“恢复客户使用”为目的的方式,使用备件恢复客户应用,并将故障件送原厂或维修商予以维修。保内的设备维修修复时间按照厂家标准执行,送第三方维修的设备在十五个工作日内完成维修,取回设备,并且替换回备件。
主要服务项目级别 序号 1 2
服务项目 一般信息化设备运维 防(杀)病毒 服务级别 5X8小时*工作日(高级) 机关大楼和经检大队需马上响应和解决 5X8小时*工作日(标准) 。 64
。
6.2.2 服务质量承诺
a、工作时间承诺:每周一至周五(不含节假日),按照采购人工作时间提供服务,投标人在接到采购人服务申请后 1小时 内响应采购人。如采购人需要投标人在节假日期间提供服务,投标人会全力支持,如需要,可到现场支持。
b、响应方式承诺:热线电话、远程桌面支持,驻场解决。
c、服务类型承诺:送修、现场、特殊服务要求(如购件、升级等)。 d、人员保障承诺:提供2名驻场服务工程师,1名机动服务工程师。 e、保密要求承诺:详见保密协议。
6.3 服务管理 6.3.1 服务管理总则
服务工程师将认真学习和遵守采购人所有有关外来人员管理的规章制度,且有义务不对外透露在采购人获得的一切信息。
项目组成员在采购人的一切工作都在得到信息中心管理人员的授权之后进行。
项目组成员一旦发生政治事件、泄密、盗用用户资料、擅自更资料、故意隐瞒、超越授权操作导致恶性事件或给采购人带来影响重大的事件等事件,即视为安全事故。
全面配合采购人积极参与对其派驻工程师的有效的监督和管理,遵守采购人的相关规章制度。
建立奖励机制,同时参考采购人的建议,为优秀员工提供培训机会,或参加各种认证考试,以激励员工不断提升工作能力。
坚决杜绝因项目组成员发生的安全问题。
保证其项目组成员符合一定的技术水平,采购人有权对不满足工作要求的越维科技项目组成员向越维科技提出更换的要求;工作中坚决杜绝弄虚作假的现象出现。
。
65
。
未经采购人同意,不将所接触到的采购人技术或业务资料、数据用作其他用途或以任何形式泄露归第三方。
6.3.2 服务流程管理
。
66
。
6.3.3 服务台支持管理
IT服务外包项目中的服务台,即通常所指的帮助台和呼叫中心,这是一种服务职能而不是管理流程。在IT服务管理中,服务台起着纽带的作用。对服务提供方而言,服务台是“过滤器”和“扩音器”,可以处理很多客户的询问和请求,从而节约了资源,并及时向客户传递有关服务的各种情况;对客户而言,服务台是“导航器”,在碰到任何问题时,只需要联系服务台,然后由服务台进一步协调跟踪,避免了多点联络的问题。
服务台的职责包括: 1、单一的联络点
在信息化系统越发灵活、复杂的今天,客户所面临的问题也是多种多样,可能涉及到不同的应用、不同的资产,但是建立了服务台之后,客户可以将任何IT应用相关的问题都可以直接反映到服务台。
2、一线技术支持
即使最高级别的现场技术支持,也不会比使用者现场自己解决问题更加快速,服务台非常重要的一项任务就是根据知识库的记录,帮助用户现场恢复使用,一般来说,30%-50%的故障支持请求,都应该在服务台得到解决。
3、协调、跟踪和反馈
一旦服务台无法帮助用户直接解决问题,就必须根据服务协议所规定的时效要求分派二线技术支持,并且在服务完成之前持续的跟踪。如果服务进程出现任何异常,必须立即向客户进行反馈,并启动升级机制。
4、记录、分析和总结
服务的价值来自于长期的积累,如果不对过往的技术问题、服务记录进行总结归档,就使得服务失去了参考的依据,从而无法获得持续发展的动力。服务台作为所有服务请求的接口,必须保持准确的记录和科学的分析。
为了在服务期间,帮助采购人建立服务的监控管理粒度、沉淀一套较为全面的知识库系统,持续提高服务质量。
5、服务台受理服务请求的渠道包括: 报障电话: 报障邮箱:
。
67
。
6、服务台关于故障受理的主要工作包括:
受理故障时,准确记录故障现象,并结合知识库进行初步诊断,协助最
终用户远程解决故障(但指导时间不应超过5分钟);
在受理完成后,准确在系统中填写故障状况并于10分钟内完成分派;
并确定是否需要车辆协同;
单据分排,30分钟内落实任务执行情况;
接到延迟到场或无法到场的反馈时,10分钟内与用户沟通并重新分排任
务;
接到现场工程师的帮助请求时,利用知识库或其他资源提供必要的支
持;
接到现场工程师的异常事件升级通知时,在20分钟内上报项目经理; 服务结束后对工程师上交的服务单据进行审核; 服务台关于信息整理发布的主要工作包括:
维护广州市工商行政管理局信息系统运行维护管理平台,及时做好资产
更新工作;
每月审核项目组的技术月报,整理后录入知识库;
每月5日前完成上月《月度服务总结》并上交采购人主管部门及后台运
营本部;
及时整理并发布采购人专用系统《维护手册》; 每季度为项目组现场服务工程师准备服务光碟; 服务台关于设备维修的主要工作包括:
在确认硬件故障后合理安排人力和交通工具将设备安全送抵维修点; 必要时安排备机送达现场顶用;
如属于厂商保内维修,跟进并每3个工作日以书面形式向最终用户和信
息主管部门反馈进度;
跟踪并确保送修后第二个周末前设备修复并送抵最终用户现场; 每月10日前完成《月度维修总结》并上交采购人主管部门和后台运营
本部。
。
68
。
6.3.4 事件管理
事件管理是指导服务人员面对新增的服务请求时,如何通过最合理的处理方式保证应用的持续性以及各项质量指标的达成,由于在IT运行服务项目中每天项目组都将接受数十个服务请求,所以事件管理流程的设计,直接影响到服务的效率和客户的满意度。
越维科技根据采购人突发事件制定相应的处理流程,确保能够根本解决采购人突发事件,直至问题解决。
当服务工程师在现场发现异常事故或者无法在要求时限内解决的问题时,必须立即上报项目经理,如果属于纯技术问题,也应同时上报给高级系统工程师。
。
69
。
6.3.5 问题管理
1、常见问题管理服务
根据多年的服务数据分析,我们发现,在日常运行服务项目中,70%的问题,都是曾经出现过的,如果能够对服务进程中遇到的所有问题及解决办法都作好详尽的记录,并将此作为服务项目组培训的素材,讲大大的缩短故障处理时间,降低服务成本。
。
70
。
针对采购人IT设备经常出现的故障,或采购人在计算机应用中经常遇到的问题,由项目负责人和技术骨干进行该类问题的技术研究并提供解决办法和防范建议的服务。
2、提升问题管理服务
对采购人IT设备出现的未知解决方案的故障,或采购人用户在计算机应用中遇到的未知解决办法的问题,越维科技提供相关资深工程师和项目主管一起进行该类问题的技术研究并提供应急性质的解决办法和相应的防范建议。
6.3.6 知识库管理
维护工程师每周提交技术文档,并由服务台将技术资料整理后输入到知识库系统中,项目服务人员可从系统中找到相应的技术资料,提高日常维护的工作效率,一般用户可以通过查询IT知识库,提高用户的操作水平及技能.
配置管理(IT资产管理的升级)
配置管理的概念,源于传统的IT资产管理。在现实的IT环境中,各项资产之间必然存在一定的关联性,当我们考虑变更设备的硬件配置时,必须考虑到其软件配置以及驱动程序的兼容性,而当我们考虑更改设备所使用的软件系统时,更要考虑硬件的承载能力。从纯粹的资产管理到配置管理,实现了由静态到动态的转变。
将在本项目中提供IT配置管理协助服务。除了跟踪管理采购人各类IT资产的整个生命周期,更力求准确的体现各类应用系统与IT资产硬件之间的关联性,为采购人信息管理人员提供辅助决策的有效信息。
为了保证IT配置管理真实可靠的信息来源,越维科技在每年2次的巡检过程中,对IT资产登记的真实性和准确性进行核查,确保采购人可以及时把握IT资产的部署和使用状态。
6.3.7 服务记录管理
我司使用《运行服务单》作为服务记录,记录分别由服务受理人员、服务工程师以及被服务的客户三方完成,并且由客服中心服务台统一进行定期回访,每季度根据服务单统计服务信息并形成服务报告提交给采购人。
。
71
。
欢迎您的下载, 资料仅供参考!
致力为企业和个人提供合同协议,策划案计划书,学习资料等等
打造全网一站式需求
。 72
因篇幅问题不能全部显示,请点此查看更多更全内容