admin管理员组

文章数量:1532234

2024年1月22日发(作者:)

论IT服务风险管理

摘要:

2020年3月,我作为系统规划与管理师参与了x公务机有限公司运行平台的运维项目,该运维项目合同金额为102.5万元,工期为1年,主要负责运行平台系统、运控中心大屏幕显示、电报系统、运控中心及周边设备运维服务、机房设备及网络设备运维服务。本文以该项目为例,讨论了it服务风险管理的重要性,简述了服务过程中常见的风险,我们服务团队在过程中的风险管控和具体应对做法,按风险管理计划、风险识别、风险定性分析、风险定量分析、风险处置、风险监控、风险跟踪的活动过程来做好it服务风险管理。经过团队的努力,在1年多的实际服务过程中,解决了客户it服务中存在的问题,为客户公司运行管理工作提供了有力的it服务支持。

正文:

2020年3月,我作为系统规划与管理师参与了x公务机有限公司运行平台的运维项目,该运维项目合同金额为102.5万元,工期为1年,主要负责公务机运行平台(机组管理和排班、航班航前计划和安排、航班监控和安全管理、航后核算)的系统运维服务、运控中心大屏幕显示系统(监控与预警、航班动态、飞机跟踪、气象和情报)、运控中心及周边设备运维服务、电报系统、机房设备及网络设备运维服务等工作。

x公务机有限公司经过10多年的磨砺,公司以其自身独特的公务机组织及运行模式,已经成为国内首屈一指的公务机公司。x公司经过多年的建设,已建成了相当功能覆盖范围的航班运控系统、航班安全管理系统、公司邮件系统、服务器与存储系统等。随着时代的变迁,业务量的递增,公司在现有运行模式下,遇到了很多困难和挑战,认识到要想保持在行业中的领先,需要不断寻求变化,在运行能力及运行模式上都要更加具备行业先进性。公司结合当下“互联网+”的思路,经过慎重研究决定启动了公务机运行平台的运维项目,旨在让更专业的it服务团队全面支持公务机公司综合的业务流程及服务模式,公司更专注于发展自身的业务。我作为系统规划和管理师,带领团队接手了该运维项目。服务台安排2名员工,响应客户请求和日常运营。内部调岗1名系统工程师负责硬件和网络设备、电报系统、机房设备的日常巡查和运维,派驻到客户现场。1名应用工程师在客户现场负责运行平台系统的日常问题解答和处理。另外安排技术服务团队进行保障和提供远程支持服务、运行平台系统应用培训、问题排查和修复、应急预案定制服务等。向客户提供1年7*24小时不间断故障响应服务,每个月月末向客户提交运维服务报告,特殊事件另行提交事件报告,年度提交总结报告和对设备和系统的改进方案。

风险是在实现服务目标过程中所带来的不确定性和可能性,风险一旦发生,

会对服务产生某种影响。在it服务提供过程中,会遇到人员、技术、资源、过程和其他五方面的风险。在人员方面,会出现服务人员流动导致服务质量波动大、人员误操作导致业务数据丢失的风险;在技术方面,会存在采用发现问题的技术和服务对象不匹配的风险;在资源方面,会发生备品备件失效、服务工具失效等方面的风险;在过程方面,会出现过程规定不完善的风险;在其他方面,会出现服务蔓延的风险等。我们在服务项目正式启动前或启动初期要做好风险管理计划,在过程中不断进行风险识别,对已识别风险进行优先级排序做好风险定性分析,定量地分析风险对目标的影响,编制风险处理计划将应对风险所需成本和措施加入it服务预算和进度中,在整个运维项目过程中持续进行风险监控,观察记录已识别风险和其他突发风险做好风险跟踪。

一、纵观全局,编制风险管理计划

我和我的团队在服务正式启动前和启动初期,综合服务范围、预算、客户行业特点和客户需求,基于风险角度纵观全局的考虑、分析、规划、编制风险管理计划:计划it服务中实施风险管理的办法和使用的工具;定义it服务风险管理团队的成员,分配具体任务和职责;制定风险管理过程的执行时间进度计划,分配资源并估计成本;定义风险类别、概率、影响力评估的客观标准;定义风险管理过程报告的格式和记录归档的要求。

二、多种方法,不断重复风险识别

风险识别是一个不断重复的过程,我们利用文档识别,头脑风暴法、德尔菲法、访谈法、优劣势分析等信息收集技术,检查表,分析假设,图解技术等多种方法,从三个方面做好风险的识别:识别并确定it服务的潜在风险,识别引起风险的主要因素,识别it服务风险可能引起的后果。在风险识别过程中整理汇总成风险清单和更新风险管理计划。本运维项目涉及客户行业特殊性,业务系统功能复杂,设备多样,涉及干系人多、服务人员it理解能力水平落差大。识别出的风险涉及人员连续性方面、备件可能不能及时提供、变更和容量管理等过程管理方面的风险,有未识别潜在的需求和客户需求蔓延等其他方面的风险。

三、综合评估,风险定性定量分析

综合风险管理计划、风险记录、历史的风险数据和经验教训 ,过程中的绩效信息和服务范围等对风险发生概率和影响程度进行评估,对已识别风险进行优先级排序。经过分析,按优先级排序靠前的风险为:人员储备和连续性风险,备品备件储备和及时到位风险,需求蔓延风险。在风险定性分析后,进一步定量地分析风险对目标的影响。在服务过程中,我们持续进行风险分析,以维持风险的不断变化,随着分析的不断重复,更新风险列表,定性和定量风险分析结果中的趋势。

四、积极应对,做好风险处置计划

风险应对策略要考虑到风险的重要性、成本的有效性、应对的及时性、环境中的现实性、是否可以被各方接受,并确定风险责任人及其职责。针对该运维项目的特点和风险,我和团队做好人员储备和连续性管理,加强人员培训,提高技能和风险意识,减轻人员连续性风险和技能不足操作失误等风险。做好备品备件的管理,协助客户和厂商签署运控中心大屏的保修和换货协议,转移风险。针对服务相关干系人多,服务需求多样化和未能了解客户真正需求的风险,签署补充协议,争取客户高层的支持和配合,避免需求蔓延等其他方面的风险。该运维服务项目是开拓的新行业的服务项目,面对机遇我也向高层申请了更好的资源给该服务,将行业服务经验分享,积极的强大该机会带来的业务合作和后续可能的扩展合作关系。做好突发事件预备资源的预留,制定应急响应策略。

五、监测识别,持续进行风险监控

风险监控是整个运维项目生命周期中一个持续进行的过程。重新评估新的风险,进行风险审计并记录应对的效果,定期进行风险检查。对绩效数据进行差异和趋势分析,对潜在偏差进行预测。比较执行过程的技术成果和原始计划的差别来进行技术的绩效评估。比较剩余的预留储备和剩余的风险,评估预留资源储备是否合适。

六、观察记录,及时进行风险跟踪

用风险审计、偏差分析、技术指标分析等方法进行风险跟踪,包括已识别风险和其他突发风险的观察记录,对风险的发展状况进行记录和查询,持续维护和不断更新风险清单,更新风险解决情况,对风险的严重程序的变化保持警惕。

it服务风险管理通过编制风险管理计划,进行风险识别 、风险分析和风险评估,提供有效的风险处置计划,对风险进行监控和跟踪,妥善地处理风险造成的不利后果,以合理的成本保证安全,可靠地实现预定的目标,减少风险对组织资源、收益和现金流的不利影响,保证按sla为客户提供it服务。

在一年的运维期内,我和我的团队科学有效的进行it服务风险管理,为客户提供低成本、高效率的it服务,保证了甲方公司运行平台的正常运行,使甲方公司在“安全、运行、服务、盈利”综合能力得到全面提升,在运行效果上取得了很多的突破,赢得了甲方公司上下的一致好评,我和团队也顺利和甲方签署了下一期的运维合同。当然,在本合同履行过程中,在风险管理方面也遇到了一些问题,例如未完全识别变更管理过程风险,变更未获得客户方全部干系人确认,经过我和客户高层有效沟通协调,完善变更审批制度,签订补充协议和说明,后续得到了好的解决。在以后,我也将不断提高IT服务风险管理意识,改进风险管理方法,不断提升自己和团队的it服务能力,主动服务客户,提升客户满意度。用全方位的it服务主动辅助和提升客户综合业务的发展,携手共进提升双方价值。

本文标签: 风险服务客户过程进行