电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

IT运维服务范文

来源:火烈鸟作者:开心麻花2025-09-181

IT运维服务范文(精选12篇)

IT运维服务 第1篇

信息部门对IT系统进行维护的目的表现突出为以下3个:保证IT基础设施的可用性和安全性;合理实现和支持业务自动化;有效推动和支持业务创新。这是衡量IT部门工作成绩的标准,3个内容是不断递进的关系,是IT应用深度和广度不断提高的过程。针对高校信息部门而言,对IT运维进行有效的管理,使信息系统更加适应业务持续变化的需求,使信息部门从成本中心转变为价值中心,是需要迫切解决的命题。

2 IT运维服务的建设内容

2.1 运维基础

如何针对多种厂家设备、系统提供给师生用户一站式服务,这就需要将预防性服务和快速故障解决相结合,提高IT系统的稳定性和可用性,并通过专业的服务流程和灵活的定制服务,以让用户可以得到更高的服务质量和更好的服务体验,从而提升IT系统的故障解决效率,降低运维成本。

2.1.1 日常管理

(1)电话响应与支持:通过热线电话、邮件、在线交流系统等方式接受用户故障请求、技术咨询、远程问题诊断与处理,专业的callcenter呼叫中心对于提升信息服务部门的形象起着关键作用。

(2)实时监控与预警:通过对IT系统进行监控,通过预警机制将问题及时解决,“早用户5分钟发现问题”是典型的建设指导。

(3)值守/值班工作:信息部门应安排值班人员,提供724小时服务,对于法定节假日,也应做好相关值守安排,树立起不间断工作和服务的形象。

(4)用户端上门服务:对于电话指导无法解决的故障,信息部门须明确相关的服务标准,提供好类似上门或送修服务,提高师生的直观服务感受。

2.1.2 定期管理

(1)定期健康检查:系统检查与分析是发现问题的重要途径,信息部门须制定好相关的模版和指导书,使这一工作常规化。

(2)技术交流与分析:针对日常维护的常识、系统和设备特性、使用经验、常见故障处理等,信息部门应组织进行专题交流讨论,并整理归档相关材料和报告,建立FAQ,建设学习型的组织。

(3)培训组织:通过技术等级定义,并提供外部培训、内部学习的方式,提高员工技能,并可与员工晋升、职称评定等相结合。

2.1.3 问题管理

(1)硬件维保:维保服务主要是厂家协助用户进行故障定位和排除,并对故障件进行更换。信息部门根据资金和技术要求,也可考虑采用第三方维保。

(2)设备清洁和除尘:通过除尘、防静电处理等工作来延长设备寿命,提高业务运行效率和稳定性,这已经成为设备维护的一种共识。

(3)系统软件维护:与硬件设备配套的系统软件,需要进行功能性维护,如安排打补丁、升级等。

(4)商业软件专项服务:对于类似中间件、数据库软件、虚拟机软件等主流的商业软件,信息部门应掌握好日常使用与管理,并通过原厂的电话支持解决一些疑难杂症,而对于一些危险性较高的如升级、迁移改造工作,则需要考虑专业服务商提供上门服务。

(5)疑难故障分析:对于疑难故障,其特征往往是无法定位原因,这就要求信息部门对业务和运行架构充分理解,有效组织好各厂家配合解决,将问题的处理对业务的影响降到最低,将问题处理的综合成本降到最小。

(6)性能评估与优化:信息部门应定期组织进行性能检测、评估等,并进行优化建议和处理工作,以保证关键业务的开展。

(7)系统变更支持:信息化的建设,必然存在着系统上线、移机、扩容、调整等情况,这些工作应遵循变更管理的流程,同时及时更新IT基础设施和运行环境管理手册。

(8)迁移管理:迁移通常会有机房与设备、系统与应用、数据3个层面的工作。信息部门应全局把握,站在业务的角度提出条件和要求,全程指导、关键IT设备的技术支持、保障,平滑迁移并保障搬迁后正常运行。

2.2 运维保障

针对关键数据及运行支撑系统,信息部门必须确保对数据的产生、存储、备份、管理、流动、安全所需的项目及技术实施的知识和方法,从而提高IT信息部门的价值和贡献度、内外部满意度,提高IDC抗风险能力。

2.2.1 可用性管理

(1)集群方案制定与执行:充分考虑应用的架构及性能要求,制定集群方案,如Oracle RAC等,这对于系统的性能不仅有很大提高,对于单点故障也有很好的抗风险能力。

(2)容灾方案制定与执行:根据数据、系统的重要性,信息部门应建设容灾方案,如主、副备份,异地容灾等,保证系统最大化地利用和数据级别的快速恢复。

(3)应急预案制定与执行:针对各种可能出现的系统风险,应及时整改并落实建立紧急故障方案。并确保在临界状态下,可按应急预案执行。

2.2.2 可靠性管理

(1)存储数据管理:信息部门需要对存储数据进行的管理和优化工作,明确资源使用情况,定期进行清理和优化工作,消除管理盲区。

(2)系统与数据备份管理:各应用系统需要结合业务特点和技术手段,有针对性地制定备份策略和管理方案,并定期进行恢复测试,保证备份的有效性。

(3)系统日志管理:日志对于排查问题和管理分析至为关键,信息部门需要结合业务运行涉及的管理要求及程序自身的情况,加强维护并动态调整。

(4)数据恢复与还原:针对人为数据删除、应用机制删除、硬件损坏导致无法读取等,要充分考虑借助专业数据公司采用专业技术手段进行恢复,切忌盲目尝试以致造成更大的灾难。

2.2.3 可持续性管理

(1)数据集成与实施管理:信息部门须结合学校管理特点及业务,明确校内数据的U/C关系,制定好ETL策略并通过专业工具进行实施,以实现数据的流转。

(2)数据运行检查与审计管理:信息部门应定期审计数据的ETL过程,及时发现问题,并在关键业务点根据业务需要检查,保证流程数据的权威。

(3)人工数据处理与核对:对于源数据、结果数据的处理,结合信息标准及业务需要,依然存在手工处理和整理的需要,这也是信息部门要关注的工作。

2.3 运维改进

高校信息部门必须将IT人员、IT资源和IT技术有机整合,建立良性运行的业务服务管理体系,才能提高用户投资回报、发挥应用价值。在这里需要注意以多种方式、手段等提供给用户多元、立体、交叉的运行服务。

2.3.1 业务保障

(1)集成系统接入:通过制定学校标准及接入规范,信息部门应尽可能多地将业务系统接入到公共EAI平台,增强业务管理的吞吐能力。

(2)需求变更、增补与二次开发:对于因业务和流程等原因导致的变更或业务增补,信息部门要积极响应业务部门以满足业务发展需要。

(3)业务专项保障:根据业务特征,信息部门应指导、协助业务部门开展专项保障服务如新生迎新服务工作。信息部门应开展包括业务开展前的数据检查、流程确认、性能检测、运行保障、管理培训、业务总结及改进建议等。

2.3.2 安全管理

(1)安全规范与制度建设:“三分技术、七分管理”。信息部门须参考相关信息安全规范,并尽最大可能实施和完善,建立起安全管理制度与规范。

(2)系统与网络安全管理:制度和规范建设的前提下,针对学校网络管理、数据中心管理分开的一般现状,需要分头开展技术实施。相关的安全实施须定期输出检查和建议报告,以供审视和改进。

2.3.3 知识管理

(1)知识库与档案管理:信息部门应从各种管理的视角来管理好项目知识库与服务档案,这对于总结服务工作,提升服务水平,改进服务相关环节起着关键作用。

(2)资产与文档管理:对于IT资产,信息部门可参考I-TIL体系对于CMDB的定义,建设起自身的配置库,这是IT服务工作开展的基础和重要依据。

(3)项目管理与总结:项目管理不应视为乙方的专利,信息部门对于相关的项目可以借助乙方的力量以项目管理的理念和方式来推动进展,提高信息化管理和服务水平。

3 结语

长期从事数字化校园的建设和运维工作,在近50家高校用户运维服务基础上总结提炼了运维服务建设内容。相信这项工作是高校信息主管和管理员在探索和研究的重要课题。

参考文献

[1]IT运维服务管理体系.广东省广业信息产业集团有限公司,2011.

[2]陈宏峰,张亮,黄新峰,黄丸.翰纬ITIL V3白皮书.上海,2007.

IT运维服务个人简历 第2篇

-10 -06 广东财经大学(原广东商学院) 商务管理

语言能力

外语: 英语 一般 粤语水平: 优秀

其它外语能力:

国语水平: 优秀

工作能力及其他专长

本人是系里团学秘书部的副部长,曾多次协助系里举办的一下大型活动,具有很好的管理和协调团队的能力,熟练办公软件的使用,熟练操作MS Office Software,例如使用Word制作方案书,利用Power Point进行产品演示,通过Excel建立客户信息数据库等对软件有快速的应用能力,能够适应不同条件下的移动办公。了解基础的市场营销学、人力资源管理和一些财务方面的知识。

个人自传

各位面试官好!

IT服务运维标准将率先出炉 第3篇

近日,记者专访了马洪杰及参与IT运维标准制定的相关人员。据马洪杰透露,自今年4月运维工作组成立以来,以神州数码为代表的行业龙头企业便以工作组牵头在北京、上海、广州、武汉、山东等重点省市对运维市场进行了为期1个多月的广泛调研,并听取了30家企业、10家事业单位、8家政府相关部门的意见; 而后在两个月的时间里,历经数次激烈的讨论、三次封闭式编写、两次专家评审,最终完成标准意见征求稿。据透露,目前标准意见征求已接近尾声,“国标”的审批也指日可待。

“运维标准已经编制完成,接下来就是试点和验证。”马洪杰表示。包括北京等多个省市已提出承担运维标准试点的申请。IT服务标准工作组已就运维标准的应用试点与验证方案进行讨论。

“与国际标准比,我国IT服务标准包括的内容更多、更丰富。”据参与标准制定的专家介绍,ISO20000、ISO27000都属于质量管理体系的范畴,ITIL是行业的最佳实践。这些都不涉及到对信息服务企业的综合评价。而作为IT服务标准重要组成部分的运维标准,解决了信息技术服务企业的界定,以及交付过程中应该遵循什么规范等问题。

提高IT运维能力实现业务服务管理 第4篇

第一步:构建业务架构明确业务系统

要管理好业务系统, IT部门首先必须懂得业务系统是如何运作的, 从而明确业务对于企业的重要意义。对于业务架构的梳理, 企业可以咨询专业的业务服务管理实施团队, 也可借鉴行业内的成功经验, 将自身的业务架构进行一一定位, 进而针对不同的环节进行细致管理, 方可确保完成业务服务管理的第一步工作。

业内大多数的业务系统都包含了业务应用系统、软件平台、硬件平台以及数据交换平台四大要素, 因此IT部门务必就一套完整的核心业务系统进行分解, 定位其各环节的IT资源, 进而把IT资源按照业务的视角展现给管理员。在此基础上才能建立业务服务视图, 通过独特的业务视图, 可以清晰地描述业务与IT运维之间的关联关系和IT服务的关键目标, 便于实施监控和管理。

第二步:业务管理核心运维综合管控

在构建好业务架构并建立好业务视图后, 管理员就已经明确了一套核心业务系统的运作机理, 接下来将是整个管理中最重要的工作, 进行有效的业务管理。具体包括两方面, 一是业务运行管理, 二是业务使用管理。顾名思义, 运行管理就是管理员通过管理系统实时掌握业务的运行指标参数, 这些参数包括用户分布数据、环境数据、各类业务数据、业务运行指标数据、SLA数据等, 而这些数据可以帮助业务相关人员更好地理解业务运营状况和机理, 跟踪业务系统变化, 更好地推进业务部门的运营工作。

而业务使用管理也就是业务的在线使用情况管控, 直接关系到业务系统健康度、饱和度以及运行质量。具体来讲, 通过管理软件从网络流量中剥离出某特定业务的实时业务流量, 投射到网络拓扑结构中, 让业务用户的分布, 各网络节点对业务流动的影响“一目了然”, 并在故障情况下为快速恢复业务的正常运行建立了快速的分析机制, 从而帮助管理员解决最核心的问题。通过物理流量的分析, 确定核心业务系统是否运行正常, 降低了业务系统宕机率, 更好地促进业务的生产运营。

第三步:业务关联分析落实服务管理

对于业务系统来说, 历史数据分析、趋势分析和服务质量的改进等, 都需要通过报表的分析来取得决策依据。因此管理员通过管理软件得出的业务系统可用性、故障分析、趋势等报表, 可以全面掌控业务的运行状况和将来的运行预测, 这对于企业的投资规划以及业务发展方向有着积极的指导作用, 帮助企业去把握发展的契机和核心竞争力。

而通过对业务系统的综合管控, IT部门可以明确在响应IT事件时, 对于企业核心的业务系统事件必须是最高优先级的。而业务部门也会要求业务系统得到全面支持, 从而让IT部门负责业务运行的去负责支撑, 二者通过SAL (服务级别协议) 去找到一个平稳点。唯有落实SLA, 才能提升业务的指标合理化、业务有效利用率、业务运行状态, 以及改善业务容量、通道质量等业务指标参数。进而促进业务系统健康有序发展, 为企业带来更多的价值回报。

IT运维服务 第5篇

图1传统IT运维模式与IT运维模式的比较

图2服务管理的基本原理

此功能设计的作用是监管和控制每个用户在使用时各项功能的实时运行情况与数据。在此平台日常的运行中,对硬件、软件设备配置的管理是负责软、硬件能否顺利运行、功能特点是否完全运行、出现问题时能否自我修复等,以及负责对下指令的发放与管理。还包含对软、硬件设备在运行时各种数据的搜集、整合、管理与分析,另外就是在出现问题时要能够

及时自我报警、提示问题出现在哪里并发出警报,如能完成对出现问题位置的准确定位是效果最好的。最后,还要能实现对系统运行时占用并使用了那些资源能够及时显示,为用户合理分配资源进行数据参考。

(四)对系统平台安全性进行监管

在现在人人都懂一些互联网技术的时代,对于网络安全的管理亦是同等重要,它主要是保障整个系统能够平稳、流畅、安全的使用,它的主要任务之一就是对计算机病毒的拦截与删除,利用此功能,使系统在接触陌生用户或者外来数据的传入时能够自我有效的阻拦陌生文件或病毒的入侵,从而保障整个系统的安全。二是要对系统内每天登陆、录入用户操作等行的数据形成日志文件保存起来并进行有效的管理。三是对用户的管控,主要指新用户的增加、无效用户的删除、对用户详细信息的查询、用户自我修正个人信息等操作。

二、对系统配置、管理、信息发布的管控

(一)对系统配置的管控

此功能的作用是整个系统的运行中所有硬件之间的配合、相互之间的运行进行保护与分别识认,以便能够更有效的管理日子信息的修改与公开。另外也会保证基本设备、基本服务建立的模式进行一个初步的建设。建立它的主要任务就是为我们的目标客户提供一种管控数据的方式、展示出整个系统真实的配制数据,使硬件系统的质量能够更好的相互配合,发挥其最大的效能,合理的分配各个存储设备的资源运用。

(二)对系统变更的管理

在整个系统的运行有效期中,不论是硬件设备,还是软件的配置都有其一定的运行周期,不可能一直无限的运行下去,或者是有时整个系统的为之服务的对象也会有变化,因此对于服务系统的资产和软、硬件配置的改变是必须要依靠相关系统功能来实现的。在系统的设计与搭建过程中,尤其要注意对各种变更操作的记录,每一次变更可能引起的风险评估,以及最重要的就是对于更重变更操作应当建立起相应规范的、合理的审批和操作程序。这一项中就应该包含对系统物理环境的管控、维修、操作有关的硬件配置、日志文件记录。

(三)对信息的发布管理

在这一项系统功能的实现中,主要是包含每个功能模块、操作程序、系统测试数据的公布和整理。在程序的生产环境情况下,对于何种信息、如何审批、如何公布进行安排。在信息发布过程中,不仅要在生产环境中进行提前的安排,同时要对系统的服务进行合理有效的安排,将安排的信息能够切实的运用起来。

三、整个系统功能的有效实现

在IT运维服务系统整个运行过程中,对一些良好的数据库开发工具亦有着很好的运用,也进一步对于整个系统的流畅运行提供了优秀的数据支持。这在系统的真是运行过程中,不仅涉及到软、硬件的配置、系统变更的管控、日志文件的发布等各个方面。在系统的开发过程中,在数据库中保存的程序运行结构图一般都是放在系统界面的右侧,在整个流程的设计中,已经包括了对各个子功能模块流程的显示。基于此,在对系统中的一些字段、数据库内表格的设置进行进一步的管理与配置。在我们对系统进行整体测试运行时,这种技术的应用,能够使整个系统发挥出其最好的效果,并且能够同时保持住整个系统在运行时保持稳定、维护系统的安全。同时也会使用户在使用系统的时候能够及时了解各个功能的实现与具体的操作流程没从而更好的发挥整个系统的最大效用。

四、结语

在现在这个互联网技术飞速发展的时代,软、硬件不断更新、IT技术不断创新,而且我们的社会生活中也越来越多的融入了互联网技术,使我们的生活品质和工作环境登发极大地改善,最重要的是提高了我们生活与工作的效率。但是IT系统要想能够发挥最大的效用,就需要有良好的运维服务系统做支撑,因此只有把服务管理支撑系统做的合理、有效,才能够有效的对IT系统和IT资源进行合理、有效的运用。参考文献

IT运维服务 第6篇

一、组织结构合理,各部门职责明确

巴克莱银行的IT组织分为生产(Production)及应用(Application)两大部分。其中生产部分可视为一个整体,为所有用户提供统一的基础支持服务;而应用部分并不是一个整体的部门,由分散在各个业务部门下的小团队组成,每个小团队仅为所属业务部门提供特定的IT管理及开发服务。

(一)业务部门与IT部门联系紧密,沟通顺畅

以巴克莱IT组织的应用部分为例,这种“业务部门内含IT团隊的模式”可使IT人员与业务人员为着同一目标协同工作,IT人员不但能在业务氛围的影响下深入理解业务需求,而且由于专注于单一方向,更能做到引领业务发展。

同时,在业务部门需要IT生产部门支持时,本部门IT人员能够清楚的了解所需资源的类型与数量,并能与IT生产部门在技术层面上进行良好的沟通与协商。

这种结构模式大大缩短了业务部门与IT部门沟通所需时间,提高了沟通效率。

(二)一、二、三线支持团队界限清晰,专注于各自领域

以巴克莱IT组织中的生产部分为例,为用户提供的所有基础支持服务均可分为一、二、三线。如,网络、数据库、服务器等均拥有自己的一、二、三线支持团队。

其中,一线为帮助台团队,通过服务热线能解决大部分常规问题。若不能解决,则转至二线支持团队。二线支持团队,负责日常运维及监控分析。若有不能解决的问题,可要求供应商至现场协助解决。三线支持团队,在巴克莱被称为工程设计团队,主要负责所属服务的结构规划、发展策略、使用标准、产品选型、版本更新等等。若二线团队在运维过程中有任何建议及需求,可向三线团队提出,由三线团队负责调研实施。

这种分工方式使一、二、三线团队只需关注本职工作,提高了专业程度和工作效率,是IT运维服务分工精细化的一种体现。

(三)设立独立团队进行容量管理及项目实施

在巴克莱IT的生产部分中,除网络服务、数据库服务、服务器服务等基础支持服务团队外,还有容量管理、项目实施等其他团队。

容量管理团队负责基础设施的采购及优化管理。采购方面,该团队每月与各部门协商进行,收集采购需求。优化方面,该团队负责深度诊断、快速识别应用性能与容量问题,确保在需要的时间和地点精确应用合适的容量。

项目实施团队负责大型基础设施项目的实施,如新办公楼的建立、数据中心的启用等等。

将容量管理团队及项目实施团队独立出来进一步体现了巴克莱IT分工的细化。

二、工具种类多样,自动化程度高

巴克莱IT运维的工具化程度很高,有如下三个特性:

(一)多样性

使用多种工具配合进行监控,针对不同的系统使用不同的工具。由于各团队使用的监控工具各不相同,巴克莱使用网络系统管理软件合并来自多供应商多技术系统的告警故障数据,提供一个综合的集中化故障管理中心。

(二)专业性

巴克莱使用了大量的专业化工具进行精细化管理。

以容量优化管理为例,使用容量管理软件根据“实际需求”预测资源需求,不仅从包括CPU利用率在内的服务器指标趋势上预测未来的需求,而且为所支持的业务流程订制了相应的技术指标,对容量管理进行了深化和提升。

例如,用户可使用某项业务关键绩效指标(KPI)的预测增长来推动IT基础架构容量所需的投资。以业务为导向的容量管理简化了流程并降低了IT成本和相关支出。

(三)工具接口标准化

巴克莱使用的工具虽然种类繁多,但接口的标准化使得各种流程在多种不同工具间仍能平滑运行,各工具间无缝接口使得流程简化,节省运营成本。

但由于流程自动化程度相当高,也导致了只要一处发生问题,影响范围将会迅速扩散。因此巴克莱银行在灾备方面花费了大量的精力来保证业务连续性,单系统发生故障后即可切换至备用系统上,相对于全系统切换方式来说更加灵活。

三、服务管理高效,紧密结合ITIL理念

在巴克莱运用的ITIL理念中,强调流程高度整合、强调IT与业务融合,可以实现IT对业务支持的精确性和前瞻性。

在巴克莱IT生产部门中,有专门的IPC(Incident,Problem,Change)团队来对整个运维流程进行管理,并根据关键指标形成报告每月向CIO汇报。IPC团队管理所有的重要事件处理流程、问题管理流程及重要变更流程,保证在整个流转过程中严格按照程序进行并有完备的解决方案。

结合ITIL在巴克莱银行的实际应用,可以深刻理解到IT服务管理的核心思想:不管企业内部的还是外部的IT组织,都是IT服务提供者,其主要工作就是提供低成本、高质量的IT服务。ITIL在巴克莱能够成功落地实施的原因是:他们首先结合自身的业务特点、IT状况建立了一套完备的服务交付流程;其次是设定相应指标来监控这些流程的有效执行;第三真正进行持续改进,即定期生成报告来进行分析,发现系统和应用中存在的问题,并不断改善,使得日常管理工作更加有效、更加规范。

根据巴克莱银行实施ITIL的具体经验我们可以看到,建立IT运维流程分以下三步:

1、首先建立一套符合实际的管理流程及工具

ITIL作为国外引入的最佳实践,可以在实际中进行吸纳和利用,但真正落地实施需要紧密联系实际情况进行本地化。

关于ITIL中角色的划分及审批流程也需根据实际情况进行定义。流程建立起来的同时必须强制执行,保证流程严肃性。如果流程没有得到严格执行,严肃性一旦被破坏,时间长了,流程就会名存实亡。因此,要把定义好的规则、流程固化在流程工具里面,用这个流程工具强制员工进行规范化操作。为保证建立的流程有效实行,应从以下三方面入手:

从领导开始自上而下需有保护流程严肃性的意识

从领导层面,不经该流程工具提交的需求均为非法需求,不应批准;从员工层面,所有需求必须通过该流程工具提交,不能因紧急原因例外,否则视为违规。

发表制度办法必须使用该流程工具

有相应的组织进行监管,发现不符合流程的行为给予处罚

做到了以上三点,才能算真正建立应用了ITIL管理流程工具。

2、流程工具建立起来后,需提供标准的开放接口,制定相应的KPI衡量指标体系进行监控分析

流程管理工具对整个流程进行管理,根据KPI目标值(例如响应时间、变更成功率、变更引发的问题数等)来进行比照,如果未达到KPI目标值,则表示运维工作未正常运行,需分析原因进行调整;利用系统管理工具监控系统的性能指标,提供设备的实际运行情况,对比相应的KPI目标值(例如CPU利用率、内存利用率等等)来激发ITIL流程工具。

3、成立流程管理团队来对ITIL实施进行控制和改进

流程的定制并不是一成不变的,KPI的制定亦如此。实施ITIL实质上是一个计划、执行、测量和改进(PDCI)持续完善的过程。不仅要对服务质量进行监督和测量,确保服务符合质量要求;还要对KPI值进行调整,切合运维水平进展情况。

在这个流程和KPI均不断调整的周期中,需有独立团队对整个过程进行管控。同时该团队还应定期生成报告向整个IT部门进行发布,以便于各IT团队根据发布指标调整自身的服务水平。

主动式IT运维服务模式应用 第7篇

随着信息化建设的持续与深入, 企事业单位的信息应用系统越来越多, IT运维工作越来越繁杂。目前大多数IT运维工作仍处于被动的响应状态, 不但使IT运维人员终日忙碌, 也使IT运维质量难以提高。原因有以下3个方面[1]。

1) 运维规划与业务规划脱节。目前大多数企业的IT运维未开展相应的规划, 或IT运维规划仅考虑保障信息系统运行的稳定性, 未考虑业务发展需求的变化, 存在业务规划与运维规划脱节现象。例如某单位规划电力营销收费, 今年收费预算比去年增长30%, 用户数量比去年增长20%。IT部门却不了解营销部门的规划, 到年底发现收费系统的访问负荷突增, 存储空间不够, 系统运行缓慢, 因此紧急处理该突发情况。

2) 运维支撑工具自动化程度不高。目前运维支撑平台自动化程度不高, 未能将所有的运维对象纳入到监控范围, 对海量的告警信息未能做到自动分拣和过滤, 部分运维工作仍处于手工作业模式;同时运维支撑平台缺乏智能化, 未能实现智能化扩容、系统智能化自愈等功能。因此在没有高效的运维支撑工具支持下, 故障事件很难做到主动、快速处理。

3) 运维流程不规范、人员主动意识较弱。目前多数大中型企业IT运维流程已基本完善, 但大部分中小型企业未能梳理规范的运维流程, 导致运维工作混乱无序。同时企业缺乏相应的激励措施, 导致运维人员主动运维意识不高。

1 主动式运维

根据信息技术服务标准 (ITSS) 的定义:运维通常是指采用信息技术手段及方法, 依据需求方提出的服务级别要求, 对其所应用的信息系统、系统运行环境、业务分析等提供的综合服务[2]。

主动式运维是一种现代管理理念在IT运维管理中的具体运用, 是指对一切可能发生故障或“突发”情况提前处理的一种运维模式[3,4]。主动式IT运维可从技术和管理2方面实现。技术方面可通过建设自动化、智能化的运维平台, 处理大量重复的运维工作;管理方面通过制定合理的运维规划、有效的激励措施、完善的运维流程, 提升主动式运维管理水平。

与传统的运维模式相比, 主动式运维改变了传统运维模式的人海战术、经验运维、“救火式”运维等特征。还减少了对运维人员的依赖, 节省运维成本, 提高运维工作效率, 提升系统智能化水平, 为运维知识积累奠定基础。

2 主动式运维实施

2.1 建设运维支撑平台

通过运维支撑平台的建设, 提高系统故障的发现、处理主动性, 逐步实现运维自动化和智能化。建设自动化运维支撑平台, 其目标是要实现监控自动化、配置变更检测自动化、维护事件提醒自动化、系统健康检测自动化、维护报告生成自动化。运维支撑平台架构如图1所示。

2.1.1 数据采集层

使用基础的网络协议如简单网络管理协议 (Simple Network Management Protocol, SNMP) 、Internet控制报文协议 (Internet Control Message Protocol, ICMP) 、安全壳协议 (Secure Shell, SSH) 、HTTP等来采集主机、安全、信息系统、网络、终端、中间件、存储、动环、数据库等系统的数据信息。建立信息通信统一采集控制管理中心, 基于统一的标准实现各类采集控制适配器, 以此来支撑对信息通信基础资源的采集和控制, 需有良好的扩展性和灵活性, 满足未来环境下新增的基础资源监控需求。

2.1.2 技术平台层

提供各类接口适配服务, 如流程引擎服务、报表管理服务、数据总线服务等;提供平台配置项服务, 如事件触发流程、事件跟踪流程、事件优先级流程。还提供各类采集数据关联性支撑数据服务。

2.1.3 业务应用层

基于统一的业务框架实现面向各类角色对象的业务应用服务, 充分考虑业务功能的扩展性和灵活性, 以实现业务需求变更时的快速配置化调整[5]。

1) 监控自动化。是指对重要的IT设备实施主动式监控, 如路由器、交换机、防火墙等。

2) 配置变更检测自动化。是指IT设备配置参数一旦发生变化, 将触发变更流程转给相关技术人员进行确认, 通过自动检测协助IT运维人员发现和维护配置。

3) 维护事件提醒自动化。是指通过对IT设备和应用活动的实时监控, 当发生异常事件时系统自动启动报警和响应机制, 第一时间通知相关责任人。

4) 系统健康检测自动化。是指定期自动地对IT设备硬件和应用系统进行健康巡检, 配合IT运维团队实施对系统的健康检查和监控。

5) 维护报告生成自动化。是指定期自动地对系统做日志的收集分析, 记录系统运行状况, 并通过阶段性的监控、分析和总结, 定时提供IT运维的可用性、性能、系统资源利用状况分析报告。

2.2 匹配云服务架构

1) 基础架构即服务 (Infrastructure as a Service, Iaa S) 通过私有云提供数据中心、基础架构硬件和软件资源。Iaa S可以提供服务器、操作系统、磁盘存储、数据库和 (或) 信息资源。

2) 平台即服务 (Platform as a Service, Paa S) 提供基础架构, 软件开发者可以在这个基础架构之上建设新的应用或者扩展已有的应用。

3) 软件即服务 (Software as a Service, Saa S) 是最为成熟、也是得到最广泛应用的一种云计算。可以将它理解为一种软件分布模式, 在这种模式下, 应用软件安装在私有云里, 用户可以通过某个网络来使用这些软件。

2.3 建立主动式运维管理

1) 制定信息运维规划。企业的信息化运维规划需要根据企业发展的不同阶段, 制定相应的信息运维工作重点。在支撑业务阶段, 目标重点是保障各类业务应用、中间件、数据库、主机、存储及信息机房的稳定运行;在整合业务阶段, 目标重点是结合企业业务规划, 为业务规划提供信息化保障手段;在驱动业务阶段, 目标重点是基于新技术的出现, 帮助公司业务寻找新机会的可行性。因此, 企业的信息运维规划需要结合企业的业务规划进行, 确保信息运维规划适应企业的业务规划发展需要, 实现企业信息运维规划与企业业务规划的协同发展。

2) 提升人员主动性。提升人员主动性主要是解决运维人员工作态度问题, 分为主观和客观2个方面。主观上的问题需要沟通交流、学习培训和教育引导, 也需要构建和谐工作氛围、协作的工作关系;客观上的问题需要制度建设, 包括管理流程、岗位职责、技能等级、评价考核、激励和文化等。

3) 制定流程规范。随着IT运维管理工作的复杂化和难度的大大增加, 企业现有的制度、流程规范已不能适应IT运维工作快速发展的需要。企业可结合IT基础架构库ITIL或ISO20000标准, 梳理公司内部的制度和流程规范, 并结合主动式运维模式, 完善企业内部管理制度, 优化IT运维管理流程, 形成适合企业自身发展需要的主动式运维管理流程规范。

2.4 主动式运维演进

2.4.1 从传统手工作业到自动化运维转变

传统的IT运维管理是救火式的管理。通常是用户先于IT人员发现问题, 然后再找到IT部门要求解决问题。不采用任何管理软件, 仅仅靠运维人员定期轮询, 或者执行某项命令来检查设备, 在系统规模较小时, 只要参与运维的技术人员足够负责, 人工运维方式可以满足日常运维需要。但是, 当应用系统达到一定规模后, 这种运维方式的弊端就会暴露出来。轮询一遍要花费几个小时, 轮询周期越长代表需要更长时间才能发现故障。这种被动式管理IT导致有了问题不能及时发现, 运维效率低下。

IT运维自动化是一组将静态的服务流程转化为根据IT服务需求动态来主动弹性响应的策略, 目的是提升IT运维的质量, 降低运维成本。自动化是主动式IT运维最高层面的重要属性之一。从传统手工作业到自动化运维转变需要从以下几步着手。

1) 建立自动化运维管理平台。IT运维主动化管理建设的第一步是建立IT运维的自动化监控和管理平台。通过监控工具实现对用户操作规范的约束和对IT资源进行实时监控, 通过自动监控管理平台实现故障或问题综合处理和集中管理。例如, 在自定义周期内自动触发完成对IT运维系统的监控、配置变更检测、维护事件提醒、系统健康检测、维护报告生成等工作。

2) 梳理故障事件自动触发流程、跟踪流程和设立关键流程。所有IT设备在遇到问题时通过告警分拣和过滤机制, 实现自动报警。之后IT运维人员按照相关流程进行事件处理。因此, 企业需要事先建立事件触发流程, 同时要建立故障和事件处理跟踪流程, 利用表格工具等建立每种事件的规范化处理和跟踪指南。除此之外, 还需设立IT运维关键流程, 引入优先处理原则。例行事件按常规处理, 特别事件要按优先级次序处理。

3) 固化流程。通过对日常运维工作流程的梳理、优化, 形成统一、固化的流程, 把这些流程通过技术手段再固化到自动化运维管理平台中, 用于今后日常运维工作中。

2.4.2 从自动化运维到智能化运维提升

在自动化运维模式下, 运维工作能做到告警自动分拣和过滤、事件流程触发、事件流程跟踪、关键事件优先处理。但随着运维工作的不断深入, 对自动化的要求越来越高。例如, 信息系统因网络中病毒攻击而出现宕机的可能, 如何在系统宕机前做到病毒隔离、自动下发病毒查杀升级包、自动对局域网内所有服务器病毒库升级, 同时实现系统自愈是智能化运维亟待解决的问题。

其他如配置阈值智能化自适应调整、系统版本智能化发布和升级、系统智能扩容等都是今后主动式运维所面临的新课题, 需要不断的深入研究。从自动化运维到智能化运维有很长的路要走, 但从自动化到智能化是主动式运维未来发展的趋势。

3 主动式运维案例

从传统的运维方式发展为主动式运维, 是一项长期的历程。以国网某省电力公司从最初的传统式人工作业运维到如今的已基本实现主动式运维的转变为例来进行说明。

1) 管理方面。2010年起, 运维服务单位配合客户制定运维规划, 并逐年滚动修编规划。规划包括网络架构、基础环境架构 (如机房市电冗余规划等) 、资源规划 (如存储容量规划等) 、人力资源规划 (如队伍建设、岗位设置等) 等方面。2012年颁布了团队激励措施, 通过对工作规范性、人员能力、协作能力、系统稳定性指标等方面, 每季度开展评价工作, 并进行相应的奖惩。

2) 技术方面。自2011年起, 运维服务单位开展主动式运维技术支撑工具研发。最初的运维工具仅包括主机 (PC服务器) 、数据库 (Oracle) 等对象的运行状态监控, 从已有的BETA网管系统中采集部分网络运行数据, 进行集中监控。通过不断完善, 至2013年底, 运维工具的功能包括对主机、操作系统、数据库、中间件、存储等运维对象运行状态数据的采集及监控;状态告警功能;实现部分的关联分析功能 (如可初步定位故障原因等) 。自2014年开始, 运维服务单位将开展海量告警信息过滤 (告警分级机制) 、阈值自适应调整、部分场景自动化发布、部分场景系统自愈等运维工具智能化功能研究, 逐步将运维自动化向运维智能化转变。

4 结语

本文分析了在当前信息系统大建设背景下企业开展主动式IT运维服务的必要性, 给出了主动式运维定义、架构设计、应用实现以及实际案例。实际应用表明, 主动IT运维服务将繁琐的企业信息运维工作变成可控的流程业务, 有效保障运维工作操作简便、管控有序、效果明显, 有较好的应用价值。主动式IT运维目前在信息系统运维工作中尚处于实践应用阶段, 随着信息系统的多样性发展, 以及云技术、大数据等新技术应用, 必将在各种应用系统中得到应用, 实现信息系统全面的自动化运维。

参考文献

[1]左天祖.中国IT服务管理指南[M].北京:北京大学出版社, 2004.

[2]工业和信息化部软件服务业司.中国ITSS信息技术服务标准白皮书第一版[S].2010.

[3]北塔知识库.实现IT运维管理主动服务模式的方案[EB/OL].[2014–7–20].www.ciotimes.com.

[4]ZDnet.应对四大挑战:实现云环境下的主动运维[J].网络与信息, 2011, 25 (10) :49–50.

[5]百度百科.IT运维自动化[EB/OL].[2014–7–20].http://baike.baidu.com/view/8947561.htm?fr=aladdin.

企业IT运维服务管理模式研究 第8篇

1 企业IT运维管理的现状及存在的问题

第一, 由于地域和行业的不同, 所以企业的IT运维管理模式也存在一定的差异。有的企业在管理中习惯使用传统的运维模式, 而有的企业则喜欢应用先进的企业运维管理模式。第二, 即使在同一个企业, 由于级别的不同, 所以其管理方式也存在一定的差别。但是整体来讲, 我国大多数企业的IT运维管理都存在以下问题。

1.1 IT运维管理的服务导性没有得到重视

随着经济时代的发展, 企业的规模也在日益壮大, 在对IT运维管理提高要求的同时, 管理也变得越来越复杂。企业的IT运维管理为什么总是会出现问题, 因为企业的IT运维管理缺乏整体性的管理, 只注重事中管理和事后管理, 从而忽视了IT运维管理的服务导向的重要性。针对这种现象, 则需要在IT运维管理中, 重视对企业IT运维管理的全局性规划, 促使企业的组织能力得到有效的提高。

1.2 IT运维管理的体系不健全

IT运维管理有着较为广泛的范围, 由于大多数企业的IT部门不是按照IT基础机构的功能划分的, 就是按照企业业务的模块进行划分的, 所以企业在日常的IT运维管理中, 既没有办法对IT服务人员的工作进行考核, 也无法监督IT服务人员处理故障的效率及质量。其次, 往往企业IT的运维管理在出现问题时, 并不是单一环境出现问题, 只有企业的多个部门相互协作才能解决问题的关键, 由于企业IT运维管理过程的职责不清及体系不健全, 所以导致企业各部门经常出现互相推卸责任的现象。

1.3 运维管理的流程缺乏保障体系

企业的IT管理部门不仅要确保企业信息系统在运行时的安全、稳定及可靠, 还要利用强大的信息系统为业务部门的各项决策提供有效地支持。但由于IT管理人员往往会出现为了处理突发事件, 从而忽视了主动服务的现象。

1.4 运维管理缺乏长期的规划

大部分企业的IT运维管理由于偏重于对“硬平台”的建设, 忽视了“软平台”的管理和维护, 导致运维工作人员在客户满意度考核中评价较低, 而相关部门的责难也会打击工作人员的积极性。尤其企业网络建设缺乏这种长期的规划和对于复杂IT系统的运维管理经验, 导致企业IT运维管理停滞不前。

2 提高企业IT运维服务管理能力的有效措施

2.1 在ITIL视野下建立适合企业的IT运维架构

传统的运维管理架构相对于IT运维管理架构来讲相当简单, 其在碰到运维方面的问题时由运维负责人分配工作, 这样的运维方式在企业初期阶段简单高效, 但随着企业规模的不断扩大, 以及计算机信息技术的普及应用, 传统运维模式就会受到耗费人力、物力, 并且处理问题的效率也较低以及工作量比较大等不利的因素影响, 所以, 企业为了能够高效率的运维管理, 就需要改换为新的IT运维模式。IT运维管理有三个优点, 第一, 其不但为企业提供了稳定、高效、可靠的网络管理平台, 而且也为企业的各个应用系统的正常运行提供了强有力的保障。第二, 能够快速解决客户端的运维故障, 为客户提供了满意的服务。第三, IT运维管理在为企业节省人力的同时, 提高了处理网络故障的工作效率。基于IT运维管理的这三个优点, 所以企业在IT运维管理方面不断寻求创新以及不断提高要求。

其次, 企业的领导需要结合ITIL思想的指导作用, 建立相应的信息化工作领导小组, 并且其小组的成员必须是企业信息化职能部门, 专门负责IT运维管理的决策管理与协调所有IT运维的工作。

2.2 建立职责相应的奖惩制度及运维工作考核标准

企业各部门的岗位工作方式都不相同, 有的员工做着现场维护的工作, 有的干着远程处理的工作, 所以, 不同岗位的工作所承担的责任以及所享受的待遇也不相同, 但是, 企业要给予员工在职责和待遇方面要与其职位相应, 因此, 企业应当推出与工作职责相应的奖罚及晋升制度, 以激励员工的成长进步。其次, 由于IT运维管理的各个岗位的工作方式不一、技术水平不同, 因此要对运维人员的工作进行量化, 并通过一系列分析运维数据制定严格的考核标准, 激励员工不断提高服务水平和服务质量。

2.3 企业结合组织节后, 建立并明确运维管理的流程

传统运维管理模式对企业IT部门是按应用开发、网络管理以及系统控制等专业进行工作划分的, 其工作也是按照水平层面进行管理的。但是新的IT运维管理系统则是按照专业和技能对企业各部门进行工作分工的, 比如, 一线专门负责解决处理IT运维管理中最基础的问题, 二线则负责解决处理IT运维管理中最难、最复杂的故障, 而经理则需要对IT运维管理进行全面把握和疑难问题的解决。这样根据企业的实际情况, 对结构进行优化, 建立各个系统的的运营架构, 使各个部门既相互独立, 又互相联系。企业只有对组织结构进行调整, 明确企业IT运维管理的具体流程, 即使企业的IT系统出现了问题, 仍难能够第一时间联络相关负责人, 解决问题。

2.4 建立IT运维各系统的管理办法

IT运维管理模式和设备预知维修模式一样, 同样注重预知维修。IT运维管理模式也能够根据监测系统和日志记录系统发现异常现象, 并且能够通过检测系统将故障在萌芽的状态下解决。现代企业管理比较依赖于IT运维服务管理模式, 所以对IT运维服务管理模式的要求也不断提高, 比如, 某大型企业的MES、ERP、IC卡等应用系统, 要求必须实行二十四小时工作, 如果不实行实施工作, 那么如果某一个应用系统中出现任何一个小故障都会给企业造成巨大的经济损失, 因此, 降低信息系统出现的故障率对于企业来讲是非常重要的。

2.5 建立并且完善IT运维服务管理各系统的文档资料

由于网络的不稳定性, 即使企业IT运维服务管理各系统的资料再详细, 也有出现故障的可能, 故障处理不好的话还会导致数据丢失, 而维护好文档资料对IT运维服务管理工作有着重要的意义。文档资料在整理的时候除了要清晰、全面, 同时还需要满足“动态更新”和“高质量材料”两个原则, 如果资料的动态没有得到及时的更新, 对事情对产生不利的因素, 影响对事情的判断;一份高质量的资料能够让一个新人在完全不了解公司情况下, 通过资料能清晰的了解公司的现状, 因此建立并完善的各系统的文档资料管理对于IT运维管理非常重要。

3 总结

多数企业为了实现优化生产程序、提高工作效率以及减少对管理的成本, 都选择使用IT运维服务管理模式, IT运维服务管理模式, 在帮助企业实现以上要求的同时, 企业也对其提出了更高的要求标准, 企业IT运维服务管理模式既要有一个完整、清晰的运维架构及合理的工作流程, 同时更要注重企业的管理工作及制度, 只有这样, IT运维服务管理模式才能够更好的服务企业。究竟未来的IT运维管理会得到怎样的发展, 我们不得而知, 但是不可否认的是, 我国企业的运维管理意识还有待于普及, 相信而随着信息化进程的快速发展, IT运维管理一定会有广阔的发展空间。

摘要:IT运维服务管理与普通的系统维修、排除系统故障等工作不同, IT运维服务管理的核心价值在与为企业提供最优质的服务以及帮助企业实现精益化管理。随着计算机技术的快速发展, 信息技术开始被各行各业广泛的运用, 从简单的计算到初级办公, 再到深入与企业应用系统的各方面, 致使企业在日常的工作中对IT运维服务管理有着极大的依赖性, 因此, 企业对于IT运维服务管理的稳定性、安全性及可靠性有着越来越高的要求。据此, 基于ITIL构建IT服务管理体系的现状做出简要的阐述, 并对进一步优化企业IT的运维服务管理提出了一些建议。

关键词:企业,IT运维,管理模式,研究,策略

参考文献

[1]徐健, 孙永.基于ITIL构建企业IT运维服务管理体系[J].微型机与应用, 2014, (10) :97-101.

[2]刘雁.基于ITIL的A公司运维服务管理研究[D].南京:南京邮电大学, 2014.

医院IT运维服务托管模式的探讨 第9篇

伴随着医院信息化建设的不断深化,IT环境、IT系统规模和种类日趋庞杂,大量IT系统的维护管理变得越来越复杂、技术难度也越来越高,医院自身的IT运维部门人力、技术有限,给系统的日常维护和管理造成相当大的困难。传统的医院IT运行维护管理大多以人工为主,这种方式事件响应慢、故障排查周期长,严重影响了IT运维部门对医院核心业务的支撑力以及IT运维部门的声誉。实践证明,要有效降低维护成本,提升服务效率,规避系统运行风险,采取IT运维服务托管势在必行。

1 IT运维服务托管的含义

服务托管的提法来源于服务外包。“外包”(Outside Resource Using)(奎恩和海默Quinn and Hilmer,1994),通常被译为“外部资源利用”,或者“资源外取”。服务外包(Service Outsourcing)是指组织将全部或部分服务性工作包给专业性公司完成的服务模式。服务外包一般包括信息技术外包(ITO),业务流程外包(BPO),知识流程外包(KPO),文中所讨论的是信息技术外包。

基于不同的出发点和侧重点,学者们提出了各种各样的有关IT服务外包的定义。

Due(1992)认为IT服务外包是把组织中的数据处理、软件、通信网络、系统人员的一部分或全部转交给包括硬件提供者、顾问公司与系统合约商的第三方提供;Richard et al.(1995)认为,IT外包是让组织以外的单位以签约的方式接手负责组织内的部分或全部的信息系统功能;Alpan&Saharia(1995)认为,IT外包是委托方组织与一个或多个独立的承包商签订一个中长期安排(通常5~10年),在合约期限内承包商持续提供组织不同的信息系统服务;Grover&Teng&Cheon(1996)认为,IT外包是将组织中的部分或全部信息系统功能交由服务承包商完成;Barney,Jay B(1999)认为,IT外包是组织将其信息技术资产、人员和(或)活动出售或者转包给第三方供应商,该供应商在一定时期内收取一定费用来提供和管理信息技术服务;Barthelemy,Jerome(2001)认为,IT外包是将组织的信息技术职能转包给其他组织的过程,他还强调,IT外包通常伴随着将信息技术资产转移给服务商的过程;Kerm,Willcocks&Heck(2002)认为,IT外包是将信息技术资产、员工和(或)活动委托或售卖给第三方组织,并由后者提供和管理信息技术资产和服务。

综上所述,IT 运维服务托管就是指组织将管理链中原本由自身提供的具有基础性的、共性的和非核心的IT 业务以及相关联的运维服务流程剥离出来后,交由组织外部的专业服务提供商完成的经济活动,即组织某种资源与活动的外化。组织的资源是有限的,如何让有限的资源发挥最大的功效是组织管理者最关心的问题。组织通过重组价值链,优化资源配置,降低成本并构筑自己的核心竞争力,获得持续发展的能力,因此IT运维服务托管正日益成为各类组织IT服务管理的发展趋势。

2 医院IT运维服务托管的模式

2.1 IT整体资源服务托管

这是指在一个双方同意的价格水平下,在一个固定的时间内,在双方同意认可的服务水平下,医院将所有的IT系统运维工作交与专业的IT服务公司,后者提供全套专业的的IT系统规划、采购、实施、运行维护、咨询和培训的服务。这种模式适用于不想成立IT部门或增加IT工程师,并迫切希望降低运维成本的医院。

2.2 IT单项技术/服务托管

很多医院将IT建设中棘手的工作如物流建设、硬件设备维护、单项软件开发等交给IT外包业务公司,IT外包业务公司按项目、时间、设备量等各种方式计费,提供服务。这种模式适用于只有少量IT技术人员,难以应付日常各种繁杂事务的医院。

2.3 IT运行维护服务托管

当IT系统已经初步建设好,医院的IT维护人员日常工作不多,有了问题又忙不过来时,医院往往会寻找IT服务外包公司提供维护服务以保障已建系统的正常运行。这种方式适用于IT系统已经建设完成,且希望减少维护人员,提高服务效率的医院。

3 医院IT运维服务托管的优势和存在的问题

3.1 医院IT运维服务托管的优势

3.1.1 医院降低了维护成本,节省了资源投入

医院对于IT服务的需求是复杂多样的,如果所有需求都由自己解决必定会造成资源的增加,而服务提供商可以根据服务内容进行资源的配置,可以灵活地为医院量身定制最佳性价比的特色服务,从而节约很大一部分系统管理费用、跟踪新技术的成本等。

3.1.2 医院获得了持久的专业技术支持

医院的技术人员往往非常了解医院本身的业务逻辑,但对某一软件产品、硬件系统或IT技术并不精通,而IT产品发展又非常迅速,当系统出现问题时,就特别需要服务提供商的专业技术人员支持,而这些专家又正好对这一类产品或系统精通,能够很快地解决问题。

3.1.3 提高了信息系统的稳定性和先进性

与专业的服务提供商相比,医院在信息系统的开发及管理水平上有限或仅局限于某些特定的领域,开发和维护过程常与软件工程和项目管理的要求不符。而IT服务提供商会不断跟踪本领域内最新技术,以保证他们的技术是有竞争力的。因此医院通过托管服务使自己的医院IT与行业的发展同步,用最先进的技术和设备带来最便捷的服务,保证了信息系统的运行质量。

3.1.4 稳定了技术人员队伍,解决了医院信息人员紧缺的问题

长期从事维护工作,忙于处理各种琐碎的技术问题,会导致医院信息部门技术人员纷纷转向IT、金融、咨询等技术含量高、收入高行业,运维服务托管后,可以让医院的IT人员精力转移到辅助医院使用信息、提炼有价值的信息等高级管理工作中来,更好地为医院的运营服务,也由此稳定了IT人员队伍。

3.2 医院IT运维服务托管存在的问题

(1)IT服务提供商缺乏复合型的人才和团队。IT运维服务团队通常由计算机专业人才构成,偏重于技术手段的采用和技术路线的实现,对于医院的业务流程和业务术语了解不多,导致双方沟通出现障碍,当IT系统运行出现问题时难以马上确认清楚,从而迅速解决问题。

(2)在医院环境中并存着不同时期开发、不同供应商提供、不同技术运用的软硬件系统,它们从同一个过程中获得输入并产生输出,但由于在系统建设阶段没有从系统交互的角度来统一考虑,形成了各种数据孤岛、信息孤岛和应用孤岛,从而导致它们难以从整体上加以集成,以发挥信息共享所带来的优点。

(3)由于医院IT系统技术密集、任务和故障的边界模糊、客户需求变更频繁等特点,使得系统出现故障后,问题排查比较困难,不同供应商之间出现扯皮、推诿现象,即使是整体资源外包服务的提供商,在协调其他原厂商时也显得力不从心,贻误了故障修复的时机。

(4)许多IT运维服务的团队成员在长期的运维工作中,认为IT服务外包就是简单的重复劳动,低端而没有高价值,没有创新,导致运维人员流动频繁,知识和经验没有积累,故障和问题重复出现。

4 基于ITIL的医院IT运维服务托管探讨

ITIL(Information Technology Infrastructure Library,信息技术基础构架库)是IT服务管理的新方法和新理念,作为全球公认的IT管理最佳实践,已经在世界各国各类组织的IT服务管理中得到了广泛的应用,基于ITIL的医院IT运维服务托管也将改进IT管理的效率和加强IT与业务的沟通,提高IT部门的营运效率。

4.1 构建复合型的IT运维服务托管团队,提供有力的人员保障

IT运维服务托管团队成员的知识、技能、专业和性格的构成,将直接影响到运维服务质量和客户的满意度。医院IT运维涉及到IT软硬件技术、医院业务知识、项目管理、沟通和谈判技巧、团队合作等,因此互补型的、稳定合作的IT运维服务团队是有效达成IT运维目标的保障。应积极调整运维服务托管团队的人才结构,在原有IT专业技术人员的基础上,吸纳具有职业素养、创新精神、市场意识和项目管理能力的人员加入,并集聚医院的IT部门人员,形成一个能级结构合理搭配的人才队伍梯队;开展托管团队成员的专业培训和轮岗锻炼,使他们成为既懂现代医院管理又熟悉IT技术的复合型人才,提升业务能力和水平;依据ITIL标准,清晰定义IT运维托管团队中的角色与相应职责,并使团队成员清楚了解客户和组织对他们的期望,辅之以合适的流程以确保他们能够实现这些期望;建立符合IT运维服务托管工作特质的激励机制,提高团队成员的工作积极性和工作满意度,从而提高服务质量。

4.2 整合规范化的IT运维服务托管流程,提供扎实的制度保障

基于ITIL标准建立的IT运维服务托管规范流程,可以整合原有的离散管理流程并使之得到优化,提高服务速度和成本效率,并且通过对IT运维服务部门关键业务流程及各业务单元接口的严格控制,降低错误发生的可能性,消除维护中的未知量和不确定因数,提升IT运维服务部门总体可用性和服务性,使工作更有效、工作人员更易于管理和培训。应结合医院管理和IT系统建设的现状,按照ITIL的理论框架,整合并优化IT系统运维服务托管流程,完善服务支持和服务提供等相关制度,清晰界定医院IT产品供应商的服务权限,实现权责一体化,有效合作和沟通,保持流程的持续改进,以充分体现服务托管流程规范和严谨的特性,为客户提供优质高效的服务。

4.3 建立共享性的IT运维服务托管支撑平台,提供先进的技术保障

共享性的服务技术支撑平台,可以有效消除传统管理中的盲点和交叉点,理清数据的输入和输出接口,实现数据共享;可以整合医院现有的各类信息系统,使医院多年的信息化成果得到持续利用,并提供高效的IT系统维护信息,较好地推进信息化的应用。在服务技术支撑平台开发前期,应充分了解客户的需求和运维服务的业务流程,统筹平台的兼容性、开放性和安全性,使不同IT产品的提供商都能借助于这个平台实现信息共享;在服务技术支撑平台实践应用中,应以医院各类信息系统为依托,实现维护信息全覆盖和动态化管理,拓展医院信息系统功能,做好信息利用,提高实用价值,并在此基础上,挖掘IT信息资源价值,作为医院和上级主管部门决策的重要基础数据库,提供数据支持。

4.4 实现高增长的IT运维服务托管效率,提供持续的利益保障

实施医院IT运维服务托管,可以有效提升医院和服务供应商的效率和效益。

医院从繁杂、重复的简单维护中脱身出来,对大量的历史数据和当前数据进行分析、统计,从数据挖掘中凝炼管理决策,从而产生新的利益增长点;提高了服务效率,提升了患者的满意度,也为医院带来更多的社会效益和经济效益;同时医院内部实现IT服务财务合理化管理,能有效控制内部员工对IT资源的使用以直接降低成本,减少IT系统和设备的故障率,直接节省维护费用。医院IT运维服务托管也能帮助IT运维服务供应商在财务管理上直接受益:在企业内部管理中,通过规范化的服务,可以更好地评估企业IT运维服务人员的工作,实现服务成本有效控制;在外部市场营销上,通过服务效率的提升,可以与客户建立信任和合作的伙伴关系,使医院客户对IT有更合理和发展的期望,从而不断对IT提出新的采购要求,带动企业其他产品的销售,赢得企业的长久利润。

5 结束语

推行医院IT运维服务托管,可以统筹规划医院的IT资源,提高IT资源的利用率,以共享式的数据管理代替分散式的管理,实现资源共享,保证统一管理和快速响应,提高医院的综合效益。医院应根据自身管理发展的需要和IT系统建设的实况,选择合理的IT运维服务托管模式和合适的IT运维服务供应商,确保医院IT系统的高效稳定运行。

参考文献

[1]于立,刘慧兰.IT外包形成机理的供给分析[J].情报科学,2007,25:12.

[2]马宁,丁峰,杨海东.浅谈IT外包服务在医院的应用[J].中国医疗设备,2008,23(9):78-80.

IT运维服务与移动App的应用 第10篇

1 IT运维所面临的问题

市场的激烈竞争也为企业的IT管理部门提出了更高的要求, 众多金融企业面对日益增长的数据吞吐量与持续增加的IT成本压力, 以及来自企业内外部信息安全的诸多问题, 使高效IT运维的应用势在必行。现如今, 原有的IT运维方式已经不能适应现有的商业需求, IT运维已经逐步实现半自动化, 并进入下一个迅猛发展的时代。企业的IT系统越来越多, 网络、设备和产品越来越复杂, 工作效率越来越依赖于稳定可靠的系统运行, 企业的IT管理与业务绩效联系越来越紧密。因而, 传统的IT系统管理手段难以满足企业对于信息化的需求已是不争的事实, 有时甚至会制约企业的进一步发展。大部分公司的信息化管理部门高管逐渐意识到, 企业IT运维管理的内容越来越多, 想要提高自身竞争力, 就需要一直持续不断的对IT管理进行投入, 以提高生产效率, 降低成本, 创造更大的价值。

当企业的IT系统增加之后, 欠缺的就是对IT系统的智能管理和实时管理。目前国内大部分系统的更新管理工作还是依靠IT工程师现场操作来完成的。很多时候一个简单的运维操作管理流程, 需要IT工程师逐一登录每台设备去执行, 而需要更新的设备往往数量庞大, 系统种类繁杂其工作量之大可想而知, 这样运维方式势必无法满足企业实现高效IT运维的目标。其次, 企业的IT运维需要更高效直观的管理工具, 对IT系统的各部分运行状况进行实施监控, 并进行综合智能分析, 尽可能在系统出现问题之前提早发现潜在的风险并采取相应解决方案, 从而实现IT运维的实时监控和主动式管理。然而, 目前国内大部分企业的IT管理经历了系统管理、网络管理后, 正逐渐向IT服务管理阶段过渡, 但仍然有许多企业IT服务依然停留在服务支持管理, 不能实现主动式的智能管理方式, IT运维往往处于“救火员”的状态, 每天忙于应付各类应急任务。

2 IT运维与移动APP

近年来移动互联网技术的发展和运用日益成熟, 移动智能终端普及率在快速增长, 简单、便捷的移动终端成为了企业IT运维管理的一个重要组成部分。将移动互联技术与传统IT运维服务相结合, 可以为企业提供更加及时、便捷、精准的服务, 进而提升运维服务水平和效率。智慧移动时代的来临, 让手机及平板这些移动设备可以更好的对企业的网络和IT设备进行实时的监控和管理, 只要懂得善用这些智慧行动装置, 无论装置是何种厂牌以及采用何种OS, 都能够让平日的网管工作更具弹性更有效率。通过一些移动App的辅助可以处理常见的网管工作, 例如人员帐号的启用与停用、远端桌面的连线、终端机的连线及虚拟机器的管理等等。例如应用比较广泛的VMware v Sphere Client for i Pad, 它是VMware官方所发布的App, 它具有非常友好的操作界面, 见图2。使用v Sphere Client可以连接到ESX/ESXi主机, 让IT人员可以通过i Pad管理虚拟主机。此外VMware还推出了i VMControl, 它可以对虚拟主机进行深度管理, 该App可以在i Pad和i Phone上共用, 并且也有Android系统的版本。

3 移动APP的优点

3.1 简单化

随着4G网络的应用和普及, 现有运营商网络越来越庞大, 多技术融合, 对企业的维护能力和维护模式提出了新的要求。企业所涵盖和设计的业务不断增加, 对业务的多元化、快速部署和应用能力不断提高, 都对IT运维部门现有的维护模式产生新的挑战。同时, 随着互联网扁平化、IP化及ICT技术的深度融合, 各个业务系统间的界限在未来将变得更加模糊。为统一实现企业IT系统全面管理目标, 智能的移动App软件可以降低维护人员对专业技能的要求, 将原有复杂的管理工作简化成手机或平板电脑上的简单操作。

3.2 集约化

集约化一方面可以帮助企业降低IT运维的成本, 另一方面能够快速提升企业管理效率。网络运营所需要的业务系统越来越复杂, 手机和平板电脑上的APP网络管理软件为集约化管理提供了强有力的支撑。以往分散到不同地区的IT系统, 可以用手机远程直接监控;以往需要现场解决的问题, 现在大部分都能在移动APP中操作完成。

3.3 实时性

运维人员不在局限于固定的地点或固定的时间, 才能对信息系统进行维护, 与此相反运维人员手持移动终端, 通过智能APP实现移动性管理, 包括系统状态的查看、网络设备的维护、配置文件的更新、系统升级和网络流量的监控等等。同时APP支持处理过程数据的跟踪和处理, 维护信息的及时记录和上载, 为后续的运维效率持续提升优化提供数据支撑, 最终目标是实现维护效率和维护质量提升。

4 结语

总体来说, 移动互联网的发展和智能手机的普遍应用为企业高效IT运维管理带来了新的契机, 移动APP的应用可以降低维护人员工作量的同时提高IT运维人员工作效率, 保障业务人员的工作效率, 提高业务系统运行状况, 提高公司整体管理效益, 同时提高企业的竞争力和客户满意度。

参考文献

卡西亚 合作共赢IT运维 第11篇

据了解,科安德将卡西亚公司的K2产品应用于很多中小企业,结合卡西亚产品的特点提供了“主动化预防”的IT系统自动化运维的方式。工程师在CANDIS公司内部架设管理服务器,然后通过远程的方式在用户的每台计算机上安装客户端程序,同时通过与最终用户沟通,在管理服务器上预制阀值与策略。

“这样做使得IT的服务效率大大提高。”David说。首先,IT运维工程师能够远程监护客户端,不用上门即可查出问题所在,简化了工作流程。在一个客户一个月的试用期终,故障数量降低了近1/2,IT系统的连续性大大提升,解决了长时间困扰用户的服务效率问题。其次,由于服务系统的革新,一个工程师同时可以监控20个客户,比过去的10个客户提高了一倍,大大节省了人工费用。

IT运维服务 第12篇

业务服务管理 (Business Service Management, BSM) , 是IT运维管理的高级阶段, 强调从实现企业业务价值的目标出发, 以业务的视角看待IT管理, 最大限度地发挥IT对企业业务的推动作用。在此, 探讨利用BSM改进供电企业的IT运维管理体系及其运维架构, 并对支撑BSM的IT运维支撑平台的总体设计进行了介绍。

1 IT运维管理现状

当前, 国内供电的信息化建设正步入高速发展的时期, 随着营销、生产、财务以及人力资源等主营业务系统的逐步统一, 信息化建设按上级公司的规范化方向发展。如在广东电网公司系统内, 核心和主要业务系统的建设均由省公司主导、全省统一版本, 数据基本采取省集中或者地市集中模式。目前, 省公司和各地市供电局信息化运维服务体系建设, 基本处于起步阶段, 虽逐步建立了与运维服务体系相关的平台系统, 但运维体系却仍然沿用过去分散和杂乱的模式, 已经明显跟不上信息化建设的步伐。

汕头供电局是广东电网公司下属机构, 已陆续建立了网络、主机系统、信息安全和机房等各种监控管理系统, 并采用了IT服务管理软件作为流程流转和信息共享的平台, 实现了服务台管理、配置管理、变更管理和问题管理, 初步完善了IT基础架构监控, 统一了IT服务入口和规范IT服务流程。

目前, 汕头供电局所建的IT监控系统和IT服务管理系统基本上以面向设备为主, 没有直接面向业务。在面向设备的运维模式下很难从整体上对业务系统可用性和健康状况进行实时评测, 难以了解用户体验情况, 无法对基于用户的业务服务水平进行量化评价和分析, 造成运维工作长期处于被动局面, 已经不能满足日益扩展的运维管理工作的需求。因此, 整合现有各类监控系统, 强化运维分析功能, 实现面向业务应用的集中运维已显得非常必要和迫切。

2 利用BSM改进供电企业的IT运维管理

2.1 升级BSM的可行性

IT运维/服务发展经历了网络服务管理 (Network Service Management, NSM) 到IT服务管理 (IT Service Management, ITSM) , 再到BSM的变革。目前绝大多数供电企业都已经实施了ITSM, 关注点不再是选择何种网络管理工具, 而是什么样的IT运维工具能够真正提高IT运维的效率, 实现企业网络利用率的最大化。

相比NSM和ITSM, BSM的优势在于:BSM的主要功能是实现IT资源与其支持的业务服务之间的动态映射, 让IT部门能够将基础设施事件与业务成果关联起来;BSM能够整合各个层次IT资源的事件和状态, 让运维人员能取得业务服务的性能、用户体验和服务水平等具有直接业务价值的信息;BSM提供对服务的业务影响看法, IT部门可以根据服务资产的业务影响衡量这些资产的价值, 帮助IT部门作出正确的业务决策, 图1显示了BSM与IT基础架构和业务服务的关系。

与ITSM相比, BSM更注重业务服务质量和用户体验, 其IT运维管理的目的更倾向于实现业务价值。BSM是建立在ITSM更高一层的IT运维架构, 与原有的ITSM并不冲突, 可以保留现有的基于ITSM的IT运维系统, 通过升级改造实现BSM目标。

2.2 实施BSM的目标和步骤

根据汕头供电局目前的IT运维现状和存在的问题, 对BSM实施的目标设定如下:

(1) 整合和补充完善现有IT资源系统, 实现对监控事件和状态的统一推送和综合利用。

(2) 建设一个强大、实用的运维分析系统, 实现故障隐患和关键指标的有效监测, 让运维人员能够把精力从事后处理转为事前预防, 最大限度地提高业务应用的服务水平。

(3) 理清IT资源和业务应用之间的依赖关系, 提供业务服务建模和图示化的关键指标展现, 实现IT与业务的融合。

(4) 构建一套科学的服务水平管理体系, 实现服务水平的定义、评估、告警和分析, 确保IT运维目标的实现。

(5) 从面向业务的角度出发, 解决IT集中运行监控系统未能覆盖的监控需求。

(6) 解决集中运维场景下信息的统一调度和信息推送。

面向BSM的IT运维比基础的IT运维提高了一个层次, 具有较高的技术要求, 考虑到该项目的实施复杂度, 以及与省公司IT服务运维项目实施的一致性, 在本项目的实施进度上采用分期建设模式:

第一期工作重点是以电力营销相关业务应用为核心, 围绕其对原有的网络、主机、系统平台、机房和门禁等各种监控系统进行整合和扩充完善, 实现面向业务应用的监控整合、智能分析、故障预警、信息推送、用户体验管理和服务水平管理功能。

第二期的工作是把业务服务系统扩展到企业的所有关键业务服务, 并建立覆盖各个县级子公司的两级运维业务服务支撑体系。

2.3 实施方法

考虑到汕头供电局目前已经实施了较为完善的运维系统, 为了保护现有资产、降低升级成本, 采用ITSM向BSM平滑演进的实施模式。如图2所示, 对现有的运维/监控系统在界面、数据、事件分析上进行整合, 并增加用户体验监控;利用整合数据进行业务服务映射, 形成业务服务统一展现、业务服务水平分析和业务服务影响分析。

3 面向BSM的IT运维支撑平台的总体设计

3.1 总体架构

面向BSM的IT运维支撑平台总体架构如图3所示。

(1) 应用管理。提供具有故障分析和预警能力的应用监控管理。以业务视角组织和展现运维对象, 并按业务需要提供监控结果。BSM要求事后处理向事前维护转变, 变事后被动修复向实时监测主动维护, 因此监控平台需要具备事件关联分析能力。

(2) 用户体验管理。发现业务服务在功能点和地域之间的差异和优势, 发现潜在隐患和快速定位问题。用户体验管理系统可以解决监控死角问题, 并在发生故障的应用系统对用户产生不良影响之前进行预警。

(3) 监控整合。提供对多来源、跨专业的事件进行分析、加工、压缩、过滤、展现和推送机制, 实现监控信息的综合利用。

(4) 智能信息推送。IT集中运维导致不同地域、不同机构的运维人员都需要准确了解运维信息和故障告警, 因此, 需要一套统一推送机制实现包括短信、看板、声光、桌面以及邮件等多种形式的信息推送方式。另外原厂商和集成商也需要订阅不同运维中心相关的告警信息, 能够加快解决故障的速度。

(5) 服务水平管理。提供服务水平目标设定、监测、评价、预警、分析与报告功能, 确保业务服务质量符合客户期望。服务水平管理能够客观科学地反映运维质量, 通过服务水平管理让IT部门关注客户需求, 有效地履行服务承诺。

3.2 关键技术

在实施面向BSM的IT运维支撑平台过程中, 必须解决多个关键技术, 确保该平台能够与BSM运维体系相适应, 确保新增投入的有效性。

(1) 上下文关联分析引擎 (CCE) 。CCE是一个支持并发分析的多线程分析引擎, 负责对采集插件上报的报文进行加工、处理、分析和判断, 并把分析出来的指标监测结果存储到数据库中。CCE是一个规则驱动的分析引擎, 规则驱动技术与过程驱动技术相比可以大大降低分析脚本编写的难度, 使非专业开发人员也可以自行修改或者编写分析规则。

(2) 浮动阀值支持。由于很多监控指标不能根据单一设置的阀值进行分析处理, 所以分析规则需要根据不同的时段确定不同的阀值范围。例如CPU的负载监测可能要在上班时间设置一个阀值范围, 非上班时间设置另一个阀值范围。对于这一情形系统必须提供时段阀值范围定义功能。

(3) 防抖动设计。指标防抖动设计是为消除“瞬时出现故障又很快恢复正常”这种现象而特定设计的。指标抖动现象是IT设备运行中经常出现的问题, CPU负载、内存利用率等就是这种经常抖动的指标。

(4) 采集依赖分析。采集依赖是在数据采集阶段的一种分析技术。在网络上互相连接的多个设备之间, 当一个节点设备出现问题, 下边连接的设备都将不可访问, 通过采集依赖分析技术, 可以直接定位出现问题的节点设备, 同时, 对其下连接设备的所有错误信息进行屏蔽。

(5) 业务依赖分析。各种IT资源之间都是相互依赖的, 尤其是业务系统的IT资源依赖更加紧密, 使用业务依赖技术可以准确地对多个具有业务依赖关系的IT资源进行故障定位。例如:对Oracle数据库表空间的监测, 在表空间被设成自动增长的前提下, 主机磁盘剩余空间不足就会直接导致表剩余空间的不足。当表空间不足的时候, 通过业务依赖分析, 就可以分析出是主机磁盘空间不足还是表空间不足。

(6) 系统安全机制。监控过程中有大量的数据交换, 同时不同身份的用户也需要通过网络对运维平台进行管理, 因而必须使用数字签名和加密等技术, 保证数据的安全交换以及用户的身份认证和授权。

4 结语

IT系统生命周期包括IT系统开发和运维两大阶段, 随著IT系统的大规模建成和投入运行, IT运维越来越受到前所未有的重视。相比IT系统开发, IT系统运维不仅时间跨度长, 而且IT运维质量直接影响到业务服务的质量。对于供电企业, 由于业务复杂、信息化水平较高, 其IT技术架构也日趋复杂, 一个业务应用通常跨越多个IT资源层面, 传统运维模式已经很难满足企业要求, 选择合适的IT运维管理工具就显得非常必要和迫切。汕头供电局针对面向BSM的IT运维管理架构及其技术支撑平台进行了大量调研, 拟采用对现有基于ITSM的运维体系向BSM体系平滑升级的方法来解决现有运维模式所存在的问题, 实施初期已获得了一定的效果。下一步的工作是完成面向BSM的IT集中运维分析系统的建设, 并从“规范化、体系化、指标化”角度出发, 制定行之有效的面向BSM集中运维的技术解决方案和实施方案, 规范和指导IT运维人员开展工作。

摘要:目前, 供电企业普遍实施的面向设备的IT监控平台, 无法从整体上对业务系统的可用性和健康状况进行评测, 难以保证IT运维的质量和服务水平。从解决这一问题入手, 阐述了如何利用业务服务管理 (BSM) 理念对供电企业的IT运维架构进行改造, 将IT运维提升到BSM的高度, 以业务的视角看待IT管理, 最大限度地发挥IT对企业业务的推动作用, 同时也对面向BSM的IT运维基础支撑平台的总体设计进行介绍。

关键词:IT运维,业务服务管理,IT监控,供电企业

参考文献

IT运维服务范文

IT运维服务范文(精选12篇)IT运维服务 第1篇信息部门对IT系统进行维护的目的表现突出为以下3个:保证IT基础设施的可用性和安全性;合理实现...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部