电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

IT运维服务管理

来源:开心麻花作者:开心麻花2025-09-181

IT运维服务管理(精选12篇)

IT运维服务管理 第1篇

第一步:构建业务架构明确业务系统

要管理好业务系统, IT部门首先必须懂得业务系统是如何运作的, 从而明确业务对于企业的重要意义。对于业务架构的梳理, 企业可以咨询专业的业务服务管理实施团队, 也可借鉴行业内的成功经验, 将自身的业务架构进行一一定位, 进而针对不同的环节进行细致管理, 方可确保完成业务服务管理的第一步工作。

业内大多数的业务系统都包含了业务应用系统、软件平台、硬件平台以及数据交换平台四大要素, 因此IT部门务必就一套完整的核心业务系统进行分解, 定位其各环节的IT资源, 进而把IT资源按照业务的视角展现给管理员。在此基础上才能建立业务服务视图, 通过独特的业务视图, 可以清晰地描述业务与IT运维之间的关联关系和IT服务的关键目标, 便于实施监控和管理。

第二步:业务管理核心运维综合管控

在构建好业务架构并建立好业务视图后, 管理员就已经明确了一套核心业务系统的运作机理, 接下来将是整个管理中最重要的工作, 进行有效的业务管理。具体包括两方面, 一是业务运行管理, 二是业务使用管理。顾名思义, 运行管理就是管理员通过管理系统实时掌握业务的运行指标参数, 这些参数包括用户分布数据、环境数据、各类业务数据、业务运行指标数据、SLA数据等, 而这些数据可以帮助业务相关人员更好地理解业务运营状况和机理, 跟踪业务系统变化, 更好地推进业务部门的运营工作。

而业务使用管理也就是业务的在线使用情况管控, 直接关系到业务系统健康度、饱和度以及运行质量。具体来讲, 通过管理软件从网络流量中剥离出某特定业务的实时业务流量, 投射到网络拓扑结构中, 让业务用户的分布, 各网络节点对业务流动的影响“一目了然”, 并在故障情况下为快速恢复业务的正常运行建立了快速的分析机制, 从而帮助管理员解决最核心的问题。通过物理流量的分析, 确定核心业务系统是否运行正常, 降低了业务系统宕机率, 更好地促进业务的生产运营。

第三步:业务关联分析落实服务管理

对于业务系统来说, 历史数据分析、趋势分析和服务质量的改进等, 都需要通过报表的分析来取得决策依据。因此管理员通过管理软件得出的业务系统可用性、故障分析、趋势等报表, 可以全面掌控业务的运行状况和将来的运行预测, 这对于企业的投资规划以及业务发展方向有着积极的指导作用, 帮助企业去把握发展的契机和核心竞争力。

而通过对业务系统的综合管控, IT部门可以明确在响应IT事件时, 对于企业核心的业务系统事件必须是最高优先级的。而业务部门也会要求业务系统得到全面支持, 从而让IT部门负责业务运行的去负责支撑, 二者通过SAL (服务级别协议) 去找到一个平稳点。唯有落实SLA, 才能提升业务的指标合理化、业务有效利用率、业务运行状态, 以及改善业务容量、通道质量等业务指标参数。进而促进业务系统健康有序发展, 为企业带来更多的价值回报。

IT运维服务管理 第2篇

广州住房公积金管理中心2018年IT运维采购项目监理服务项目

采购需求 采购预算(最高限价)

采购预算(最高限价): 人民币15万元。资格要求

(一)符合《政府采购法》第二十二条供应商资格条件。

(二)具有信息系统工程监理甲级资质。

广州住房公积金管理中心

招标需求

监理服务需求 项目工作内容及要求

一、项目内容

广州住房公积金管理中心2018年IT运维采购项目监理服务项目

二、监理工作内容:

1服务要求

监理方坚持以“质量第一,预防为主,用科学、规范、诚信”作为监理原则,安排监理人员现场办公做好工程和项目进度和质量控制管理,协助建设单位完成运维任务并提供管理和技术咨询,使得运维项目能按时保质通过验收。2服务方式

本服务项目要求以现场监理为主方式进行,监理公司应派总监理工程师按采购人要求驻场并建立项目运维监理组,负责整个项目运维的全称监理工作。3服务周期

监理服务周期要求:在合同双方签定之日起至广州住房公积金管理中心2018年IT运维采购项目监理服务项目通过验收为止。4项目运维方案,组织及实施方案的总体把关

1)审核和确认项目运维单位的运维方案;

2)审核和确认运维单位的实施人员组织和实施计划安排;

3)审核和确认项目运维单位的质量保证计划; 4)审核和确认项目运维单位的进度控制计划。5质量控制

(1)系统集成质量的控制

1)依据合同要求和有关技术标准,审查、监督、控制本项目运维响应及服务的情况;2)采取事前预防、事中控制、事后纠正的方式,依据国家法律、法规、标准以及项目合同、运维方案、监理规划、监理实施细则等文件控制运维质量;每月按项目对各项目运维台账进行查阅审核,提供运维监理月报,对项目运维情况进行量化,提出项目运维工作广州住房公积金管理中心

招标需求 的改进意见;

3)协助业主单位进行运维方案的审核和确认。

依据设计、合同要求和有关技术标准,审查、监督、控制本工程软件开发、设备采购及设备安装调试的质量;

(2)技术培训质量的控制

1)审核确认项目运维单位的培训计划;

2)监督运维单位实施培训计划,并征求采购人的反馈意见; 3)审核确认运维单位的培训总结报告; 6进度控制

(1)监督项目运维单位的人员和设备投入情况,确保运维单位的人员和设备投入能够满足项目运维要求,跟踪每个故障点位的处理情况;

(2)对运维单位处理每个故障点位的情况进行实时跟踪,并要求运维单位对故障修复计划进行动态调整,以确保每个故障点位能够及时修复;

(3)当故障点位的修复工期严重偏离计划时,应及时指出,并提出对策建议,同时督促运维单位尽快采取措施;

(4)采用先进的项目管理工具,控制故障点位的修复进度。7合同管理

(1)协助采购人签订合同;

(2)跟踪检查合同的执行情况,确保运维单位按照合同要求提供运维服务;(3)对长期未修复的故障点位情况进行解释,协助采购人处理运维过程中出现的故障原因无法确认,故障责任主无法确认纠纷调解及仲裁等问题;

(4)根据合同约定,对运维单位提交的付款申请,提出付款建议; 8项目信息管理

(1)及时向采购人提交反映项目运维动态和监理工作情况的项目监理文档;(2)建立全面、准确反映项目运维状况的图表、文档,收集、管理项目各类运维文档和资料;

(3)督促、检查集成商及时完成运维故障台账、故障巡检情况资料的整理和归档工作;(4)转发采购人发出的一切指示、通知和督促项目运维单位对采购人交代的工作进行落实。

9项目文件的管理

广州住房公积金管理中心

招标需求

(1)监理方应负责以下文档的编写:

1)项目运维监理日记、周报、月报及项目运维大事记; 2)项目运维例会、项目协调会等各类会议的纪要;

3)阶段性项目运维总结、阶段性项目监理总结、各类监理通知;(2)监理方应参与以下文档的管理: 1)项目运维期间各类技术文件;

2)合同执行过程中的各类往来文件及存档; 10项目安全管理

(1)负责监督项目运维过程中所涉及的政府数据和资料的安全保护,保证不被非授权使用;

(2)负责项目建设运维过程中安全控制,确保不出现安全事故; 11知识产权管理

(1)负责项目建设运维过程中所产生成果的知识产权保护,保证不被非授权使用; 12项目会议制度

(1)为保证监理工作的开展和实施协调,监理方可组织必要的会议来保证: 1)项目运维协调会; 2)项目运维周例会; 3)项目运维专题研讨会; 4)项目运维问题通报会;

5)项目阶段及运维考核会。(2)监理方还应积极参加以下会议: 1)项目运维专家论证评审会; 2)项目运维阶段工作总结会; 13组织协调

(1)监督各方履行职责,协调各方的工作关系;

(2)建立畅通的沟通平台和沟通渠道,采取有效措施使项目信息在有关各方之间保持顺畅流通,积极协调项目各方之间的关系,推动项目运维实施过程中问题的解决。

(3)确立项目运维安全监督的工作目标。

广州住房公积金管理中心

招标需求 监理工作分阶段要求

本项目监理工作主要分为工程招投标阶段、工程运维阶段、工程验收阶段、工程移交阶段,监理服务商需完成包括但不限于以下内容:

2.1工程运维阶段(1)工程开工前的监理

1)审核运维方案:开工前,由监理单位组织运维方案的审核,内容包括了解运维需求、质量要求,审核运维方案和有关的技术合同附件;

2)审核工程运维方案的合法性、合理性、与招标文件的符合性; 3)审批运维组织设计:对运维单位的运维工作准备情况进行和监督; 4)审核运维计划:对运维单位的故障点位修复计划进行评估和审查;

5)审核工程运维人员:确认运维单位提交的工程运维人员与实际运维人员的一致性,如有变更,则要求叙述其原因;

(2)运维准备阶段的监理 1)审批开工申请,确定开工日期;

2)了解运维单位设备订单的定购和运输情况; 3)了解运维条件准备情况;

4)了解运维单位工程运维前期的人员组织、运维设备到位情况; 5)编制工程各个子项运维监理细则; 6)签发开工令。(3)运维阶段的监理 1)审核运维阶段文件;

2)工程材料、硬件设备、系统软件的供货计划的审核; 3)工程材料、硬件设备、系统软件的进场、开箱和检验;

4)促使工程中所使用的产品和服务符合承建合同及国家相关法律、法规和标准; 5)对工程运维各个阶段进行检查;

7)督促、检查运维单位故障点位修复进度执行情况; 8)审查工程变更,提出监理意见;

9)审查运维单位阶段工程款支付申请,提出监理意见; 10)按周(月、旬)定期向相关部门报告工程情况; 11)组织召开工程运维例会和工程运维专项会议。

广州住房公积金管理中心

招标需求

2.2工程验收阶段

1)对运维单位在运维阶段出现的问题的整改情况进行监督和复查; 2)监督检查运维单位作好用户培训工作,检查工程各式用户文档; 3)组织项目初步验收;

4)审查运维单位提交的竣工文档; 5)参与工程竣工验收; 6)签署工程验收报告; 7)审核工程结算;

8)审查运维单位阶段工程款支付申请,提出监理意见; 9)向采购人提交监理工作总结;

10)将所有的监理材料汇总,编制监理业务手册,提交采购人; 11)系统验收完毕进入保修阶段的审核与签发移交证书。2.3工程移交阶段

1)系统的运维方案等全部移交; 2)设备、材料等的验收文档核实; 3)工程运维文档的移交; 4)工程运维竣工文档的移交; 5)工程项目的整体移交。

投标人根据上述监理工作内容(但不局限于上述内容),分别制定详细的监理工作流程,使本项目的监理工作流程化、制度化。

2.4监理服务应遵守的基本准则

1、执行有关项目建设的国家法律、法规、规范、标准和采购人的相关制度,履行监理合同规定的义务和职责;

2、不得收受被监理单位的任何礼金;

3、不得泄漏所监理项目各方认为需要保密的事项;

4、遵守国家的法律、政府和采购人的有关条例、规定和办法等;

5、坚持公正、公平、公开、独立地处理有关项目各方的争议;

6、坚持科学的态度和实事求是的原则;

7、在坚持按监理合同的规定向招标人提供技术服务的同时,督促被监理者完成其所担负的建设任务。

广州住房公积金管理中心

招标需求

2.5安全保密要求

本项目要求监理方遵守保密制度,确定项目保密责任人,同时要求投标人:

(1)按照国家、省市的有关法律法规文件规定以及采购人专有的保密制度,要求监理履行保密责任,并遵守合同中有关保密要求;

(2)评估项目信息系统的安全保护等级,应当依据有关管理规范和技术标准进行设计和实施;

(3)监理单位各级组织严格履行保密职责;(4)按照保密规定开展监理工作。2.6对监理机构的要求

1、监理人员要求

组建项目监理组,该监理组满足以下要求:

(1)实行总监理工程师负责制,同时成立项目监理委员会,对项目重大决策提出建议和意见。

(2)要求中标供应商在项目实施阶段在广东省内有常设服务机构,机构有固定的工作场所和必要的软硬件设备。

(3)项目监理机构由总监理工程师、监理工程师组成。总监理工程师要求有5年或以上监理经验,必须具有信息系统监理师资质及其他计算机类职称证书,理解和熟悉大型医疗系统业务流程和技术趋势。

(4)本项目以现场监理为主方式进行,中标供应商应派监理工程师按采购人要求提供监理服务,除总监外,项目组人员至少2人组成,且必须具有信息系统监理师资质;必要工程节点监理人员须在场,并建立项目监理组。随时为采购人提供服务且在2个小时内响应。

2、其他要求

监理的中标人若需更换监理机构人员的,提前10个工作日书面报采购人批准后方可更换。因不可抗力因素导致监理机构人员发生变更的,成交单位在10个工作日内书面通知采购人,经采购人同意后才可更换,替代人员具有与原人员相当或更高的资质和能力。采购人有权书面要求成交单位撤换任何不称职的监理人员,更换人员具有与原人员相当或更高的资质和能力。

广州住房公积金管理中心

招标需求 付款方式

(一)采购人与中标供应商签订合同后15天内,支付合同总金额的 50 %。

(二)项目建设完毕并经用户初步验收合格后15个工作日内,支付合同总金额的 45 %。

(三)项目建设完毕并终验合格后15个工作日内,支付合同总金额的 5 %。

(四)成交供应商须在采购人办理付款手续前5个工作日内,向采购人提供应收款项等额的发票。

IT运维走向“贴身服务” 第3篇

四项保障机制

为了实现电子政务运维管理与法院业务的深度融合,更要关注以下几方面的工作:

1.着力提高信息服务能力

以电子政务平台为基础,以强大的运维技术团队为支撑,充分发挥电子政务具有表现形式多样、传播速度快、互动性强的特点,为业务部门和人员量身定制电子政务工具、展示或传播业务信息、提高业务效果和工作效率,让业务人员切身感受到应用电子政务给业务工作带来的便捷和效率的提高。

2.建立电子政务培训机制

建立电子政务培训机制,加速信息与业务融合过程的技能培训,对提高业务工作效率和效果必将产生积极的作用。通过有组织的培训和个性化的引导,提高业务人员对电子政务应用技术的理解和认识,帮助业务人员更有效地驾驭信息系统,变被动使用为主动应用,对促进信息与业务融合具有重要的意义。

3.构建电子政务考核体系

建立电子政务绩效考核管理机制,通过行政管理手段为电子政务与业务融合提供必要的机制保障。考核电子政务信息数据录入不真实、不准确的问题,促进数据采集的真实性和实效性;考核电子政务网络信息安全,提高和加强信息安全意识。

4.形成螺旋上升发展态势

通过电子政务工作人员贴身服务机制,运维工程师与业务人员密切接触,深入了解业务实际工作流程,并将其整理转化为新的业务需求,为下一阶段的规模性开发建设积累经验,形成螺旋式上升的电子政务发展模式。

用管理破难题

北京市高级人民法院(下简称北京高院)在电子政务运维管理、探索提供贴身服务方面虽然已经初见成效,但实践中也暴露出问题。主要有以下几个方面:

1.协调难题

作为促进业务深度融合而发展出的贴身信息服务模式可以即时处理业务部门提出的电子政务需求,但法院业务部门提出的需求在什么样的规模下通过运维外包的贴身化信息服务模式予以满足?什么规模下作为独立项目开发申报?如果都通过贴身化的信息服务模式予以满足,势必混淆运维工作与开发工作的专业性界限,同时也会给传统运维工作造成极大压力。因此,在运维外包模式下发展以贴身服务为引导的业务深度融合机制,需要制定专门的策略,科学、有效、合理地控制贴身服务项目的规模和范围。

2.经费保障难题

目前,虽然北京高院运维服务全外包模式得到推广,成为我国电子政务运行最佳实践,但财政批准的运维经费,仍然是以一般运维工作结合运维资产为基础的核算方法。虽然在运维项目招标中通过“交办工作”的费用项目进行核算,但其费用额度和比例是尝试性的、是不高的,无法真正满足深度融合需要的支出。随着电子政务服务能力和水平的提升,即时性、阶段性的需求也必然越来越多,需要提供的贴身服务也会越来越多,投入的非一般性运维工作成本也会不断增加。在财政未设置该类别费用科目的前提下,仅凭借“交办工作”中有限的运维资金,很难使贴身服务工作得到充分满足。如果资金得不到保障,一方面可能造成业务部门提出的即时性需求难以满足,业务深度融合的效果和受惠面必然大打折扣;另一方面有限的资金也可能造成运维人员投入的不足和提供服务质量的下降,从而影响了运维工作与业务深度融合的实效。因此,要通过运维服务全外包模式,实现电子政务运维与业务的深度融合,需要财政部门给予充分的理解和支持。

3.人员配置难题

在实践中,业务部门提出的即时性需求的种类很多,需要提供电子政务服务的性质也不尽相同,如果全部通过驻场运维队伍解决,需要配置的专业种类和人员级别也很多。而根据运维管理的通常规范,我们要求运维服务机构提供的工程师是针对一般运维工作的,职能相对单一,有限的经费难以做出不同级别和专业的多名人员的配置方案。如果单纯依靠驻场运维机构解决全部业务即时性需求也会存在相当困难。灵活多样的运维人员配置方案,是运维与业务融合策略重点考虑的问题。

北京高院在运维实践中虽然遇到了不少困难,但已经取得的成果让我们逐渐意识到,以创新电子政务管理工作来对应法院业务工作的日常变化,也许正是解开“深度融合”难题的钥匙。这一关键难题的破解,不仅为运维工作开创了新的领域,也将为电子政务发展探索出一条可持续发展的新路。

链接

北京高院IT“贴身服务”显成效

面对越来越多的即时性业务需求,两年前,北京高院在电子政务运维项目招标时,就尝试性地将贴身服务工作机制以“交办任务”的方式纳入运维工作任务范围,虽然每年仅规定了250人日工作量,用于完成“交办任务”工作项目,但收到了良好的效果。

两年来,贴身服务机制共完成了22 个业务部门提出的“交办任务”169项。其中,针对已有系统的小型升级改造任务60余项,占36%;配合各类会议资料,完成电子政务工作任务40余项,占25%;配合临时性、阶段性工作完成的小型开发任务20余项,占12%;配合法院完成新业务的小型开发任务10余项,占6%。

企业IT运维服务管理模式研究 第4篇

1 企业IT运维管理的现状及存在的问题

第一, 由于地域和行业的不同, 所以企业的IT运维管理模式也存在一定的差异。有的企业在管理中习惯使用传统的运维模式, 而有的企业则喜欢应用先进的企业运维管理模式。第二, 即使在同一个企业, 由于级别的不同, 所以其管理方式也存在一定的差别。但是整体来讲, 我国大多数企业的IT运维管理都存在以下问题。

1.1 IT运维管理的服务导性没有得到重视

随着经济时代的发展, 企业的规模也在日益壮大, 在对IT运维管理提高要求的同时, 管理也变得越来越复杂。企业的IT运维管理为什么总是会出现问题, 因为企业的IT运维管理缺乏整体性的管理, 只注重事中管理和事后管理, 从而忽视了IT运维管理的服务导向的重要性。针对这种现象, 则需要在IT运维管理中, 重视对企业IT运维管理的全局性规划, 促使企业的组织能力得到有效的提高。

1.2 IT运维管理的体系不健全

IT运维管理有着较为广泛的范围, 由于大多数企业的IT部门不是按照IT基础机构的功能划分的, 就是按照企业业务的模块进行划分的, 所以企业在日常的IT运维管理中, 既没有办法对IT服务人员的工作进行考核, 也无法监督IT服务人员处理故障的效率及质量。其次, 往往企业IT的运维管理在出现问题时, 并不是单一环境出现问题, 只有企业的多个部门相互协作才能解决问题的关键, 由于企业IT运维管理过程的职责不清及体系不健全, 所以导致企业各部门经常出现互相推卸责任的现象。

1.3 运维管理的流程缺乏保障体系

企业的IT管理部门不仅要确保企业信息系统在运行时的安全、稳定及可靠, 还要利用强大的信息系统为业务部门的各项决策提供有效地支持。但由于IT管理人员往往会出现为了处理突发事件, 从而忽视了主动服务的现象。

1.4 运维管理缺乏长期的规划

大部分企业的IT运维管理由于偏重于对“硬平台”的建设, 忽视了“软平台”的管理和维护, 导致运维工作人员在客户满意度考核中评价较低, 而相关部门的责难也会打击工作人员的积极性。尤其企业网络建设缺乏这种长期的规划和对于复杂IT系统的运维管理经验, 导致企业IT运维管理停滞不前。

2 提高企业IT运维服务管理能力的有效措施

2.1 在ITIL视野下建立适合企业的IT运维架构

传统的运维管理架构相对于IT运维管理架构来讲相当简单, 其在碰到运维方面的问题时由运维负责人分配工作, 这样的运维方式在企业初期阶段简单高效, 但随着企业规模的不断扩大, 以及计算机信息技术的普及应用, 传统运维模式就会受到耗费人力、物力, 并且处理问题的效率也较低以及工作量比较大等不利的因素影响, 所以, 企业为了能够高效率的运维管理, 就需要改换为新的IT运维模式。IT运维管理有三个优点, 第一, 其不但为企业提供了稳定、高效、可靠的网络管理平台, 而且也为企业的各个应用系统的正常运行提供了强有力的保障。第二, 能够快速解决客户端的运维故障, 为客户提供了满意的服务。第三, IT运维管理在为企业节省人力的同时, 提高了处理网络故障的工作效率。基于IT运维管理的这三个优点, 所以企业在IT运维管理方面不断寻求创新以及不断提高要求。

其次, 企业的领导需要结合ITIL思想的指导作用, 建立相应的信息化工作领导小组, 并且其小组的成员必须是企业信息化职能部门, 专门负责IT运维管理的决策管理与协调所有IT运维的工作。

2.2 建立职责相应的奖惩制度及运维工作考核标准

企业各部门的岗位工作方式都不相同, 有的员工做着现场维护的工作, 有的干着远程处理的工作, 所以, 不同岗位的工作所承担的责任以及所享受的待遇也不相同, 但是, 企业要给予员工在职责和待遇方面要与其职位相应, 因此, 企业应当推出与工作职责相应的奖罚及晋升制度, 以激励员工的成长进步。其次, 由于IT运维管理的各个岗位的工作方式不一、技术水平不同, 因此要对运维人员的工作进行量化, 并通过一系列分析运维数据制定严格的考核标准, 激励员工不断提高服务水平和服务质量。

2.3 企业结合组织节后, 建立并明确运维管理的流程

传统运维管理模式对企业IT部门是按应用开发、网络管理以及系统控制等专业进行工作划分的, 其工作也是按照水平层面进行管理的。但是新的IT运维管理系统则是按照专业和技能对企业各部门进行工作分工的, 比如, 一线专门负责解决处理IT运维管理中最基础的问题, 二线则负责解决处理IT运维管理中最难、最复杂的故障, 而经理则需要对IT运维管理进行全面把握和疑难问题的解决。这样根据企业的实际情况, 对结构进行优化, 建立各个系统的的运营架构, 使各个部门既相互独立, 又互相联系。企业只有对组织结构进行调整, 明确企业IT运维管理的具体流程, 即使企业的IT系统出现了问题, 仍难能够第一时间联络相关负责人, 解决问题。

2.4 建立IT运维各系统的管理办法

IT运维管理模式和设备预知维修模式一样, 同样注重预知维修。IT运维管理模式也能够根据监测系统和日志记录系统发现异常现象, 并且能够通过检测系统将故障在萌芽的状态下解决。现代企业管理比较依赖于IT运维服务管理模式, 所以对IT运维服务管理模式的要求也不断提高, 比如, 某大型企业的MES、ERP、IC卡等应用系统, 要求必须实行二十四小时工作, 如果不实行实施工作, 那么如果某一个应用系统中出现任何一个小故障都会给企业造成巨大的经济损失, 因此, 降低信息系统出现的故障率对于企业来讲是非常重要的。

2.5 建立并且完善IT运维服务管理各系统的文档资料

由于网络的不稳定性, 即使企业IT运维服务管理各系统的资料再详细, 也有出现故障的可能, 故障处理不好的话还会导致数据丢失, 而维护好文档资料对IT运维服务管理工作有着重要的意义。文档资料在整理的时候除了要清晰、全面, 同时还需要满足“动态更新”和“高质量材料”两个原则, 如果资料的动态没有得到及时的更新, 对事情对产生不利的因素, 影响对事情的判断;一份高质量的资料能够让一个新人在完全不了解公司情况下, 通过资料能清晰的了解公司的现状, 因此建立并完善的各系统的文档资料管理对于IT运维管理非常重要。

3 总结

多数企业为了实现优化生产程序、提高工作效率以及减少对管理的成本, 都选择使用IT运维服务管理模式, IT运维服务管理模式, 在帮助企业实现以上要求的同时, 企业也对其提出了更高的要求标准, 企业IT运维服务管理模式既要有一个完整、清晰的运维架构及合理的工作流程, 同时更要注重企业的管理工作及制度, 只有这样, IT运维服务管理模式才能够更好的服务企业。究竟未来的IT运维管理会得到怎样的发展, 我们不得而知, 但是不可否认的是, 我国企业的运维管理意识还有待于普及, 相信而随着信息化进程的快速发展, IT运维管理一定会有广阔的发展空间。

摘要:IT运维服务管理与普通的系统维修、排除系统故障等工作不同, IT运维服务管理的核心价值在与为企业提供最优质的服务以及帮助企业实现精益化管理。随着计算机技术的快速发展, 信息技术开始被各行各业广泛的运用, 从简单的计算到初级办公, 再到深入与企业应用系统的各方面, 致使企业在日常的工作中对IT运维服务管理有着极大的依赖性, 因此, 企业对于IT运维服务管理的稳定性、安全性及可靠性有着越来越高的要求。据此, 基于ITIL构建IT服务管理体系的现状做出简要的阐述, 并对进一步优化企业IT的运维服务管理提出了一些建议。

关键词:企业,IT运维,管理模式,研究,策略

参考文献

[1]徐健, 孙永.基于ITIL构建企业IT运维服务管理体系[J].微型机与应用, 2014, (10) :97-101.

[2]刘雁.基于ITIL的A公司运维服务管理研究[D].南京:南京邮电大学, 2014.

IT桌面运维服务具体工作介绍 第5篇

目前,许多品牌电脑专业服务商的售后服务部门,正日益摆脱从属厂家的地位,开始走商业利润最大化之路,发展成为专业服务商。部分技术服务公司从大型企业集团客户服务体系(提供售后维修服务等)的成本服务中心成功转型,成为面对各类行业客户的独立的第三方专业技术服务提供商,大力开展了IT运维外包业务,这类公司的出现逐渐使硬件厂商把服务部门从成本中心转化为利润中心。

IT运维服务业务目标介绍

IT 系统服务和运行维护业务在内的所有业务都是围绕者“技术”、“人”和“业务流程”三个基本元素展开的,这三个要素互相关联、互相制约,共同决定IT运维服务业务目标的成效。对于IT服务和运行维护业务来说,IT运维服务业务目标是保证IT系统正常、可靠、高效、安全运行,为业务部门提供优质服务;“技术”指各种管理监控系统,“人员”是IT支持部门各级员工,“流程”指IT服务和运行维护的各种业务过程,如报警故障处理流程、设备配置修改流程等等。

IT桌面运维服务,指的是员工在工作场所使用的一系列用于信息处理、通信和计算的设备,包括计算机软硬件和其他的相关设备,对它们的管理是每个使用IT桌面的单位机构最日常的工作。具体的说,就是办公环境的维护,详细的工作包括:

1.系统初始检查

对于办公环境刚刚建立或准备建立之时,可提供对全局环境的检查,并得出最佳适合于单位的方案或找出不合理性、出现的问题。

2.硬件故障解决

对PC、笔记本、打印机等办公设备的故障进行定位和处理。

3.硬件扩容升级

升级不满足于办公环境的设备进行升级或更换处理。

4.软件系统支持

对系统软件、一般运用软件进行维护,如选型、安装、使用、优化等进行技术指导和处理,并可实现对系统的监控来实现维护的零距离。

5.防病毒系统的支持

进行防病毒安全方面的技术处理,如查杀病毒、防病毒软件的解决方案、病毒防范安全策略等。

6.网络系统的支持

对简单网络状况进行全局的维护,并做出定制的优化和故障处理。

7.日常维护管理

管理企业中各IT系统的资源资产情况,实现企业的财务部门进行更加方便的数据交互;规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段,实现完善的IT运维管理为企业提高经营水平和服务水平。

8.咨询服务

对于以上的IT桌面运维服务环节提供相应的咨询服务,但在维护合同签署之后依据合同实行。

IT运维管理服务方式介绍

作为IT运维管理,企业在发展过程中都会重视。而对于IT运维管理员来说,必须要掌握IT运维管理服务方式等技巧,才能更好的发挥出运维系统对企业的作用。

IT运维管理服务方式

1.电话支持

2.网络支持

3.现场服务

4.回访支持

5.专人服务支持

6.定制服务支持

提供多方位、多手段的技术支持,以达到解决客户问题的简化和更佳运维的效率化,另也可根据与用户签订的其它服务承诺,以保证提供更加高效的技术支持。

响应、服务时间

根据IT运维管理服务方式将服务分为若干级别,以确定具体的服务的时间和响应时间。

服务购买方式

1.按小时购买支持服务

2.按购买支持服务

3.按项目购买支持服务

4.其它方式

(市场已有方式、仅为参考)

以上就是我们为大家介绍的有关IT运维管理服务方式等技术。

怎样才算是一个合格的IT运维工程师

1、保证服务达到要求的线上标准,如99.9%;保证线上稳定,这是运维工程师的基本责职所在。

2、不断的提升应用的可靠性与健壮性、性能优化、安全提升;这方面非常考验主动性、和创新思维。

3、网站各层面监控、统计的覆盖度,软件、硬件、运行状态,能监控的都需要监控统计,避免监控死角、并能实时了解应用的运转情况。

4、通过创新思维解决运维效率问题;目前各公司大部份运维主要工作还是依赖人工操作干预,需要尽可能的解放双手。

5、运维知识的积累与沉淀、文档的完备性,运维是一个经验性非常强的岗位,好的经验与陷阱都需积累下来,避免重复性范错。

6、计划性和执行力;工作有计划,计划后想法设法达到目标,不找借口。

7、自动化运维;能对日常机械化工作进行提炼、设计并开发成工具、系统,能让系统自动完成的尽量依靠系统;让大家更多的时间用于思考、创新思维、做自已喜欢的事情。

以上只是技术上的一些层面,当然个人意识也是很重要的。

补充:

个人素质方面:

1、沟通能力、团队协作:运维工作跨部门、跨工种工作很多,需善于沟通、并且团队协作能力要强;这应该是现代企业的基本素质要求了,不多说。

2、工作中需胆大心细:胆大才能创新、不走寻常路,特别对于运维这种新的工种,更需创新才能促进发展;心细,运维工程师是网站admin,最高线上权限者,一不小心就会遗憾终生或打入十八层地狱。

3、主动性、执行力、精力旺盛、抗压能力强:由于IT行业的特性,变化快;往往计划赶不上变化,运维工作就更突出了,比如国内各大公司服务器往往是全国各地,哪里便宜性价比高,就那往搬,进行大规模服务迁移(牵扯的服务器成百上千台),这是一个非常头痛的问题;往往时间非常紧迫,如限1周内完成,这种情况下,运维工程师的主动性及执行力就有很高的要求了:计划、方案、服务无缝迁移、机器搬迁上架、环境准备、安全评估、性能评估、基建、各关联部门扯皮,7X24小紧急事故响应等。

4、其它就是一些基本素质了:头脑要灵光、逻辑思维能力强、为人谦虚稳重、亲和力、乐于助人、有大局观。

IT运维服务管理 第6篇

摘要:随着平板电脑、智能手机等智能终端设备的快速普及,通过智能手机和平板电脑来访问电子邮件、文档和应用程序的用户已形成规模,同时移动办公也使得IT运维更自动、便捷,正如企业一样,随着高校管理、教学的信息化、互联化,师生对可以用各种移动终端接入学校应用的诉求将越来越强烈,也给高校IT运维服务提供可拓展到移动互联设备的机遇,本文通过研究高校IT运维的成功案例,提出了基于移动互联网的高校IT运维服务(平台)设计框架,助力高校IT运维服务。

关键词:移动互联;IT运维

随着高校信息化建设的不断深入、各种应用的不断增加,如何保障各业务系统的高效运行,如何让师生更高效快捷的获取各种校内资讯及各种应用服务,服务于广大师生,实现更好的IT运维,成为大多数高校的当务之急。在此介绍下清华大学借力锐捷网络提供的RIIL综合监控运维平台,及由此分析高校即将要面对的移动互联网下的运维服务。

清华大学的信息部门共有三个中心,此次实施IT运维管理项目的是计算中心。经由锐捷网络与计算中心的工程师携手完成RIIL-RMC产品中的配置管理、事件管理和项目管理模块的建设后,经过对现有基础设备的统一监控,计算中心利用RIIL-RMC服务请求管理中心,可以将IT运维管理流程与日常信息工作管理真正实现了电子化、自动化。而通过与RIIL监控类系统对接的实施,在自动获取IT监控事件的同时,计算中心现在已经可以通过先进的CMDB (配置管理数据库)管理每一个运维对象,包括运维配置上的每一次修改和变更历史,极大地提高了排除故障的效率。

第1章 业务价值分析

1.1 服务存在的必要

清华大学计算中心力借力锐捷网络提供的RIIL综合监控运维平台成功实现IT运维管理质的改进,极大地提高工作效率和管理水平,是高校IT运维一个成功的案例,同时,可以预见的是,随着高校的管理及教学的信息化、互联化,正如企业不可避免要面对的是,师生对可以用各种移动终端接入学校应用的诉求将越来越强烈,高校的各种应用将接入移动互联网,这是高校IT运维所要考虑的新课题。

1.2 服务存在的可能性

基于移动互联网的IT运维服务在技术上是可以实现的,业界已经有先知先觉的IT运维管理服务商在运维平台上提供了相应的支持,国际知名IT运维服务提供商Kaseya已经率先推出了整合移动客户端的IT运维解决方案,通过该方案,管理员可以通过相应的管理功能来实时跟踪、更新和保护部署该方案的移动设备,卡西亚(Kaseya)在融合了移动客户端的同时把备份和恢复功能功能也拓展到了移动设备上。通过远程管理可以在中央服务器上备份通讯录,在出现问题时可以及时回复联系人数据。而一旦出现不慎遗失客户端的情况,通过移动管理可以实现消除手机数据,禁用手机等操作,及时将损失降低到最小。

第2章 服务(平台)产品设计

通过构建基于移动互联网的高校IT运维服务平台,实时跟踪管理师生各类接入应用的移动设备,更新和保护部署接入应用的移动设备,保证接入应用的移动设备能及时更新各应用终端及排除各种非法的访问操作,同时运维人员的移动设备进行相应的管理,保证运维的合法性及便捷。通过系统平台日常相关运维服务工作实现自动化管理,同时实现运维人员与师生互评绩效管理。框架如下:

2.1 服务台管理

服务台作为运维的主要的联络点,分为人工、语音、自动这几种交互方式,进行故障记录、任务分派、任务跟进等操作。

2.2 事件管理

事件管理是创建、处理事件的模块,一个事件的生命周期全部会在此模块内,在设计时,需要考虑以下的信息:

2.2.1 事件的类型

分为故障请求、咨询、新需求、投诉等。

2.2.2 事件的分类

分为硬件、应用、软件、网络、安全、业务这几个大类。

2.2.3 事件的等级

5个等级,默认情况,等级越高的事件,是表示越严重,表示要优先处理。

2.2.4 事件的状态

分为创建、分派中、处理中、等待中、解决、关闭。

2.2.5 事件与CMDB的关联

事件与CI的关联, CMDB所有的信息与事件的信息可以交叉进行统计分析。

2.2.6 事件与其它流程的接口

事件处理过程中可以直接发起变更申请,也可以发起问题申请与知识库申请。

2.2.7 事件的时长与工作量

事件的处理周期时长是为了SLA的计算,事件的花费的资源量,即工作量时长为了运维资源的分析。

2.3 问题管理

问题管理处理逻辑类似事件,许多信息继承事件,比如等级与类型等。

2.4 变更管理

在ITIL中变更与发布是两个独立的流程,可以把变更与发布流程合并为一个,变更的实施就是发布流程,即发布可以理解为是变更的一个子流程, CMDB精确度如何,很大程度上取决于变更的执行情况。让CMDB的信息更新得到真正有效的控制,变更的主要目的是授权与控制对基础架构或其它的服务的改变,这里的更新是指现实的服务或物理上的基础架构,而不是系统中数据的更新,要对一段网络做调整等操作,但是有可能会影响到几个系统项目,这时需要发起变更申请等。

2.5 配置管理

配置管理模块,核心的是CMDB,这里就配置管理流程层面简单说明下:

2.5.1 CMDB的审计

CMDB审计需要规划好,根据各种条件审计,比如根据某一类的组件,某一个项目的组件,还可以确定一定的数量进行审计(随机抽取)也可以决定一定的比率(随机抽取),审计的目的是为了检查CMDB的数据正确情况,找出问题并修正。

2.6 操作管理

2.7 知识库管理

2.8 调查管理

第3章 技术解决方案

采用B/S系统架构,开发平台是J2EE,数据库采用Oracle。

第4章 总结

鉴于当前高校系统构建的复杂度越来越大,系统故障发生概率和潜在隐患变多,持续可靠提供应用服务、保障业务畅行无阻的风险已经凸显。如何更加有效地管理 IT 资产,积极回应业务部门事业发展和广大师生个人成长的信息化应用诉求,提供稳定优质的IT 服务,已成为学校各级组织和人员的普遍关切,也迫使信息化建设部门的角色从单纯的信息技术提供者向信息服务提供者的角色转换,发展机制由“技术驱动”向“业务驱动”转变。因此,构建科学化、规范化、标准化、流程化的 IT 服务管理体系已势在必行。只有通过沟通提学校领导层面对IT运维的重视及应用落地上述所提到的合适运维平台,才会达到以下的价值:

IT运维服务管理 第7篇

通过BSM来实现IT与业务的有机融合, 关键的一点是, 在内部建立以业务为核心的运维管理思路。将是否对业务具有支撑能力, 以及这个能力的大小作为评价IT系统的有效价值和IT部门业绩的首要指标, 形成技术部门为业务服务的理念和文化, 不断促进IT与业务的融合。从实现路径方面来说, 理论上可简单概括为以下几个步骤:

首先, 构建业务架构, 理清业务系统, 特别是关键业务的应用。通过对业务系统进行准确定位, 建立业务服务模型, 梳理清楚业务与IT运维之间的关联和IT服务的关键目标, 以便定义如何监控和管理业务服务, 进而针对不同的环节进行细致的管理。

其次, 做好业务管理和综合管控。有效的业务运维是整个运维管理中最重要的工作, 具体包括业务运行管理和业务使用管理。运行管理将业务关键参数映射到业务架构上, 实时反映业务运行情况, 帮助业务相关人员更好地理解业务运营状况和机理, 跟踪业务系统变化, 更好地推进业务部门的运营工作;而使用管理则通过对使用情况的分析, 确定业务系统健康度、饱和度以及运行质量。

最后, 提供业务关联分析, 落实服务管理。IT部门与业务部门之间通过建立SAL (服务级别协议) 有效落实服务管理, 同时, 全面保证业务管理中的问题发现及处理机制, 并通过业务关联分析取得决策依据。

IT运维服务管理 第8篇

业务服务管理 (Business Service Management, BSM) , 是IT运维管理的高级阶段, 强调从实现企业业务价值的目标出发, 以业务的视角看待IT管理, 最大限度地发挥IT对企业业务的推动作用。在此, 探讨利用BSM改进供电企业的IT运维管理体系及其运维架构, 并对支撑BSM的IT运维支撑平台的总体设计进行了介绍。

1 IT运维管理现状

当前, 国内供电的信息化建设正步入高速发展的时期, 随着营销、生产、财务以及人力资源等主营业务系统的逐步统一, 信息化建设按上级公司的规范化方向发展。如在广东电网公司系统内, 核心和主要业务系统的建设均由省公司主导、全省统一版本, 数据基本采取省集中或者地市集中模式。目前, 省公司和各地市供电局信息化运维服务体系建设, 基本处于起步阶段, 虽逐步建立了与运维服务体系相关的平台系统, 但运维体系却仍然沿用过去分散和杂乱的模式, 已经明显跟不上信息化建设的步伐。

汕头供电局是广东电网公司下属机构, 已陆续建立了网络、主机系统、信息安全和机房等各种监控管理系统, 并采用了IT服务管理软件作为流程流转和信息共享的平台, 实现了服务台管理、配置管理、变更管理和问题管理, 初步完善了IT基础架构监控, 统一了IT服务入口和规范IT服务流程。

目前, 汕头供电局所建的IT监控系统和IT服务管理系统基本上以面向设备为主, 没有直接面向业务。在面向设备的运维模式下很难从整体上对业务系统可用性和健康状况进行实时评测, 难以了解用户体验情况, 无法对基于用户的业务服务水平进行量化评价和分析, 造成运维工作长期处于被动局面, 已经不能满足日益扩展的运维管理工作的需求。因此, 整合现有各类监控系统, 强化运维分析功能, 实现面向业务应用的集中运维已显得非常必要和迫切。

2 利用BSM改进供电企业的IT运维管理

2.1 升级BSM的可行性

IT运维/服务发展经历了网络服务管理 (Network Service Management, NSM) 到IT服务管理 (IT Service Management, ITSM) , 再到BSM的变革。目前绝大多数供电企业都已经实施了ITSM, 关注点不再是选择何种网络管理工具, 而是什么样的IT运维工具能够真正提高IT运维的效率, 实现企业网络利用率的最大化。

相比NSM和ITSM, BSM的优势在于:BSM的主要功能是实现IT资源与其支持的业务服务之间的动态映射, 让IT部门能够将基础设施事件与业务成果关联起来;BSM能够整合各个层次IT资源的事件和状态, 让运维人员能取得业务服务的性能、用户体验和服务水平等具有直接业务价值的信息;BSM提供对服务的业务影响看法, IT部门可以根据服务资产的业务影响衡量这些资产的价值, 帮助IT部门作出正确的业务决策, 图1显示了BSM与IT基础架构和业务服务的关系。

与ITSM相比, BSM更注重业务服务质量和用户体验, 其IT运维管理的目的更倾向于实现业务价值。BSM是建立在ITSM更高一层的IT运维架构, 与原有的ITSM并不冲突, 可以保留现有的基于ITSM的IT运维系统, 通过升级改造实现BSM目标。

2.2 实施BSM的目标和步骤

根据汕头供电局目前的IT运维现状和存在的问题, 对BSM实施的目标设定如下:

(1) 整合和补充完善现有IT资源系统, 实现对监控事件和状态的统一推送和综合利用。

(2) 建设一个强大、实用的运维分析系统, 实现故障隐患和关键指标的有效监测, 让运维人员能够把精力从事后处理转为事前预防, 最大限度地提高业务应用的服务水平。

(3) 理清IT资源和业务应用之间的依赖关系, 提供业务服务建模和图示化的关键指标展现, 实现IT与业务的融合。

(4) 构建一套科学的服务水平管理体系, 实现服务水平的定义、评估、告警和分析, 确保IT运维目标的实现。

(5) 从面向业务的角度出发, 解决IT集中运行监控系统未能覆盖的监控需求。

(6) 解决集中运维场景下信息的统一调度和信息推送。

面向BSM的IT运维比基础的IT运维提高了一个层次, 具有较高的技术要求, 考虑到该项目的实施复杂度, 以及与省公司IT服务运维项目实施的一致性, 在本项目的实施进度上采用分期建设模式:

第一期工作重点是以电力营销相关业务应用为核心, 围绕其对原有的网络、主机、系统平台、机房和门禁等各种监控系统进行整合和扩充完善, 实现面向业务应用的监控整合、智能分析、故障预警、信息推送、用户体验管理和服务水平管理功能。

第二期的工作是把业务服务系统扩展到企业的所有关键业务服务, 并建立覆盖各个县级子公司的两级运维业务服务支撑体系。

2.3 实施方法

考虑到汕头供电局目前已经实施了较为完善的运维系统, 为了保护现有资产、降低升级成本, 采用ITSM向BSM平滑演进的实施模式。如图2所示, 对现有的运维/监控系统在界面、数据、事件分析上进行整合, 并增加用户体验监控;利用整合数据进行业务服务映射, 形成业务服务统一展现、业务服务水平分析和业务服务影响分析。

3 面向BSM的IT运维支撑平台的总体设计

3.1 总体架构

面向BSM的IT运维支撑平台总体架构如图3所示。

(1) 应用管理。提供具有故障分析和预警能力的应用监控管理。以业务视角组织和展现运维对象, 并按业务需要提供监控结果。BSM要求事后处理向事前维护转变, 变事后被动修复向实时监测主动维护, 因此监控平台需要具备事件关联分析能力。

(2) 用户体验管理。发现业务服务在功能点和地域之间的差异和优势, 发现潜在隐患和快速定位问题。用户体验管理系统可以解决监控死角问题, 并在发生故障的应用系统对用户产生不良影响之前进行预警。

(3) 监控整合。提供对多来源、跨专业的事件进行分析、加工、压缩、过滤、展现和推送机制, 实现监控信息的综合利用。

(4) 智能信息推送。IT集中运维导致不同地域、不同机构的运维人员都需要准确了解运维信息和故障告警, 因此, 需要一套统一推送机制实现包括短信、看板、声光、桌面以及邮件等多种形式的信息推送方式。另外原厂商和集成商也需要订阅不同运维中心相关的告警信息, 能够加快解决故障的速度。

(5) 服务水平管理。提供服务水平目标设定、监测、评价、预警、分析与报告功能, 确保业务服务质量符合客户期望。服务水平管理能够客观科学地反映运维质量, 通过服务水平管理让IT部门关注客户需求, 有效地履行服务承诺。

3.2 关键技术

在实施面向BSM的IT运维支撑平台过程中, 必须解决多个关键技术, 确保该平台能够与BSM运维体系相适应, 确保新增投入的有效性。

(1) 上下文关联分析引擎 (CCE) 。CCE是一个支持并发分析的多线程分析引擎, 负责对采集插件上报的报文进行加工、处理、分析和判断, 并把分析出来的指标监测结果存储到数据库中。CCE是一个规则驱动的分析引擎, 规则驱动技术与过程驱动技术相比可以大大降低分析脚本编写的难度, 使非专业开发人员也可以自行修改或者编写分析规则。

(2) 浮动阀值支持。由于很多监控指标不能根据单一设置的阀值进行分析处理, 所以分析规则需要根据不同的时段确定不同的阀值范围。例如CPU的负载监测可能要在上班时间设置一个阀值范围, 非上班时间设置另一个阀值范围。对于这一情形系统必须提供时段阀值范围定义功能。

(3) 防抖动设计。指标防抖动设计是为消除“瞬时出现故障又很快恢复正常”这种现象而特定设计的。指标抖动现象是IT设备运行中经常出现的问题, CPU负载、内存利用率等就是这种经常抖动的指标。

(4) 采集依赖分析。采集依赖是在数据采集阶段的一种分析技术。在网络上互相连接的多个设备之间, 当一个节点设备出现问题, 下边连接的设备都将不可访问, 通过采集依赖分析技术, 可以直接定位出现问题的节点设备, 同时, 对其下连接设备的所有错误信息进行屏蔽。

(5) 业务依赖分析。各种IT资源之间都是相互依赖的, 尤其是业务系统的IT资源依赖更加紧密, 使用业务依赖技术可以准确地对多个具有业务依赖关系的IT资源进行故障定位。例如:对Oracle数据库表空间的监测, 在表空间被设成自动增长的前提下, 主机磁盘剩余空间不足就会直接导致表剩余空间的不足。当表空间不足的时候, 通过业务依赖分析, 就可以分析出是主机磁盘空间不足还是表空间不足。

(6) 系统安全机制。监控过程中有大量的数据交换, 同时不同身份的用户也需要通过网络对运维平台进行管理, 因而必须使用数字签名和加密等技术, 保证数据的安全交换以及用户的身份认证和授权。

4 结语

IT系统生命周期包括IT系统开发和运维两大阶段, 随著IT系统的大规模建成和投入运行, IT运维越来越受到前所未有的重视。相比IT系统开发, IT系统运维不仅时间跨度长, 而且IT运维质量直接影响到业务服务的质量。对于供电企业, 由于业务复杂、信息化水平较高, 其IT技术架构也日趋复杂, 一个业务应用通常跨越多个IT资源层面, 传统运维模式已经很难满足企业要求, 选择合适的IT运维管理工具就显得非常必要和迫切。汕头供电局针对面向BSM的IT运维管理架构及其技术支撑平台进行了大量调研, 拟采用对现有基于ITSM的运维体系向BSM体系平滑升级的方法来解决现有运维模式所存在的问题, 实施初期已获得了一定的效果。下一步的工作是完成面向BSM的IT集中运维分析系统的建设, 并从“规范化、体系化、指标化”角度出发, 制定行之有效的面向BSM集中运维的技术解决方案和实施方案, 规范和指导IT运维人员开展工作。

摘要:目前, 供电企业普遍实施的面向设备的IT监控平台, 无法从整体上对业务系统的可用性和健康状况进行评测, 难以保证IT运维的质量和服务水平。从解决这一问题入手, 阐述了如何利用业务服务管理 (BSM) 理念对供电企业的IT运维架构进行改造, 将IT运维提升到BSM的高度, 以业务的视角看待IT管理, 最大限度地发挥IT对企业业务的推动作用, 同时也对面向BSM的IT运维基础支撑平台的总体设计进行介绍。

关键词:IT运维,业务服务管理,IT监控,供电企业

参考文献

IT运维服务管理 第9篇

六西格玛是一种基于数据制定决策的质量管理方法, 以数理统计技术和工具为基础, 通过系统地、集成地改进业务流程, 消除过程缺陷和无价值工作, 从而提高产品质量和服务水平, 降低成本, 缩短运转周期, 增强组织的竞争力。西格玛 (“σ”) 度量质量特性总体上对目标值的偏离程度, 几个西格玛是一种表示品质的统计尺度。任何一个工作程序或工艺过程都可用几个西格玛表示[1]。6个西格玛可解释为每100万个机会中有3.4个出错的机会, 即合格率是99.99966%, 而3个西格玛的合格率只有93.32%。

六西格玛管理方法由摩托罗拉公司发明, 后来又通过通用电器公司完善, 它一直被人们看作是用于运营和制造业的方法。但在这10年来, 金融机构、能源和公用事业相关行业已经认识到六西格玛是他们改进流程 (包括业务流程和IT流程) 的一种方法。

一件产品, 无论是实体产品 (衣服、家具等) 还是抽象产品 (例如服务) , 其生产均由一系列流程组成。所有的流程由一系列的步骤、事件或活动组成。六西格玛经由以下方式对流程中的每一个步骤加以测量[2]:对每一个流程中的元素进行分解;确定关键特性;定义和描绘相关流程;了解每一个流程的性能;发现薄弱环节;改进流程性能以改善质量, 提高顾客满意度, 增加组织的经营业绩并带来利润的增长。六西格玛管理方法通过DMAIC方法论来管理流程的测量, 以实现关键质量因素的优化和控制来达到甚至超越客户满意度之目的。

DMAIC方法论具体含义为:D (Define) 表示定义, M (Measure) 表示测量, A (Analyze) 表示分析, I (Improve) 表示改进, C (Control) 表示实施。

2 广州市规划局IT运维服务现状分析

广州市规划局信息化建设时间比较早, 1987年就引进城市规划地图信息系统, 到1992年率先提出了超大规模、大比例尺地形图扫描建库的技术方法, 并且开始应用专业系统实现动态信息建库[3]。从1995年到2013年, 广州市规划局围绕规划管理、规划编制工作, 建立并不断完善具有丰富技术内涵和完善功能及决策支持能力的较完整的数字规划体系, 建设的信息系统包括业务协同办公系统、地理信息系统, 廉政风险预警防控系统、异构系统平台、异种数据格式的交换管理体系, 三维数字管理平台、移动办公系统等。这些信息系统对促进规划编制水平和行政管理水平的提高发挥了重要作用。数字规划全过程运作已和信息系统息息相关, IT服务的质量已影响到整个规划运作的方方面面。

早在2007年, 广州市规划局的信息服务部门广州市城市规划自动化中心 (以下称自动化中心) 已建立一套IT服务管理机制[4], 并建立了一个集中受理各类服务需求的IT服务管理系统。

IT服务管理机制制定了一套标准化服务支持流程, 并制定了在服务支持流程中不同角色所承担的责任。IT服务人员都遵循这套服务支持流程工作, 经过多年的实践及改进, 该流程已比较成熟, IT服务支持人员自觉按流程操作, 各项服务支持工作的开展如同工厂生产线上的流水作业一样顺畅。

所建立的IT服务管理系统不仅仅是电子服务台, 还实现了配置管理 (通过识别、控制、维护和验证现存的IT环境所有信息系统、基础设施、文档、客户等来制定IT基础架构) 、问题管理 (受理用户问题, 分配问题) 、事件管理 (对IT服务运营过程中出现的故障做出事后的反应) 、版本管理 (负责软件和硬件变更后的分发、安装和记录等) 和集中控制。目前, 广州市局机关处室及下属全部分局1300多用户都使用该系统寻求IT服务支持, IT服务管理流程如图1所示。

3 六西格玛管理在提高运维服务质量管理中的应用

尽管IT服务支持流程已比较成熟, 但随着2013年市局机构改革, 原有机关处室人员调动频繁, 设备更换较快。2014年原不属于服务范围的从化市、增城市规划局也将变为必须维护的规划分局, 客户数猛增上百人, 维护地域范围变广。这些变化使得IT服务人力日渐紧张, IT服务的效率也随之下降, 用户的满意度较比以前有所降低。为了在不提升维护成本情况下提高用户满意度, 自动化中心使用六西格玛管理方法, 运用DMAIC循环对输入过程中的因素进行分析和控制, 一步步解决问题, 提高了运维服务质量。

3.1 问题定义阶段

定义问题是六西格玛管理方法的第一步。2013年11月, 我们对服务之窗2013年的IT服务数据进行统计, 得到前10个月的问题一次解决率数据, 如表1所示。

从表1数据可得:2013年前10个月问题一次解决率平均为67%, 即从服务台受理的问题直接被第一级服务支持人员解决的只占总问题数量的67%, 剩下33%问题都被转到二级服务支持人员。问题一次解决率直接影响到服务效率, 等待答复或问题最终解决时间过长会直接降低用户对服务的满意度。

因此, 我们将提高问题一次性解决率作为改进服务的目标。

3.2 测量阶段

为找到影响问题一次性解决率的原因, 对2013年前10个月服务之窗记录的全部问题进行整理, 研究了影响服务质量的潜在问题领域, 并使用了因果图实施测量, 以寻找影响服务质量的全部因素。查找到影响“问题一次性成功解决率”的因果图如图2所示, 找出的全部因素都属于潜在的问题领域。

3.3 分析阶段

从图2的因果图分析发现人员的因素对服务效率和质量有重要影响。当用户通过电话或服务之窗网站发出服务请求后, 一级服务支持人员由于个人的沟通能力、工作经验不同, 会对用户的需求产生不同的理解。

IT服务支持人员知识、经验重用度不高。经验较丰富的服务人员所掌握的知识以及解决问题的方法没有充分被经验较少的人员所掌握, 出现了同类型问题被不同人处理, 结果有差异。甚至同一个一级服务支持人员处于不同工作环境时, 也会对同种类型请求的回应不一致。这些情况都使得用户对所获得的维护结果不一定满意。

当用户提出的故障请求涉及业务办公信息系统、地理信息系统等专业软件的统计分析或与网络故障、服务器问题密切相关时, 33%的问题会被一级服务支持人员转给二级服务人员。由于二级服务人员由开发人员、网络管理员、服务器管理员、数据维护员和第三方开发商、供货商兼任, 从问题转入到解决的时间周期较长, 最终表现为用户等待答复的时间较长, 从而也降低了用户的满意度。

当某个月因为人员调动频繁, 设备更新需求猛增或推出系统新功能时, 该月的维护量会明显高于正常数值, 这时维护人员因为工作量变大, 人手不够 (等于维护环境相对变差) , 一次性解决率也会有所降低。

3.4 改进阶段

通过对六西格玛管理方法进行分析发现问题原因, 可以针对问题实施改进。

1) 丰富知识库的知识

知识库是一种允许快捷、简单检索客户请求帮助的工具。通过使用知识库, 就可以提高一级服务支持人员“重用”成功解决方案的几率, 减少因为经验水平不同而产生的同类型问题不同处理结果的现象, 让服务支持活动变得稳健。

在服务之窗建立初期已设计了知识库, 但对经验较少的一级服务支持人员来说并没有发挥很大的作用。其原因是经验丰富的服务支持人员解决完问题后, 常常在最后只是简单地记录“问题已解决”, 该答复不易被其他一级服务人员重用的经验知识。改进措施为:规定全部一级服务人员在结束一个问题时, 必须记录具体的处理步骤和过程信息, 以丰富知识库, 实现维护经验共享。

2) 提供多种形式的培训

并非所有知识都可以被记录到知识库, 比如与专业软件升级改造或网络结构、服务器、专题数据等相关的复杂问题, 大部分都需要对系统或网络有相当了解之后才能解答。因此, 在一级和二级服务人员之间开展交叉培训, 让一级服务人员深入了解各专业系统已有功能, 了解网络结构, 不但能有效提高一级服务人员处理问题的能力, 还能让服务人员从业务视角对造成事故的各种问题进行归类和分析, 并提出相应的应对措施, 拓展服务范围。

对于数据服务这类问题量不大但专业知识很强的服务, 则直接开辟服务专栏, 请从事该类工作的二级服务人员以一级服务人员身份接听来电或解答网上问题, 加快解决问题的速度, 并将解决问题的方法记录到知识库。

信息系统新功能发布前, 已事先参加培训的一级服务人员主动通过服务之窗向用户反复推送“功能预告”等信息, 加大功能操作的宣传力度, 让用户在正式使用系统新功能前就对功能操作有较清晰的了解;等功能发布后, 大部分用户已可顺利操作, 减少了问题总量, 相当于改善了服务环境, 确保一级服务人员的工作强度适中, 服务效率稳定。

3) 使用远程管理方法

借助远程管理方法, 一级服务人员可在用户的注视下, 代替用户操作用户的电脑, 实施需要特殊权限才可进行的加入域或安装专业软件等操作。这种解决问题的方式可以完全忽略客户所在的地理位置或客户计算机操作不熟等客观条件, 由一个或几个服务人员合作处理故障, 极大提高了问题一次性成功解决率。

3.5 控制阶段

将改进措施纳入日常管理活动中, 确保对改进措施实施情况持续监测, 并定期对改进前后相关数据进行分析对比, 评价改进后的结果与预期目标是否相符。建立长期的跟踪控制系统, 即时解决出现的各种问题, 使改进过程处于稳健状态。

改进措施从2013年11月开始推行, 12月份问题一次解决率即有明显提高;但最初3个月这种解决率还处于波动状态。从第4个月, 即2014年3月开始, 检测结果显示“问题一次性成功解决率”从原来的67%%稳定提高至72%左右, 具体情况如表2所示。

表2数据显示IT服务改进措施是有效的, 随着一级服务人员对规划业务越来越熟悉, 问题一次性成功解决率将会进一步提高。

4 结束语

六西格玛作为寻求最佳顾客服务质量的流程改进方法正折射出无限的魅力, 它能测量服务组织绩效能力, 检测服务管理流程是否提供了应当提供的服务。ITIL为IT服务管理提供了一个框架, 六西格玛则给出经过锤炼证实的质量和改进质量的一套统计工具, 只有六西格玛管理方法与IT服务管理密切结合, 才可能成功面对顾客日益增长的需求, 在不增加成本的前提下, 通过优化流程甚至创新流程来维持或提高用户满意度。

参考文献

[1]Jan van Bon.IT管理框架[M].刘向晖, 译.北京:清华大学出版社, 2009.

[2]Sven den Boer.六西格玛在IT管理中的应用[M].张晓娟, 王新才, 译.北京:清华大学出版社, 2009.

[3]潘安, 李时锦, 唐浩宇.全过程的数字规划支持系统 (DPSS) 研究[J].中心人, 2004, 6 (72) .

高校IT运维服务建设内容浅析 第10篇

信息部门对IT系统进行维护的目的表现突出为以下3个:保证IT基础设施的可用性和安全性;合理实现和支持业务自动化;有效推动和支持业务创新。这是衡量IT部门工作成绩的标准,3个内容是不断递进的关系,是IT应用深度和广度不断提高的过程。针对高校信息部门而言,对IT运维进行有效的管理,使信息系统更加适应业务持续变化的需求,使信息部门从成本中心转变为价值中心,是需要迫切解决的命题。

2 IT运维服务的建设内容

2.1 运维基础

如何针对多种厂家设备、系统提供给师生用户一站式服务,这就需要将预防性服务和快速故障解决相结合,提高IT系统的稳定性和可用性,并通过专业的服务流程和灵活的定制服务,以让用户可以得到更高的服务质量和更好的服务体验,从而提升IT系统的故障解决效率,降低运维成本。

2.1.1 日常管理

(1)电话响应与支持:通过热线电话、邮件、在线交流系统等方式接受用户故障请求、技术咨询、远程问题诊断与处理,专业的callcenter呼叫中心对于提升信息服务部门的形象起着关键作用。

(2)实时监控与预警:通过对IT系统进行监控,通过预警机制将问题及时解决,“早用户5分钟发现问题”是典型的建设指导。

(3)值守/值班工作:信息部门应安排值班人员,提供724小时服务,对于法定节假日,也应做好相关值守安排,树立起不间断工作和服务的形象。

(4)用户端上门服务:对于电话指导无法解决的故障,信息部门须明确相关的服务标准,提供好类似上门或送修服务,提高师生的直观服务感受。

2.1.2 定期管理

(1)定期健康检查:系统检查与分析是发现问题的重要途径,信息部门须制定好相关的模版和指导书,使这一工作常规化。

(2)技术交流与分析:针对日常维护的常识、系统和设备特性、使用经验、常见故障处理等,信息部门应组织进行专题交流讨论,并整理归档相关材料和报告,建立FAQ,建设学习型的组织。

(3)培训组织:通过技术等级定义,并提供外部培训、内部学习的方式,提高员工技能,并可与员工晋升、职称评定等相结合。

2.1.3 问题管理

(1)硬件维保:维保服务主要是厂家协助用户进行故障定位和排除,并对故障件进行更换。信息部门根据资金和技术要求,也可考虑采用第三方维保。

(2)设备清洁和除尘:通过除尘、防静电处理等工作来延长设备寿命,提高业务运行效率和稳定性,这已经成为设备维护的一种共识。

(3)系统软件维护:与硬件设备配套的系统软件,需要进行功能性维护,如安排打补丁、升级等。

(4)商业软件专项服务:对于类似中间件、数据库软件、虚拟机软件等主流的商业软件,信息部门应掌握好日常使用与管理,并通过原厂的电话支持解决一些疑难杂症,而对于一些危险性较高的如升级、迁移改造工作,则需要考虑专业服务商提供上门服务。

(5)疑难故障分析:对于疑难故障,其特征往往是无法定位原因,这就要求信息部门对业务和运行架构充分理解,有效组织好各厂家配合解决,将问题的处理对业务的影响降到最低,将问题处理的综合成本降到最小。

(6)性能评估与优化:信息部门应定期组织进行性能检测、评估等,并进行优化建议和处理工作,以保证关键业务的开展。

(7)系统变更支持:信息化的建设,必然存在着系统上线、移机、扩容、调整等情况,这些工作应遵循变更管理的流程,同时及时更新IT基础设施和运行环境管理手册。

(8)迁移管理:迁移通常会有机房与设备、系统与应用、数据3个层面的工作。信息部门应全局把握,站在业务的角度提出条件和要求,全程指导、关键IT设备的技术支持、保障,平滑迁移并保障搬迁后正常运行。

2.2 运维保障

针对关键数据及运行支撑系统,信息部门必须确保对数据的产生、存储、备份、管理、流动、安全所需的项目及技术实施的知识和方法,从而提高IT信息部门的价值和贡献度、内外部满意度,提高IDC抗风险能力。

2.2.1 可用性管理

(1)集群方案制定与执行:充分考虑应用的架构及性能要求,制定集群方案,如Oracle RAC等,这对于系统的性能不仅有很大提高,对于单点故障也有很好的抗风险能力。

(2)容灾方案制定与执行:根据数据、系统的重要性,信息部门应建设容灾方案,如主、副备份,异地容灾等,保证系统最大化地利用和数据级别的快速恢复。

(3)应急预案制定与执行:针对各种可能出现的系统风险,应及时整改并落实建立紧急故障方案。并确保在临界状态下,可按应急预案执行。

2.2.2 可靠性管理

(1)存储数据管理:信息部门需要对存储数据进行的管理和优化工作,明确资源使用情况,定期进行清理和优化工作,消除管理盲区。

(2)系统与数据备份管理:各应用系统需要结合业务特点和技术手段,有针对性地制定备份策略和管理方案,并定期进行恢复测试,保证备份的有效性。

(3)系统日志管理:日志对于排查问题和管理分析至为关键,信息部门需要结合业务运行涉及的管理要求及程序自身的情况,加强维护并动态调整。

(4)数据恢复与还原:针对人为数据删除、应用机制删除、硬件损坏导致无法读取等,要充分考虑借助专业数据公司采用专业技术手段进行恢复,切忌盲目尝试以致造成更大的灾难。

2.2.3 可持续性管理

(1)数据集成与实施管理:信息部门须结合学校管理特点及业务,明确校内数据的U/C关系,制定好ETL策略并通过专业工具进行实施,以实现数据的流转。

(2)数据运行检查与审计管理:信息部门应定期审计数据的ETL过程,及时发现问题,并在关键业务点根据业务需要检查,保证流程数据的权威。

(3)人工数据处理与核对:对于源数据、结果数据的处理,结合信息标准及业务需要,依然存在手工处理和整理的需要,这也是信息部门要关注的工作。

2.3 运维改进

高校信息部门必须将IT人员、IT资源和IT技术有机整合,建立良性运行的业务服务管理体系,才能提高用户投资回报、发挥应用价值。在这里需要注意以多种方式、手段等提供给用户多元、立体、交叉的运行服务。

2.3.1 业务保障

(1)集成系统接入:通过制定学校标准及接入规范,信息部门应尽可能多地将业务系统接入到公共EAI平台,增强业务管理的吞吐能力。

(2)需求变更、增补与二次开发:对于因业务和流程等原因导致的变更或业务增补,信息部门要积极响应业务部门以满足业务发展需要。

(3)业务专项保障:根据业务特征,信息部门应指导、协助业务部门开展专项保障服务如新生迎新服务工作。信息部门应开展包括业务开展前的数据检查、流程确认、性能检测、运行保障、管理培训、业务总结及改进建议等。

2.3.2 安全管理

(1)安全规范与制度建设:“三分技术、七分管理”。信息部门须参考相关信息安全规范,并尽最大可能实施和完善,建立起安全管理制度与规范。

(2)系统与网络安全管理:制度和规范建设的前提下,针对学校网络管理、数据中心管理分开的一般现状,需要分头开展技术实施。相关的安全实施须定期输出检查和建议报告,以供审视和改进。

2.3.3 知识管理

(1)知识库与档案管理:信息部门应从各种管理的视角来管理好项目知识库与服务档案,这对于总结服务工作,提升服务水平,改进服务相关环节起着关键作用。

(2)资产与文档管理:对于IT资产,信息部门可参考I-TIL体系对于CMDB的定义,建设起自身的配置库,这是IT服务工作开展的基础和重要依据。

(3)项目管理与总结:项目管理不应视为乙方的专利,信息部门对于相关的项目可以借助乙方的力量以项目管理的理念和方式来推动进展,提高信息化管理和服务水平。

3 结语

长期从事数字化校园的建设和运维工作,在近50家高校用户运维服务基础上总结提炼了运维服务建设内容。相信这项工作是高校信息主管和管理员在探索和研究的重要课题。

参考文献

[1]IT运维服务管理体系.广东省广业信息产业集团有限公司,2011.

[2]陈宏峰,张亮,黄新峰,黄丸.翰纬ITIL V3白皮书.上海,2007.

高校IT运维外包的风险管理 第11篇

关键词:高校信息化;IT运维外包;风险管理

中图分类号:TP393文献标志码:A 文章编号:1673-8454(2014)07-0014-03

一、高校信息化建设和IT运维现状

近年来,随着信息技术的飞速发展和日益普及,信息化浪潮给教育带来了革命性影响,推动着教育领域不断创新发展。2010年,我国颁布的《国家中长期教育改革和发展规划纲要(2010-2020年)》提出推动信息技术与高等教育深度融合,创新人才培养模式。高校信息化部门也在为学生和教师提供更高效率的各类信息化服务平台和安全稳定的网络接入环境而努力创新,深刻影响了传统的教学科研和学校的综合管理模式。同时,国家对教育信息化的重视程度和投入在逐年增加,校园信息化建设也得到了高校的普遍重视和重点投入。

我国高校信息化建设经历了二十多年的历史,在网络基础设施硬件建设方面同国外高校拉近了距离,很多学校都达到了同等甚至更高水平。虽然硬件条件上去了,但是很多高校信息化应用水平仍不理想,在信息化服务能力和IT运维管理上差异较大,普遍存在着重硬件轻软件,重建设轻维护,重建设轻服务等现象。部分实力雄厚的理工科学校和综合性大学通过自身的力量可以完成基础的信息化建设和IT运维工作,但是对于大量的普通高等院校,由于受到技术、经费以及人员的限制,完全利用自身的力量来建设和运维比较困难,无法满足广大师生的实际需求。

二、IT运维外包的思路和安全风险

信息技术日新月异,如何管理复杂的、高技术含量的IT基础设施,应对灵活多变的IT服务需求,为学校广大师生提供良好的IT服务支持?如何降低运维成本的同时提高管理水平和效率,并保证服务的质量,提升师生对IT服务的满意度?如何提高运维的灵活性和响应速度,迎接信息化带来的各类挑战,提高学校的核心竞争力?这些问题是所有高校所面临的共同难题,困扰着各校的信息化管理部门,而引入IT运维外包服务正是一种经实践证明比较好的解决思路。通过将IT运维服务外包,高校可以把更多精力投入到教学和科研中去。并且以较低成本提供专业化的IT服务。

目前大部分高校的信息化人员编制十分有限,并且对新进人员的学历要求很高,而从事一般的IT工作并不需要非常高的学历。受待遇和未来发展因素影响,高校信息化部门很难长期留住高水平的IT人才。通过外包服务,由公司选派有相应能力的人员长期协助学校从事相应工作,学校不用担心其待遇及去留等问题,保持了IT运维工作人员的相对稳定。

上海交通大学作为一所“综合性、研究型、国际化”的全国重点大学,校内信息化部门以建设数字大学为目标,为校内五万多师生员工提供各类专业的IT服务。在近十几年的信息化建设和日常网络及应用信息系统运维过程中,大量使用了外包服务,在人员、资金、制度上都进行了相应保障,通过全面的发现及确认外包风险,进行分析、评估,对可能引发的安全风险进行了一系列有益的深入探索和实践,从而有效地控制风险。

三、学生团队参与用户服务外包的风险控制

用户服务管理是IT运维的重要组成部分,上海交通大学从2000年开始,在学生宿舍网的管理过程中,引入了学生团队来为学生宿舍区三万多用户提供接入用户网络服务。学校有关部门提供指导,建立一个以学生自我管理、自我服务为主体的学生网络管理体系,发挥学生网管的作用,调动其积极性来参与网络维护工作,为学生打造一个良好的实践与学习环境。学生网管从作为学生的实际需求出发,帮助信息化部门提高了网络故障的应急响应和处理能力, 做了许多有意义的日常用户服务工作,但学生们毕竟缺少实践经验,平时日常学习和科研活动也占用了很多时间。兼职的网络维护工作如何来提高用户满意度?服务质量和服务能力如何控制?这都需要加强管理和组织学习培训,通过完善的制度建设来降低运维工作中的风险。

面对繁杂的学生寝室楼网络维护工作,建立了一套完善的体系来解决学生们平时遇到的各种网络问题。从宿舍楼内学生网管的工作,到学生网管部办公室客服咨询的解答,再到技术报修组的报修受理以及上门服务,这其中的每一个环节都有严格而具体的要求来规范他们的服务,确保服务质量让学生们满意。当然,维护庞大的校园网络单靠人力是远远不够的,因此学生网管自行开发了一套综合的内部技术支持系统。有了它,学生网管员们不仅可以方便地办理各种基础网络业务,还可以实时查看各个终端用户的网络运行状态,以及交换机端口信息等,及时发现问题并针对性处理。

平时宿舍楼内琐碎的网络问题处理是由楼内的学生网管来完成的,每一位网管员都被要求做到尽全力满足用户正常网络接入需要,热情耐心解答用户的任何疑问,在技术层面上指导用户完成一些基本操作。每位学生网管在闲暇之余都被要求多了解网络技术知识,参加内部培训,掌握常见问题的处理方法,在技术上要让用户信得过。

技术报修组专门负责解决楼内网管处理不了的问题,由网管员中的技术骨干组成。他们接受过专门的技能培训,配置专业的网络维修工具,在办公室值班人员所给予的远程配合下,几乎可以解决大部分学生所碰到的网络问题,如果还不能解决则协调学校网络运维部门进一步处理。同时也要求学生网管在解决问题后把全过程书面化,为以后别人的工作处理提供经验积累。在学生团队中的技术骨干由于长期和学校信息化部门沟通,其能力会得到认可,在毕业后也可以择优直接进入高校的IT运维队伍,更快的进入工作角色。

四、信息系统运维外包的风险管理

高校大量的信息系统都来自于直接采购或者由外包厂商定制化开发完成,完全由自己主导开发的大规模系统已经越来越少。常见的信息系统包括人事系统、科研系统、财务系统、学工系统、教务系统、档案系统、校园一卡通系统、公共数据平台等,不少高校还将校内各院系部门网站交由外包公司设计制作和维护。在这些信息系统的实施完成之后,日常运行过程中不可避免的会出现各种问题,高校IT运维部门可以解决部分维护工作,但是很多专业化程度较高的系统维护工作还是不可避免的要依赖外包协助完成。

虽然很多针对高校 IT 市场的外包服务商在信息系统外包过程中获得了成功,并积累了丰富的高校行业经验,但也暴露出不少的安全风险。不同的外包公司之间技术实力和管理水平参差不齐,厂商技术支持人员稳定性不高是普遍遇到的问题,这就要求高校需慎重选择合作方,签订全面详细的合同进一步加以约束,要求通过严格的岗位培训和业务培训,提高外包技术人员的能力。关键项目实施和后期维护期间,要求外包公司核心技术人员常驻学校,保证项目按要求顺利完工,并稳定运行。前期项目开发和后期运维中遇到的问题,需要提交给研发解决的,要有顺畅的正式渠道提交与反馈,限时解决或改进。在每项子系统投入运行前,完成对使用该系统的校内用户培训工作;建立完整的客户培训体系,为高校提供相关的技术培训和业务培训,并提供相应的培训技术资料。

由于很多外包公司开发的各类信息系统广泛应用在多所高校,一旦某所高校的系统被发现有严重的安全漏洞,那么会迅速波及到其他高校,引发严重的安全事件。在教务系统、学工系统等方面,这类安全事件屡见不鲜,给很多学校都造成了较大损失。在信息系统维护外包过程中,由于项目需要,服务商的技术人员可以轻易地获取学校的各类师生个人信息、财务信息、科研信息等,这些敏感信息如果发生泄漏也会给高校带来重大损失。

高校自身要建立完整且独立的信息安全保障体系,在整个IT运维过程中保护学校的重要信息资产。考虑到大部分高校都缺乏专业信息安全运维人员,使用专业安全公司提供的安全服务也成为必然的选择。同时利用高校自身的信息安全科研优势以及和国内外安全研究机构的密切联系,及时获取最新安全资讯,对外包引发的安全风险实时监控,并快速响应。

五、IT运维监控外包的风险

IT运维监控外包在很多高校广泛使用,但也由此带来了一系列安全风险。外包公司为了追求利润最大化,势必考虑降低成本,这样就给外派到学校工作的人员业务素质和稳定性带来了巨大冲击。频繁变动且能力不足的外包人员给高校IT运维必然带来了可预见的安全运营风险,和高校的固有核心利益产生了冲突。对此高校要进一步完善和外包公司的合同细节,明确保障服务质量和要求服务人员的相对稳定性,并签订专门的SLA(Service Level Agreements)服务水平协议。同时高校自身也要不断提升专业IT运维能力,即便采用了外包,也要建立管理和技术并重的内部团队,自己的人员要具备系统的IT运维管理能力,在程序设计开发、应用信息系统维护、数据库和服务器管理、网络管理和安全运维方面都要培养自身的力量,不断学习新技术,培养创新能力,对外包人员进行有效的监督和管理,仔细倾听来自教师学生的第一线业务需求,不能被外包公司所左右,从而降低安全运维风险。

六、IT运维监控平台外包开发的风险管理

IT运维监控平台对任何一所高校网络管理人员来说都是必不可少的。我们没有采取商业的管理监控解决方案,主要是考虑到当网络和应用发展到一定程度之后,其规模和复杂性决定了很难找到完全符合自身需求的方案。我们最终选择了在开源的Zabbix监控系统基础上,采取外包给专业软件公司的模式进行了大量的定制化开发来满足实际运维需求。通过分布部署Agent采集点主动获取各类监控数据,涵盖了学校数据中心使用的各类操作系统和虚拟化环境,也可以支持各大厂商的网络交换路由设备管理,满足了大规模网络和服务器监控需求。但是这条外包之路也同时存在着种种风险,合作方的选择不当可能会导致项目的无法顺利推进;软件流程设计管理不当也会引发开发周期变长,拖延系统的发布上线时间;大量不同设备的定制化开发需要投入更多资源,项目的成本控制也会直接影响合作方的开发人员投入力量;软件平台的漏洞会直接影响基础IT运维体系的整体安全性;开发人员的流动性也给整个外包开发的质量控制带来了不确定因素;后期维护服务跟不上也会影响IT运维工作的长期可持续性。

关注到这些安全风险,我们有针对性地采取了一系列措施。选择开源监控软件作为系统底层平台已经适度降低了开发风险,慎重的选择具有资质和经验的合作方来保证项目质量。全过程参与功能需求分析和流程设计来控制整个开发周期的进度,进度过慢时要求合作方增加人力,进度过快时要求合作方保障代码质量。和外包方要建立顺畅的沟通渠道,通过周报、月报和定期沟通交流,掌握对方工作进展,监督管理实际开发进度是否和预期一致,投入是否充分,代码质量是否合格。通过要求规范全过程的技术开发文档,保证了即使发生开发人员变更也可以快速完成新老交接。要求系统留有灵活的开放接口以提供良好的伸缩性和可扩展性,也可以在一定程度上规避兼容性风险。在开发过程中和正式交付时都引入第三方专业安全人员进行安全评估和渗透测试,确保IT运维监控系统自身的安全等级达到一定级别。通过详细的开发合同对项目周期和合作双方人员力量投入和项目进展时间节点进行了严格的约定,并事先就开发完成后的后期维护服务达成一致,保持长久合作关系。

七、结束语

信息安全技术一直在发展,攻防对抗在持续升级,各类安全风险和挑战始终存在,安全IT运维必然是一个长期动态的过程。作为有特长的信息网络安全科研机构和同时给数万师生提供IT专业服务的部门,高校信息化团队可以把实际安全经验和运维外包风险管理工作相结合,加强配套安全监管,从而走出一条具有自己特色的安全IT运维外包之路。

参考文献:

[1]赵灿,杜炤,杜鹃.高校信息化建设项目外包采购管理的探讨[J].中国教育信息化(高教职教),2011(5).

[2]蒋东兴,宓泳,郭清顺.高校信息化发展现状与政策建议[J].中国教育信息化(高教职教),2009(8).

[3]何秀全.高校信息化中的IT外包及其风险管理研究[D].上海外国语大学 2012年硕士学位论文.

[4]王左利.探讨学生网管模式[J].中国教育网络,2009(3).

[5]何秀全,韩耀军,罗圣,梅艳.高校信息化建设中的IT外包应用分析[J].现代教育技术,2011(5).

[6]张四海,张万光,高校IT运维服务面临的挑战与机遇[Z].中国高等教育学会教育信息化分会第九次学术年会论文集.

主动式IT运维服务模式应用 第12篇

随着信息化建设的持续与深入, 企事业单位的信息应用系统越来越多, IT运维工作越来越繁杂。目前大多数IT运维工作仍处于被动的响应状态, 不但使IT运维人员终日忙碌, 也使IT运维质量难以提高。原因有以下3个方面[1]。

1) 运维规划与业务规划脱节。目前大多数企业的IT运维未开展相应的规划, 或IT运维规划仅考虑保障信息系统运行的稳定性, 未考虑业务发展需求的变化, 存在业务规划与运维规划脱节现象。例如某单位规划电力营销收费, 今年收费预算比去年增长30%, 用户数量比去年增长20%。IT部门却不了解营销部门的规划, 到年底发现收费系统的访问负荷突增, 存储空间不够, 系统运行缓慢, 因此紧急处理该突发情况。

2) 运维支撑工具自动化程度不高。目前运维支撑平台自动化程度不高, 未能将所有的运维对象纳入到监控范围, 对海量的告警信息未能做到自动分拣和过滤, 部分运维工作仍处于手工作业模式;同时运维支撑平台缺乏智能化, 未能实现智能化扩容、系统智能化自愈等功能。因此在没有高效的运维支撑工具支持下, 故障事件很难做到主动、快速处理。

3) 运维流程不规范、人员主动意识较弱。目前多数大中型企业IT运维流程已基本完善, 但大部分中小型企业未能梳理规范的运维流程, 导致运维工作混乱无序。同时企业缺乏相应的激励措施, 导致运维人员主动运维意识不高。

1 主动式运维

根据信息技术服务标准 (ITSS) 的定义:运维通常是指采用信息技术手段及方法, 依据需求方提出的服务级别要求, 对其所应用的信息系统、系统运行环境、业务分析等提供的综合服务[2]。

主动式运维是一种现代管理理念在IT运维管理中的具体运用, 是指对一切可能发生故障或“突发”情况提前处理的一种运维模式[3,4]。主动式IT运维可从技术和管理2方面实现。技术方面可通过建设自动化、智能化的运维平台, 处理大量重复的运维工作;管理方面通过制定合理的运维规划、有效的激励措施、完善的运维流程, 提升主动式运维管理水平。

与传统的运维模式相比, 主动式运维改变了传统运维模式的人海战术、经验运维、“救火式”运维等特征。还减少了对运维人员的依赖, 节省运维成本, 提高运维工作效率, 提升系统智能化水平, 为运维知识积累奠定基础。

2 主动式运维实施

2.1 建设运维支撑平台

通过运维支撑平台的建设, 提高系统故障的发现、处理主动性, 逐步实现运维自动化和智能化。建设自动化运维支撑平台, 其目标是要实现监控自动化、配置变更检测自动化、维护事件提醒自动化、系统健康检测自动化、维护报告生成自动化。运维支撑平台架构如图1所示。

2.1.1 数据采集层

使用基础的网络协议如简单网络管理协议 (Simple Network Management Protocol, SNMP) 、Internet控制报文协议 (Internet Control Message Protocol, ICMP) 、安全壳协议 (Secure Shell, SSH) 、HTTP等来采集主机、安全、信息系统、网络、终端、中间件、存储、动环、数据库等系统的数据信息。建立信息通信统一采集控制管理中心, 基于统一的标准实现各类采集控制适配器, 以此来支撑对信息通信基础资源的采集和控制, 需有良好的扩展性和灵活性, 满足未来环境下新增的基础资源监控需求。

2.1.2 技术平台层

提供各类接口适配服务, 如流程引擎服务、报表管理服务、数据总线服务等;提供平台配置项服务, 如事件触发流程、事件跟踪流程、事件优先级流程。还提供各类采集数据关联性支撑数据服务。

2.1.3 业务应用层

基于统一的业务框架实现面向各类角色对象的业务应用服务, 充分考虑业务功能的扩展性和灵活性, 以实现业务需求变更时的快速配置化调整[5]。

1) 监控自动化。是指对重要的IT设备实施主动式监控, 如路由器、交换机、防火墙等。

2) 配置变更检测自动化。是指IT设备配置参数一旦发生变化, 将触发变更流程转给相关技术人员进行确认, 通过自动检测协助IT运维人员发现和维护配置。

3) 维护事件提醒自动化。是指通过对IT设备和应用活动的实时监控, 当发生异常事件时系统自动启动报警和响应机制, 第一时间通知相关责任人。

4) 系统健康检测自动化。是指定期自动地对IT设备硬件和应用系统进行健康巡检, 配合IT运维团队实施对系统的健康检查和监控。

5) 维护报告生成自动化。是指定期自动地对系统做日志的收集分析, 记录系统运行状况, 并通过阶段性的监控、分析和总结, 定时提供IT运维的可用性、性能、系统资源利用状况分析报告。

2.2 匹配云服务架构

1) 基础架构即服务 (Infrastructure as a Service, Iaa S) 通过私有云提供数据中心、基础架构硬件和软件资源。Iaa S可以提供服务器、操作系统、磁盘存储、数据库和 (或) 信息资源。

2) 平台即服务 (Platform as a Service, Paa S) 提供基础架构, 软件开发者可以在这个基础架构之上建设新的应用或者扩展已有的应用。

3) 软件即服务 (Software as a Service, Saa S) 是最为成熟、也是得到最广泛应用的一种云计算。可以将它理解为一种软件分布模式, 在这种模式下, 应用软件安装在私有云里, 用户可以通过某个网络来使用这些软件。

2.3 建立主动式运维管理

1) 制定信息运维规划。企业的信息化运维规划需要根据企业发展的不同阶段, 制定相应的信息运维工作重点。在支撑业务阶段, 目标重点是保障各类业务应用、中间件、数据库、主机、存储及信息机房的稳定运行;在整合业务阶段, 目标重点是结合企业业务规划, 为业务规划提供信息化保障手段;在驱动业务阶段, 目标重点是基于新技术的出现, 帮助公司业务寻找新机会的可行性。因此, 企业的信息运维规划需要结合企业的业务规划进行, 确保信息运维规划适应企业的业务规划发展需要, 实现企业信息运维规划与企业业务规划的协同发展。

2) 提升人员主动性。提升人员主动性主要是解决运维人员工作态度问题, 分为主观和客观2个方面。主观上的问题需要沟通交流、学习培训和教育引导, 也需要构建和谐工作氛围、协作的工作关系;客观上的问题需要制度建设, 包括管理流程、岗位职责、技能等级、评价考核、激励和文化等。

3) 制定流程规范。随着IT运维管理工作的复杂化和难度的大大增加, 企业现有的制度、流程规范已不能适应IT运维工作快速发展的需要。企业可结合IT基础架构库ITIL或ISO20000标准, 梳理公司内部的制度和流程规范, 并结合主动式运维模式, 完善企业内部管理制度, 优化IT运维管理流程, 形成适合企业自身发展需要的主动式运维管理流程规范。

2.4 主动式运维演进

2.4.1 从传统手工作业到自动化运维转变

传统的IT运维管理是救火式的管理。通常是用户先于IT人员发现问题, 然后再找到IT部门要求解决问题。不采用任何管理软件, 仅仅靠运维人员定期轮询, 或者执行某项命令来检查设备, 在系统规模较小时, 只要参与运维的技术人员足够负责, 人工运维方式可以满足日常运维需要。但是, 当应用系统达到一定规模后, 这种运维方式的弊端就会暴露出来。轮询一遍要花费几个小时, 轮询周期越长代表需要更长时间才能发现故障。这种被动式管理IT导致有了问题不能及时发现, 运维效率低下。

IT运维自动化是一组将静态的服务流程转化为根据IT服务需求动态来主动弹性响应的策略, 目的是提升IT运维的质量, 降低运维成本。自动化是主动式IT运维最高层面的重要属性之一。从传统手工作业到自动化运维转变需要从以下几步着手。

1) 建立自动化运维管理平台。IT运维主动化管理建设的第一步是建立IT运维的自动化监控和管理平台。通过监控工具实现对用户操作规范的约束和对IT资源进行实时监控, 通过自动监控管理平台实现故障或问题综合处理和集中管理。例如, 在自定义周期内自动触发完成对IT运维系统的监控、配置变更检测、维护事件提醒、系统健康检测、维护报告生成等工作。

2) 梳理故障事件自动触发流程、跟踪流程和设立关键流程。所有IT设备在遇到问题时通过告警分拣和过滤机制, 实现自动报警。之后IT运维人员按照相关流程进行事件处理。因此, 企业需要事先建立事件触发流程, 同时要建立故障和事件处理跟踪流程, 利用表格工具等建立每种事件的规范化处理和跟踪指南。除此之外, 还需设立IT运维关键流程, 引入优先处理原则。例行事件按常规处理, 特别事件要按优先级次序处理。

3) 固化流程。通过对日常运维工作流程的梳理、优化, 形成统一、固化的流程, 把这些流程通过技术手段再固化到自动化运维管理平台中, 用于今后日常运维工作中。

2.4.2 从自动化运维到智能化运维提升

在自动化运维模式下, 运维工作能做到告警自动分拣和过滤、事件流程触发、事件流程跟踪、关键事件优先处理。但随着运维工作的不断深入, 对自动化的要求越来越高。例如, 信息系统因网络中病毒攻击而出现宕机的可能, 如何在系统宕机前做到病毒隔离、自动下发病毒查杀升级包、自动对局域网内所有服务器病毒库升级, 同时实现系统自愈是智能化运维亟待解决的问题。

其他如配置阈值智能化自适应调整、系统版本智能化发布和升级、系统智能扩容等都是今后主动式运维所面临的新课题, 需要不断的深入研究。从自动化运维到智能化运维有很长的路要走, 但从自动化到智能化是主动式运维未来发展的趋势。

3 主动式运维案例

从传统的运维方式发展为主动式运维, 是一项长期的历程。以国网某省电力公司从最初的传统式人工作业运维到如今的已基本实现主动式运维的转变为例来进行说明。

1) 管理方面。2010年起, 运维服务单位配合客户制定运维规划, 并逐年滚动修编规划。规划包括网络架构、基础环境架构 (如机房市电冗余规划等) 、资源规划 (如存储容量规划等) 、人力资源规划 (如队伍建设、岗位设置等) 等方面。2012年颁布了团队激励措施, 通过对工作规范性、人员能力、协作能力、系统稳定性指标等方面, 每季度开展评价工作, 并进行相应的奖惩。

2) 技术方面。自2011年起, 运维服务单位开展主动式运维技术支撑工具研发。最初的运维工具仅包括主机 (PC服务器) 、数据库 (Oracle) 等对象的运行状态监控, 从已有的BETA网管系统中采集部分网络运行数据, 进行集中监控。通过不断完善, 至2013年底, 运维工具的功能包括对主机、操作系统、数据库、中间件、存储等运维对象运行状态数据的采集及监控;状态告警功能;实现部分的关联分析功能 (如可初步定位故障原因等) 。自2014年开始, 运维服务单位将开展海量告警信息过滤 (告警分级机制) 、阈值自适应调整、部分场景自动化发布、部分场景系统自愈等运维工具智能化功能研究, 逐步将运维自动化向运维智能化转变。

4 结语

本文分析了在当前信息系统大建设背景下企业开展主动式IT运维服务的必要性, 给出了主动式运维定义、架构设计、应用实现以及实际案例。实际应用表明, 主动IT运维服务将繁琐的企业信息运维工作变成可控的流程业务, 有效保障运维工作操作简便、管控有序、效果明显, 有较好的应用价值。主动式IT运维目前在信息系统运维工作中尚处于实践应用阶段, 随着信息系统的多样性发展, 以及云技术、大数据等新技术应用, 必将在各种应用系统中得到应用, 实现信息系统全面的自动化运维。

参考文献

[1]左天祖.中国IT服务管理指南[M].北京:北京大学出版社, 2004.

[2]工业和信息化部软件服务业司.中国ITSS信息技术服务标准白皮书第一版[S].2010.

[3]北塔知识库.实现IT运维管理主动服务模式的方案[EB/OL].[2014–7–20].www.ciotimes.com.

[4]ZDnet.应对四大挑战:实现云环境下的主动运维[J].网络与信息, 2011, 25 (10) :49–50.

[5]百度百科.IT运维自动化[EB/OL].[2014–7–20].http://baike.baidu.com/view/8947561.htm?fr=aladdin.

IT运维服务管理

IT运维服务管理(精选12篇)IT运维服务管理 第1篇第一步:构建业务架构明确业务系统要管理好业务系统, IT部门首先必须懂得业务系统是如何...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部