电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

系统运维管理规范

来源:文库作者:开心麻花2025-09-231

系统运维管理规范(精选6篇)

系统运维管理规范 第1篇

IT 基础设施运维管理规范 文件编号:运维-002-V1.0

目录

运维管理规范--------------4 1.目的------------------------4 2.适用范围------------------4 3.规范性引用及参考-----4 4.本文术语,定义和缩略语---------------------------5 5.基本要求------------------6

5.1运维管理原则-----6 5.2制度和流程管理6 5.5供应商管理--------7 5.6督促检查-----------7 6.运行维护------------------8

6.1日常操作及监控分析--------------------------8 6.2 数据与介质管理-8 6.3机房管理-----------9 6.4 网络管理----------9 6.5 弱电管理---------10 6.6桌面维护----------10 6.7服务器及系统变更----------------------------11

6.8 配置管理---------12 6.9 事件与问题管理 12 7.应急管理-----------------12

7.1应急准备----------12 7.2应急处置----------13

运维管理规范

1.目的

为规范公司运维工作,使相关工作具有持续改善及相互协作性,同时加强计算机设备的管理及维护,确保维修工作的及时性,降低计算机设备的报修率,实现业务与技术的融合,将业务部门与IT 部门紧密结合在一起,根据公司管理要求及计算机应用的需要,由运维部制定。

2.适用范围

本规范规定了运维管理工作的要求。

本规范适用于维信理财集团(中国)总部,包括全国各分部及门店。

3.规范性引用及参考

◆ IT 服务管理国际标准ISO/IEC 20000 ◆ 企业获得ISO/IEC 20000认证的权威指南 ◆ 全球著名IT 服务管理书库(ITSM Library)◆ IT 服务质量管理原则

◆ 理解ISO/IEC 20000在IT 服务中的地位 ◆ ISO/IEC 20000规范和实践准则 ◆ IT 服务管理国际标准ISO/IEC 20000 ◆ GB/T 20269—2006 信息安全技术 信息系统安全管理要求

◆ ISO 31000:2009 风险管理 原则和指南(Risk management--Principles and guidelines)

◆ JR-T 0060—2010 金融信息系统安全等级保护基本要求 ◆ JR/T 0074-2012 金融IT 服务管理基本规范 ◆ 中国金融标准化报告(2011)

4.本文术语,定义和缩略语

1、IT: Information Technology 信息技术

2、DNS: Domain Name Service 域名服务

3、DHCP: Dynamic Host Configuration Protocol 动态主机配置协议

4、VPN: Virtual Private Network 虚拟专用网

5、OA: Office Automation 办公自动化系统

6、ISO: International Organization for Standardization 国际标准化组织 编订日期:30.7.2014 批准日期: 生效日期:

7、故障: IT设备或系统丧失规定的功能,导致服务中断或降质,或对正常运行造成潜在威胁。

8、异常: IT设备或系统的状态发生超出预期的变化或性能指标参数超出正常范围,有可能引发或已经引发故障,需要引起运维人员关注或处理。

9、资料: IT设备或系统的运行记录,包括IT 设备或系统的配置、故障历史记录、软硬件扩容或调整记录、权限变更申请记录等。

10、运行维护:本规范中的运行维护包括IT 基础设施维护、IT 应用系统运维维护、安全管理、网络接入、内容信息以及综合管理等。

5.基本要求

5.1运维管理原则

公司按集中与分散相结合的原则,设立机房、各部门配备电脑。计算机系统本着“总体规划、分步建设”的方式实施建立。

计算机系统建设应综合考虑成本、费用、效率、效果、先进性及适用性,选择最优技术、经济方案。

5.2制度和流程管理

运维管理制度应包括但不限于机房管理、网络与系统管理、数据和介质管理、配置管理、安全管理、监控管理、文档管理、设备和软件管理、供应商管理等制度。

运维操作流程应包括但不限于日常操作、事件处理、问题处理、系统变更、应急处置等流程。

5.3 文档管理

对运维过程中涉及的各类文档进行管理,可按照制度文档、技术文档、合同文档、审批记录、日志记录等进行分类,并妥善保存。5.3.2 对文档的版本应当进行控制。

文档在使用时应能读取、使用较新版本,防止作废文件的逾期使用。

5.4设备和软件管理

建立计算机相关设备和软件管理制度,对设备和软件的使用、安装、维修(升级)等进行规范。明确设备和软件管理责任人。对设备进行标识,标识应放在设备明显位置。

规定设备和软件的使用年限,定期进行盘点,并对设备状态进行评估和更新。

对外送设备的维修进行严格管理,防止数据泄露。

对拟下线和拟报废设备的存储介质中的全部信息进行清除或销毁。对正式下线设备和软件交指定部门统一管理、保存或处置,并保留相应记录。设备和软件报废应符合公司现行资产管理规定。

5.5供应商管理

对供应商支持运维服务的相关活动进行统一管理。

在与供应商签订的合同中明确其应承担的责任、义务,并约定服务要求和范围等内容。

应定期收集、更新供应商信息,组织对供应商的服务质量、履约情况、人员工作情况等内容进行评价,并跟踪和记录供应商改进情况。加强运维外包服务管理,主要包括:

a)明确外包公司应当承担的责任及追究方式;

b)明确界定外包人员的工作职责、活动范围、操作权限; c)对外包人员工作情况进行监督和检查,并留存相应记录; d)对驻场外包人员的入场和离场进行管理; e)定期评估外包的服务质量; f)制定外包服务意外终止的应急措施。

5.6督促检查

定期检查审计,对运维制度的执行情况和运维工作开展情况定期进行检查和审计,以督促运维工作持续改进。

指定人员负责对日常操作执行情况进行检查,确保运维管理制度和操作流程的有效执行。对检查和审计结果采取纠正、预防措施。

6.运行维护

6.1日常操作及监控分析

未经许可,任何人不得随便使用电脑及相关设备。不得更换电脑硬件和软件,拒绝使用来历不明的软件和移动设备。

电脑发生故障时,使用者作简易处理仍不能排除的,应立即报告IT,非专业管理人员不得擅自拆开机箱或调换设备配件。

计算机及其相关设备的报废需经过IT 部门或专职人员鉴定,确认不符合使用要求后方可申请报废。

运维应采取各种监控措施,配备视频、语音、系统监控和报警工具,对影响信息系统正常运行的关键对象,包括机房环境、网络、通信线路、主机、存储、数据库、核心交易业务相关的应用系统、安全设备等进行监控。

主要监控指标具体如下:

a)机房:电力状态、空调运行状态、消防设施状态、温湿度、漏水、人员及设备进出等;

b)网络与通信:设备运行状态、中央处理器使用率、通信连接状态、网络流量、核心节点间网络

延时、丢包率等;

c)主机:设备运行状态、中央处理器使用率、内存利用率、磁盘空间利用率、通信端口状态等;

d)存储:设备运行状态、数据交换延时、存储电池状态等;

e)安全设备:设备运行状态、中央处理器使用率、内存利用率、端口状态、数据流量、并发连接数、安全事件记录情况等;

6.2 数据与介质管理

配合数据应用部,对核心业务数据进行周备份,并每季度进行恢复性测试。

对设备和人员出入进行管理。进入机房应限制和监控其活动范围,并有专人陪同;未经批准不得接入生产环境。

6.3机房管理

对机房环境、供电、空调、消防、安防等基础设施的运行维护、设备和人员出入、机房工作人员等进行规范管理。

应指定机房管理负责人。确保机房环境整洁和安全,包括:

a)应定期检查防水、防雷、防火、防潮、防尘、防鼠、防静电等措施的有效性;

b)应保持机房环境卫生,设备摆放合理,归类; c)不得随意出入机房。

d)未经审批不得接入其它用电设备。

6.4 网络管理

确保网络、系统的正常运行。网络管理应包括: a)绘制网络拓扑图,并保持更新;

b)应保持网络设备的可用性,及时维修、更换故障设备; c)应负责网络系统的参数配置、调优; d)应定期对系统容量进行检查和评估;

e)应定期检查网络设备的用户、口令及权限设置的正确性;

f)应定期对整个网络连接进行检查,确保所有交换机端口处于受控状态; g)应对网络信息点进行管理,编制信息点使用表,并及时维护和更新,确保与实际情况一致。计

算机网络跳线应整齐干净,跳线标识清晰;

h)应制定网络访问控制策略,应合理设置网络隔离设施上的访问控制列表,关闭与业务无关的端口;编制文档并保持更新;访问控制策略的变更应履行审批手续。

权限管理应包括如下要求:

a)权限分配应履行审批手续,权限设置后应复核; b)应按照最小安全访问原则分配用户权限; c)应在用户账户变化时,同时变更或撤销其权限; d)应定期检查权限设置的有效性。

6.5 弱电管理

严格按图纸施工,在保证系统功能质量的前提下,提高工艺标准要求,确保施工质量。质量检查制度,现场管理人员将定期进行质量检查并贯穿到整个施工过程中。统运行验收:当设备安装完毕并调试运行无误后,由公司派现场调试人员进行系统联调,并向上级汇报调试结果。运维对弱电设备的综合管理,包括技术资料、档案的收集。同时,每月一次对弱电设备运行状况进行检查,并及时处理汇报问题。

6.6桌面维护

日常数据注意事项:

a.个人文件(Excel、Word、PDF 等)建议员工不要存放在系统盘(通常为C 盘),可以存放在其它盘符。

b.工程师可通过多种方式或途径来告知员工如何进行日常文件的备份,如:口述、邮件、培训等。

c.未经许可,禁止使用U 盘,移动硬盘,手机或其它外设,如:网盘、邮箱等,盗取公司内部文件。

重装系统前注意事项:

a.询问用户有哪些相关数据需要备份,如桌面、我的文档、收藏夹、邮件等。b.用户Email 的备份:如客户端为Outlook 则导出相关OST 或PST 文件;硬件损坏需更换或维修时,运维人员进行测试,明确是否真实异常,不可随意更换。

关于账号、权限、密码

a.必须严格按照公司制定的IT 策略进行管理,不可私自制定规范。b.禁止私自把个人管理员权限借给他人或告知他人。

c.禁止为他人开设规定以外的权限,如:本地管理员、其他部门目录访问权限、上网权限、电话权限等。

d.更改任何类型用户权限时需得到相关审批层级确认才可执行。e.如电脑无特殊应用需求,则一律为“user”普通权限。

f.人员离职时,总部和分部应及时通过OA 确认,删除离职人员的相关账号与信息。

g.妥善保管自己所知的密码。

6.7服务器及系统变更

不得在服务器上使用带有病毒和木马的软件、光盘和可移动存贮设备,使用上述设备前一定要先做好病毒检测;不得利用服务器从事工作以外的事情,无工作需要不得擅自拆卸服务器零部件,严禁更换服务器配套设备。不得擅自删除、移动、更改服务器数据;不得故意破坏服务器系统;不得擅自修改服务器系统时间。

使用空闲主机,对服务器系统补丁进行升级测试,运行平稳后,各服务器升级安装补丁,弥补系统漏洞;为服务器系统做好病毒及木马的实时监测,及时升级病毒库。

管理员对管理员账户与口令严格保密、重要数据库,网站,APP 等服务器由研发配合定期修改密码,以保证系统安全,防止对系统的非法入侵。

任何无关人员不得擅自进入主机房,需要进入的须征得服务器管理人员同意。应注意保护机房内的设备和物品,未经允许的非管理人员不得擅自操作机房内设备。

严禁携带易燃易爆和强磁物品及其它与机房工作无关的物品进入机房,机房内严禁吸咽。除管理员外,任何人不得随意改动服务器内系统及环境配置。

除系统管理员或授权参加系统管理的人员外,任何用户不得以任何方式获取(或企图获取)超级用户权限。

6.8 配置管理

明确配置管理负责人。

建立配置文档库,对服务器、存储、网络、安全设备,操作系统、应用软件、数据库等进行管理。

定期对配置进行备份及文档库归类。

及时检查并定期审计,对发现的不一致情况及时纠正修改。

6.9 事件与问题管理

对运维事件的处理进行规范,对发生的所有事件,根据事件的影响程度和影响范围评估事件处理优先级并及时处理。

对所有事件响应、处理、结束等过程进行跟踪、监督及检查。对问题进行分析、提出解决方案,通过变更管理审批后部署实施。

7.应急管理

7.1应急准备

明确网络、系统等事件的应急指挥决策机制,负责网络与系统事件的预防预警、应急处置、报告和调查处理工作。

网络与系统应急管理应遵循“谁主管谁负责、谁运行谁负责”、“统一指挥、密

切协同;注重预防、减少风险;科学处置、及时报告;以人为本、公平优先”的原则。

应急准备应符合如下要求:

a)系统管理员、网络管理员、安全管理员等关键岗位应熟练掌握应急预案,能有效处置相关事件;

b)在自身力量不足以满足应急要求的情况下,应与相关供应商签署服务保障协议。协议内容应包

括双方联系人、联系方式、服务内容及范围、应急处理方式等。应定期检查和评估协议的执行情况,确保服务保障措施落实到位,确保在应急处置中相关单位能提供及时有效的技术支持;

c)应建立有效的应急通讯联络系统,确保信息畅通;

7.2应急处置

在发生网络与系统事件后,迅速采取应急措施,尽快恢复信息系统正常运行,如有重要情况应及时上报。

暂时无法确定事件原因、责任和结论的,应先给出事件的初步分析判断,并组织力量尽快查找原因,给出解决方法,采取整改措施。

系统运维管理规范 第2篇

概述

伴随着企事业网络规模的不断扩大,企事业服务器的增多,企事业管理的信息化,企事业网络管理也变的越来越重要。一旦网络、服务器、数据库、各种应用出现问题,常常会给企事业造成很大的损失。怎样能7x24小时检测网络系统的运行情况,避免各种故障的发生,改进传统的网络管理方式来适企事业信息化发展的需要?

因此,运维管理系统就有他的必要性。一个完备的运维管理系统能够提供7x24小时检测网络、服务器、数据库、各种应用系统,及时发现将要出现的问题,并通过短信、Email、声音报告给运维管理人员。运维管理人员就可以及时排除故障,避免造成重大损失。

        运维管理系统的功能:

故障发现与警报;

记录日常运维日志信息; 服务器故障统计;

服务器软硬件信息统计; 服务进程管理;

将数据信息存储到数据库,并使用图形方式直观的展示出来; 权限、密码管理; 将数据生成报表。运维管理系统的特点:        邮件和短信实时故障报警;

B/S结构,能够通过web对远程服务器下达指令;

运维管理系统文件综述 第3篇

川北医学院通过这几年的信息化建设, 已经初步形成独有一套的数字化、信息化的IT系统。但目前没有一套完善的IT运维系统对全网的IT资源进行综合管理, 提升运维效率, 提高信息化的服务水平和管理水平。所以, 急需建立一套IT运维管理系统。

2 IT运维管理系统主要内容

运维管理系统不仅是川北医学院IT管理的重点, 而且还是学校信息系统的核心部分。运维管理系统主要用于学校信息管理部门内部平时运营管理, 它涉及的对象可以分成两大部分, IT业务系统以及管理运维系统人员。对其管理的内容可以分为七个详细的子系统。

2.1 对设备进行管理

不仅可以对网络设备以及服务器设备实施监控, 可以对操作系统的运行状况进行全方位监控, 还可以对数据库和中间件等各种应用支持软件进行监控管理, 如邮件系统和DNS以及WEB等的监控和管理。

2.2 对数据、存储和容灾系统的监控管理

可以对业务数据进行统一存储管理以及数据备份和数据恢复。

2.3 业务、目录和内容这两个部分的监控管理

主要监控和管理学校自身核心的业务相关系统运行状况, 对于学校的业务管理, 主要是关注每个业务系统关键成功因素和关键绩效指标这两项。

2.4 目录和内容管理

主要对于学校需要统一发布或者因人来定制的内容管理, 以及对公共相关信息的监控和管理。

2.5 对资源资产的监控和管理

通过对管理学校中各个信息系统的使用资源资产详细情况进行监控和管理。学校中这些资源资产不仅可以是物理存在的, 而且也可以是逻辑相互存在的, 并且能够与学校的财务部门数据进行交互。

2.6 对信息安全进行监控与管理

信息安全管理包含的内容非常多, 目前主要采用的是国际标准ISO17799来监控信息安全管理, 使用的这个标准涵盖了十个控制方面, 有36个控制目标以及127中控制方式, 如学校安全组织方式、物理与环境安全、资产分类与控制等。

2.7 对平时工作管理和监控

这部分内容用于明确以及规范运维管理人员的工作安排和岗位职责与责任, 还可以提供对绩效考核的量化依据。

3 IT运维管理系统功能介绍

3.1 全景拓扑

全景拓扑成功的将用户的业务视图、网络视图、应用视图、虚拟化视图和存储视图融合在一起, 完整展现用户统一的IT架构。全景拓扑可容纳网络设备、主机、应用、虚拟架构及SAN存储架构等资源, 并可以自定义展示监控数据内容及格式。建立IT资源之间的关联关系, 用户通过一张动态展示界面, 实时掌握整体IT环境的运行状态, 了解关键IT资源的繁忙程度。全景拓扑图如图1所示。

3.2 服务器软硬一体化监控

符合国际标准的监控方式。

3.2.1 操作系统级别

兼顾安全与灵活的数据采集方式Agent方式和Agentless方式。操作系统级别监控内容:CPU、内存、硬盘、分区、网络接口及文件等40多个OS指标的监控。

3.2.2 硬件级别

国际硬件监控标准协议IPMI。硬件级别监控内容:CPU、内存、CMOS、核心电压、电源、RDID存储及机箱等40多个硬件指标的监控。

3.3 拓扑图的自动排布

e Net实现并优化先进的拓扑排布算法 (Force-directed layout algorithm) , 可自动识别用户的网络结构和层次, 实现拓扑自动排布。

3.4 拓扑图折线链路

全景拓扑中的链路可以设定折线展示;用鼠标可以对折线进行拖拽、拉伸, 折线和直线可以实现一键式转换。

3.5 虚拟化监控

e Net可监控VMware的Vcenter、Data Center、Cluster及ESXi服务器、虚拟机, 自动计算虚拟化架构, 直观展现虚拟化系统的状态, 以颜色变化展现管理对象的健康状态和性能, 做到虚拟环境中资源运行指标的真实展现。虚拟化监控图如图2所示。

3.6 存储架构

e Net采取符合国际标准SNMP、SMI-S协议对存储的状态、性能进行监控。为企业提供专业的存储设备监控解决方案, 帮助企业有效监控不断多样化的存储资源和存储灾备系统;企业可以实现对光纤通道交换机、存储阵列、磁带库、主机服务器和HBA卡等资源的全面监控[2]。

通过对FC交换机的监控, 自动计算存储架构, 实时了解存储设备与FC交换机之间的关系、服务器与FC交换机之间的关系, 直观展现存储架构中IT资源的性能状态, 完成存储架构的立体化、系统化、可视化管理。存储管理图如图3所示。

3.7 组合告警

e Net在保留原有事件前提下, 将相互之间有关联的事件进行组合, 让组合后的事件产生告警, 大量减少告警次数。

3.8 自定义指标

e Net提供自定义SNMP OID、脚本、SQL方式的扩展监控, 能够产生事件, 触发告警。

3.9 专家知识库

e Net提供了主机、网络设备的专家系统, 对监控指标含义进行专业解释, 对各种指标的异常告警提供故障解决的思路和解释。

3.1 0 巡检报表与综合报表

巡检报表:可设定固定时间点, 获取特定IT资源运行的瞬时性能指标形成报表, 运维管理人员每天直接到自己的邮箱中查看巡检报告。

综合报表:通过一张报表, 可综合展现网络设备、主机、应用等性能信息, 并以日、周、月方式统计展现。免除手工制作运维分析报表。

4 结语

运维管理系统可以提供一个为信息系统统一的IT基础架构, 通过它管理人员可以实时对网络的运行维护状况进行掌握, 还能及时协调网络运行维护的各项工作, 使系统运行维护的工作流程实现端到端的自动化闭环管理[3]。

参考文献

[1]宦铁军.基于ITIL的运维管理系统的设计与实现[J].电子制作, 2013 (4) .

[2]马维士.浅析广电存储系统监控的发展趋势[J].数字化用户, 2013 (1) .

运维管理系统平台作用 第4篇

关键词 :运维 标签 网络 信息

随着社会的网络信息化覆盖面越来越广,通信机房的设备越来越综合化、多样化,越来越多的远端机房的应用,机房的规模随之增大,面对大面积、远端的通信机房、众多的设备、大量的日志,传统的标签、书面记录、视频、网管系统的应用,传统的运维管理模式已经不能满足目前通信的实际需求,必须寻求一种现代化的软件来代替原有传统的运管模式,使得复杂、多样的运维管理能够简单化,从而提高故障处理、资料管理、数据查询、设备监管等工作效率。由此我们进行一些探索和尝试。

主要功能

1、站点导航

为使得长江沿线通信机房均能使用运维管理系统,软件考虑设计了站点导航功能,通过站点导航的图片,可以轻松地导航到长江沿线的各个机房,实时查看到机房内的资料,以及业务管理情况。

2、运维规范

任何工作都有其规章制度,规范、流程对于运维管理来说更为重要,如果期间出现差错,将会带来很大的损失。规范、流程应及时更新,在功能设计时,应该提供可更新、添加功能。其次,规范应能轻松进行查阅,当运维工作人员遇到紧急业务时,可快速查阅。

3、设备管理

通信机房,最重要的莫过于设备资料的管理,随着设备越来越多,通过原先的标签和文档来注明各种资料已经完全不能满足要求,一方面,资源不能很好地共享,经常出现设备资料只有固定的少数几个人掌握;另一方面,由于设备集成高,体积小,端口多且复杂,电路的来龙去脉比较繁杂;再则综合机房、远端机房温度偏高,随着时间的推移,端口标签经常会出现脱落现象,由此也给设备判断带来困难。

鉴于此,设备资料通过信息化管理更为合适,不仅能够解决上述困难,而且给运维工作人员减轻负担。

4、值班信息

值班信息主要功能是对机房日志资料的管理,通过包括值班记录和基础数据,值班记录是对值班信息的实时电子记录,实现用电子台帐来代替传统的文本台帐。利用电子台帐来进行管理运维日志后,可实现日志的数据库管理,可以轻松进行统计和查询,可方便实现月度、季度、年度或者任意时间段信息的统计,同时也提高值班记录的痕迹管理,加强了值班、维护人员的工作责任性和自觉性。

5、故障处理

维修记录主要实现设备维修的记录历史,各个设备有各指示灯对设备其运行状况、端口属性和特性指导作用,工作人员根据设备技术说明书、对其日常维护和故障处理经验,进行相应的记录,同时系统会自动统计该设备的出现故障的处理方式以及出现次数的多少,根据记录,当日后当再次出现故障时,可根据该系统功能模块进行逐一排查、比对,对其常见故障进行优先检测,从而提高故障的处理效率,缩短故障时间,减轻工作人员的负担。

系统展望

运维管理系统实现以上功能投入使用后将会大大提高运维机房的工作效率,但我们感觉到系统的功能要不断更新,不断适应现代化机房的发展需求,结合我们近期工作的情况,还探索要解决以下三个问题:

设备编码问题。目前通信机房的设备五花八门,新产品越来越多,如何对设备进行科学合理的分类,成为运维系统的一个非常重要的问题,面对沿江全线通信机房成千上万的设备,全部用设备名称加以区别显然不可行。必须通过科学的分类和编码手段进行标准编码。

通信机房的图形化管理。为让更多用户理解和熟练应用软件,界面必须友好、简洁。运维管理系统最能让工作人员快速上手的界面应该以图片导航的方式来实现,但图片实现相对较复杂而且不利于今后升级。

公司信息系统运维规范 第5篇

一.日常巡检规范

按照信息系统巡检要求进行,包括巡检的时间节点、巡检频率、巡检规范三个注意事项(1)时间节点:每日上午8:15开始日常巡检工作;

(2)巡检频率:应用系统巡检频率为每日,中间件巡检频率为每两日一次,涉及数据库巡检的由数据库组完成;

(3)巡检规范:使用省公司运维审计平台账号登录,在审计平台中进行巡检工作;对于巡检中发现系统异常的情况,第一时间做记录,并及时汇报运维专责和信息调度中心,进行必要的应急处理。

二.操作规范

(1)日常运维工作严格按照信息系统操作说明文档执行,做到操作有依据、责任分工明确、故障响应迅速。

(2)做好信息系统巡检表的记录工作,严格按照巡检表的时间和内容逐条进行,做到不遗漏、不拖延。

(3)调度运行日报、周报、信通公司信息系统分析月报、运维典型经验等文档要按时完成并保证质量。

(4)为保障系统运行安全,及时、定期对系统程序包、配置、数据库、运行日志进行备份工作,并妥善保存。

(5)配合研发厂商及实施单位做好系统上下线(资源申请与回收)的准备工作和相关文档的编写、整理工作。

(6)涉及到其他业务系统、网络或接口检修但会影响到本系统运行时,要积极做好配合工作,保障系统的安全、稳定运行。

(7)做好系统运维账号和内网U盘的保管工作,严格执行信通公司信息安全规范的要求。

三.信息系统检修规范及流程

(1)系统如有相应的检修计划,可以向省信息调度中心申报“信息系统检修”;申请检修工作需向信息调度中心提交《信息系统检修申请表》,填写系统检修的内容等信息,并向专责和上级领导汇报、签字审核。(2)检修类型的申请期限:

月度检修:申请下月月度检修申请必须在本月24日之前向信息调度提交申请; 周检修:申请下周检修必须在本周周四之前向信息调度提交申请;

检修窗口(国网批准的部分信息系统):申请检修窗口必须在每月18日或20日前一个工作日向信息调度提交申请。

(2)省信息调度中心通过信息系统审核申请后,在检修日前2个工作日要求必须开具信息系统工作票和操作票,并提交上级领导审核。在检修工作开始之前必须有检修工作票和操作票。

(3)检修工作开始之前,评估本次检修受影响的系统(包括集成接口),提前通知相关业务系统运维人员,做好系统保障工作。

(4)检修操作中,检修人员严格按照本次检修的操作说明或检修文档执行,做好安全备份和验证工作,确保检修完成质量;如需与集成系统进行联调工作的,做好协调沟通工作。检修完成后及时向信息调度中心汇报,完成检修闭环工作。

(5)在检修按照计划完成后2个工作日,向信息调度中心提交上级领导签字审核后的《系统检修验证单》。

(6)检修流程结束后,由专责将检修工作票和操作票进行归档操作。

四.运维系统(设备)账号及口令设置规范

规定了公司信息系统(设备)的帐号及口令设置的相关策略,包括网络设备、安全设备(系统)、主机(操作系统、数据库、中间件)及桌面终端等。(1)用户场景

根据系统的等保级别、使用该系统的用户所具备的权限(操作权限、数据权限)及用户的性质等,将使用帐号、口令的用户场景做以下分类:

普通用户:应用软件系统的普通用户、桌面终端用户等;

风险用户:所有系统和设备(如:网络设备、安全设备、主机、数据库、中间件、应用系统)具有管理权限或重要运维操作的用户(如:管理员、审计员和操作员),以及需要加强帐号口令设置的重要岗位。(2)帐号设置

帐号设置要求仅针对运维帐号,要求如下: 帐号长度不得小于8位,必须包含数字和字母;

禁止使用默认帐号或常见管理员帐号,如windows的administrator、guest,应用系统的admin、superadmin、system。(3)口令设置

口令根据用户使用场景的不同分为基本型口令和增强型口令。

(a)基本型口令

基本型口令适用于普通用户场景。该类口令的设置规则为:

1、口令长度不得小于8位,且为数字、字母和特殊字符组合。

2、口令中不得包含用户名。例如:用户名为zhangsan,密码不得为zhangsan123,zhangsan@1234、bjdlzhangsand等。

3、口令中不得包含系统默认口令及其变种,例如:admin、admin123、admin@123、password1234、r00t、toor、root11111111、root#123、weblogic1@

3、weblogic_123等。

4、建议口令应每三个月至少修改一次,修改后的口令与上次的口令不得完全相同;新建系统研发应具备提醒或强制用户修改口令的功能,并监测用户的口令强度。(b)增强型口令

增强型口令适用于风险用户场景。该类口令的设置规则为:

1、口令长度不得小于8位,且为数字、字母和特殊字符组合。

2、口令中不得包含用户名。例如:用户名为zhangsan,密码不得为zhangsan123,zhangsan@1234、bjdlzhangsan等。

3、口令中不得包含系统默认口令及其变种,例如:admin、admin123、admin@123、password1234、r00t、toor、root11111111、root#123、weblogic1@

3、weblogic_123等。

4、口令中不得包含常见的有规律的数字或字母组合和键盘上有规律的字符组合。例如:111111、12345678、123321、AAAAAAAA、abcdef、abccba、qwertyy、1qaz、1qaz2wsx等。

5、口令中不得包含常见英文单词(包括地名、人名)及专业术语。例如:password、guest、girl、guest123、password_123、oracle、php等。

6、口令不得为字符串的重复组合。例如:qaz.qaz.、1@31@3等。

7、口令不得为本人的姓名、出生日期、E-mail地址、办公电话、手机号码和身份证号码等与本人有关的公开信息。例如:wangwei、lijuan、19881220、881220、87632902@qq.com、***、***832等。

8、口令不得包含行业、组织或者地域特定名词的缩写。例如:sg186、sg186186、bjdl123456、bjdl_abc、jsdlxtgs、jsxtgs、xtgs186、dky@1234等。

9、口令不得包含业务系统的英文名称、英文名简称、中文名全称拼音、中文名首字母组合和系统IP地址及其变种。例如:I6000、pms2.0、caiwuguankong、ycpxxt_123、10.122.22.71、10.122.22.71_yxjc等。

10、口令不得包含英文短句或汉语短句的拼音。例如:I-love-u、i-love-u、woaini、woaiwojia等。

11、口令应每三个月至少修改一次,修改后的口令与最近二次口令不得完全相同。

12、帐号申请使用后应立即更改初始口令。

五.信息系统账号权限规范

(一)、涉及到所有系统的工作

1、(1)所有业务系统提交至少1份2016年的线下权限申请单的扫描件(签字盖章),权限申请表可以参考《附件

五、安徽公司信息系统权限申请表》。

(2)所有系统说明清楚线下权限申请单(签字盖章)原件存放处。

(3)平台类系统无业务用户,无需提交用户权限申请单;但需核对平台账号是否全部在运维账号表中(附件

六、运维帐号登记表)都有登记。

2、请每个运维人员检查《附件

七、信通公司非正式帐号汇总》中自己使用的账号实名信息是否完整准确。修改完善后以运维组为单位提交。

3、所有业务系统梳理三个月未登录系统的账号,将清单打印出来和业务部门确认是否可以禁用,如果不禁用,需要给予说明。提交业务授权部门签字(能盖章最好盖章)确认的扫描件给我,并通知目录权限组禁用账号在该系统中的权限;如果没有和目录权限集成,请自行执行禁用账号的操作。

4、所有业务系统梳理系统中含有“测试、test、临时、temp、临时、linshi……”等文字的不合规账号,(1)如果是和统一权限集成的系统,请回收权限并反馈给统一权限组;(2)如果没有和统一权限集成,请自行禁用账号,回收权限。

5、所有业务系统检查运维账号登记表是否完整准确(尤其是14个未反馈系统需补齐)(附件

六、运维帐号登记表)(二)、没有和目录或统一权限集成的业务系统需开展实名制治理:

(1)整改存量账号:业务系统首先和目录系统账号进行比对(附件

三、目录系统账号),目录系统里有的以目录系统登记的实名信息为准,目录系统里没有的由业务系统收集(我设计了一个统一的表格,见《附件

四、业务系统账号实名信息收集表》)。收集汇总后由信息系统授权许可部门进行审核确认后,后台导入业务系统各自的数据库中。

(2)增量账号的实名制注册:各系统按照《附件

八、安徽公司信息系统账号申请表2016》的附件2和附件3至少各准备1份个人账号和公用账号申请表的签字扫描件。

(3)此类系统今后的新增账号建议按照门户账号的规范创建,即:姓的全拼+名的首字母+身份证后四位,如果有门户账号,和门户账号保持一致

(4)如果是平台类系统,无普通用户的话,无需开展实名制治理;但需核对平台系统中的账号是否全部在运维账号表中都有登记。

六.信息系统缺陷管理细则

IT运维管理系统规划 第6篇

MIS网络信息运维管理系统规划(征求意见稿)作者:张鹏 二〇一〇年一月 前言

托电信息化发展历经八年,从只有一个OA办公系统、数十台终端到如今拥有包括小型机在内的服务器五十余台、交换机等网络设备百余台、终端上千台。信息化工作的重点已经从信息系统建设向运维管理和系统应用的深度整合等转移。

目前,信息中心每天的工作量,多数都属于运维管理的范畴。信息中心从机组四期工程结束后就着手开始运维管理方面的建设工作,几年间相继上了蓝带思科桌面管理系统、东华的IT运维系统、青鸟桌面管理系统。这些系统的应用情况都不尽如人意,原因是多方面的,个人认为主要有以下几点:

1.运维管理的理念形成需要逐步成熟的过程。2.受到与运维相关的信息技术发展制约。3.现有运维相关的产品有各自的侧重或局限性。

信息中心正在实施的两个项目NETIQ和机房环境监测系统为我们提供了一个契机,我们可以建设一个真正适合自己的网络运维管理系统,这个时机已经基本成熟。

一、运维管理系统建设的可行性

信息中心运维工作主要来自网络设备、系统应用、机房设备、终端。NETIQ服务器监控系统可以对服务器、数据库进行集中监控管理。机房环境监测系统可以对机房温湿度、空调、UPS等指标进行集中监控管理。终端管理方面,可以考虑购置更好的产品加上二次开发或者在现有桌面管理系统的基础上进行二次开发。相对于以上,网络设备的管理使用SNMP基本可以满足运维需求,NETIQ可以实现,也可以在运维管理中心开发相应的管理模块。这些系统的建设,本身就是具有针对性的综合管理系统,而且可以为运维管理中心系统提供运维信息的采集平台,是运维管理系统建设的基础。

二、运维管理系统的构想

运维管理系统由外围管理系统群和运维管理中心两部分组成。外围管理系统群包括网络设备管理模块、NETIQ系统、机房环境监测系统、终端管理系统,外围系统群为运维管理中心提供运维信息采集平台。运维信息采集包括网络设备运维信息采集、服务器组运维信息采集、机房环境运维信息采集、终端运维信息采集。

运维管理中心主要包括以下几个部分:运维任务的生成、运维任务的处理、完成确认、知识库、运维统计分析、运维报告、绩效评价、违规处理、维护商管理、应急预案管理、系统权限等。㈠生成运维任务

运维任务的生成有两个途径,一个是从信息采集获得,另外可以手动生成。运维任务分为运行管理任务和维护管理任务两类,运行任务管理是指系统、设备在正常运行状态下的监控管理或操作,主要包括定期巡检任务、正常的配置操作、补丁管理、用户管理、升级操作等,巡检任务由系统按规定自动生成,包括信息中心人员的日常巡检和维护商的定期巡检。维护管理任务是指当设备、系统出现异常或故障时的处理过程。运维任务的生成包括的信息有:设备或系统名称、IP地址、报警信息、时间、运维编码等等,由终端直接发起的运维信息应该包含联系人的电话等,以便于运维人员接手任务后与发起人主动取得联系。生成的运维任务包括网络设备、应用系统、机房操作、终端运维等几种任务。运行管理和维护管理并没有严格的界限,往往是你中有我我中有你。㈡运维任务的处理

运维任务生成后,由管理人员按照各自的职责分工,领取相应的运维任务进行处理,运维任务处理过程及信息分类:

运维类别 网络设备包括:交换机、路由器、防火墙、VPN设备、行为管理设备、其他 应用系统包括:操作系统、应用服务、数据库、接口、其他

机房运维包括服务器、网络设备、空调系统、供电系统、消防系统、环境监控系统 终端运维包括:终端、外设 运维内容

网络设备包括配置操作:增加、更改、删除,其他操作:版本升级、设备更换、其他 应用系统包括:配置变更、软件安装、升级、用户管理、数据管理、日志管理、补丁管理、策略管理、其他

机房运维包括具体的设备信息

终端运维包括:电脑硬件、操作系统、应用程序、打印机、其他 处理过程

处理结果

原因分析 影响情况 对用户的影响情况(时间范围)

运维任务在处理过程中包含以下几个状态,分别是: 等待处理: 等待运维人员接手 执行状态:运维人员正在处理任务

挂起状态:运维过程中出现其他急需办理的事物或其他原因暂停执行 提交状态:任务处理完毕,等待完成确认 完成状态:一个任务完全结束后的状态

驳回状态:任务处理过程中信息有待补充等原因被驳回。

当任务处理人员发现需要维护商来处理的时候,将任务转给维护商,由维护商接手任务,相关人员配合共同完成运维任务并填写相应的记录,最后由运维人员给予维护商相应的评价。㈢运维任务的完成确认

对已经完成并提交的运维任务进行确认、评价,对于运维内容是否放入知识库给予确认,对于运维过程中存在的违规情况根据相关规定给予处罚确定等。㈣知识库

知识库的信息积累来自于运维管理系统和平时的手工录入,应做好信息的分类、查询功能。当运维任务生成后,系统会把相关的信息在知识库中进行检索,并把结果显示在任务中,供运维人员参考。㈤运维统计分析

当某些问题经常出现的时候,信息中心必须运用统计分析对设备、系统产生的问题或故障协同相关维护商,进行深入分析,找出原因,解决问题。另外运用统计分析可以为今后的运维工作提供指导方向,制定下一步运维计划。㈥运维报告

通过运维管理中心,对运维数据有选择的筛选、汇总,定期生成信息系统运维报告,以便于工作总结、分析、计划。运维报告应具有针对性,例如呈送公司领导的、呈送各部门的以及信息中心的整体报告。㈦绩效评价

运维系统内的各方包括终端用户、维护商、运维人员都是可以评价的对象。终端用户可以给打印机维护商评价;也可以给信息中心运维人员给予评价;维护商可以给维护人员评价;运维人员可以给维护商的工作给予评价;运维人员可以对终端用户使用计算机的情况给予评价。㈧违规处理 对于运维过程中发现违反信息系统相关制度的行为应予以必要的处理。需要做两方面工作:涉及这个内容的制度条款应该拿到系统中来,处理的方式方法有待确定;对于违规行为,在运维处理过程中应该做相应的证据记录。㈨维护商的管理

对维护商的信息集中管理,运维工作予以记录、评价,运维合同的到期提醒等,如何对维护商产生实际的约束力,发挥其在运维工作中应有的作用,是我们需要考虑的问题。

(十)应急预案管理

当设备或系统的故障达到规定程度时,启动应急预案,并对整个处理过程实现系统化管理,以及预案的演练等其他工作进行记录。

三、终端管理系统

目前通行的终端管理系统所包含的功能主要有:硬件信息的提取(CPU、内存、硬盘等)、操作系统基本信息(操作系统版本、安装的应用程序等)、软件分发、补丁管理、外设管理、远程管理、主机防护等。有的产品还具有接入认证、内外网隔离、硬盘加密、网络行为管理等功能。360安全套件在终端健康状况、插件管理、实时防护、木马查杀、垃圾清理等方面做的比较好。瑞星网络版则是着重防病毒。将这些软件的功能加以综合利用,建设终端管理系统平台(组),为运维管理中心提供数据。

厂区终端使用最多的是OFFICE办公软件和浏览器,出现问题最多的是浏览器,所以应当把对浏览器的运维作为终端运维的重点之一。此外终端管理系统收集的终端硬件信息可以与信息中心现有的资产管理系统建立联系,可以实现较为准确的资产定位,协同各部门信息员及时掌握资产的变动情况。

客户端的二次开发要求:客户端既属于终端管理系统,又可以和运维管理中心通信,同时可以对于我们所需的现有产品没有涉及到的进程或指标进行检测。

1、实时交互性

当运维人员需要远程维护时与终端用户进行询问、控制申请等信息交互,当运维任务结束后,终端用户可以给维护人员以相应的评价。运维管理中心收集到的终端健康情况也可以发送到目的终端,给使用者以相关的提醒。

2、人性化

终端使用人提交运维申请后,可以看到运维管理中心当前的运维状况,谁接手了自己提交的申请,自己排在第几位等信息。客户端运行应尽量避免对终端用户的正常工作形成干扰,如果能做到让使用者感觉很舒服又实用那是最好了。

3、资源占用率 客户端运行时,进程的大小,CPU占用率可以参考较为成熟的软件如360及瑞星运行时的情况。

4、定制化安装

对于信息中心维护范围内和维护范围外的终端,应该采取不同的安装策略。比如对维护范围外采用接入认证、监控健康状态、信息提醒等,但不启用维护功能。用户在安装客户端时,填写相应的信息以便系统管理。

四、运维系统建设工作重点 1.运维管理中心的开发 2.终端管理系统的建设

3.NETIQ系统所涉及监测指标的调整,与运维管理中心的接口准备 4.机房环境监测系统所涉及监测指标的调整,与运维管理中心的接口准备

5.对于特定应用系统的运行监测,NETIQ能否开发出对应的监测服务模块,或者应用系统的开发商可以开发出对自身运行状况的监测功能。6.与运维工作相关制度的完善、建立。

五、总结

系统运维管理规范

系统运维管理规范(精选6篇)系统运维管理规范 第1篇IT 基础设施运维管理规范 文件编号:运维-002-V1.0目录运维管理规范--------------4...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部