文章内容是3篇关于「运维管理制度」的工作范文供大家借鉴参考,希望能帮助大家在工作中写运维流程管理相关文档的时候提供一个有效的参考,助你解决相关写作问题。
no.1 运维管理制度-第1篇
运维管理标准
概述
运维是管理的核心和重点部分,也是内容最多、最繁杂的部分,主要用于运维部门内部日常运营管理,涉及的对象分成两大部分,即业务系统和运维人员。其管理内容又可细分为七个子系统:
第一、设备管理:对网络设备、服务器设备、操作系统运行状况进行监控,对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、dns、web等的监控与管理;
第二、数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复; 第三、业务管理:包含对企业自身核心业务系统运行情况的监控与管理 第四、目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;
第五、资源资产管理:管理企业中各it系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;
第六、信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是iso17799,该标准涵盖了信息安全管理的十大控制方面,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;
第七、日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段。
第一章 总则
1、为加强公司各个项目后期的系统运维管理,确保系统能够平稳、可靠地运行,更好地为客户提供管理服务,特制定本规定。
2、实行预防性维护为主、故障性维护为辅的运行维护管理原则,预防性维护和故障性维护都应遵循事先设计好的程序进行。
3、完善运维管理体系,建立健全运维规范,提高运维管理效率,并不断提高运维质量。
4、本规定适用所有进入运维环节的项目。
5、运维人员应根据授权,处理本规定中所涉及的业务事项。
第二章 主机、服务器及数据库系统的运维管理
1、根据应用需求,主机、服务器及数据库系统的配备和安装、以及系统资源的使用等由公司项目实施部统一规划。
2、应指定专人作为系统管理员(系统工程师)和数据库管理员,对系统的运行、管理、维护和安全负责,并按照有关规定负责系统和数据的备份与恢复。3.系统/数据库管理员应定时对系统进行监控和定期的健康性检查,分析系统运行和资源使用状况,并进行必要的优化、调整和修正,及时消除隐患。如系统设置发生变化,或重新安装系统,或安装了新软件,应在此后15个工作日内对系统进行密切跟踪。
4、及时解决处理系统运行过程中出现的异常问题和软硬件故障,并采取必要措施,最大限度地保护好系统资源和数据资源。
5、对于重大软硬件系统故障,应立即通知部门领导,协调服务商,使系统尽快得以恢复运行;对于应用系统引发的系统异常或故障,应及时通知相关人员,并协同解决处理。
6、每季度应对系统主机/服务器/数据库进行一次停运维护,其操作必须严格按照操作规程进行。其他非正常性停运(故障引发的除外),应提出书面申请,并经部门领导批准后方可进行。同时做好相应的准备工作,最大限度地减少对业务操作带来的影响。
7、具有系统操作或管理权限的人员调离工作岗位或离职,应立即从系统中删除该用户;如该人员掌握超级用户口令,应立即更换口令。
第三章 软件系统的运维管理
1、避免在用户工作时间进行软件版本升级工作,以免由于人为失误造成业务中断。2.软件系统的安装、升级等操作应保留完整的实施记录。
3、对软件系统进行升级、更新补丁,应首先进行相关的测试,并在确认无误后实施。
4、对软件系统进行升级、更新补丁,或进行系统的重新安装等操作,应在实施前对原有系统及数据进行备份。
5、变更系统配置,修改配置文件、参数文件时,应对原始配置数据(或文件)进行保留。
6、软件进行版本升级时,对于不影响业务的升级工作,须以书面形式详细将计划、方案、措施等报上级主管部门备案;对于影响业务的升级工作,必须提前两周向上级通信主管部门以书面形式提出申请详细报告计划、方案、措施等,经批准后方可实施。
7、维护人员应定期跟踪所使用系统的软件升级情况和升级后的新功能,必要时提出升级建议。
第四章 数据库的运维管理
1、对于数据库的变更必须有记录,可以回滚。2.无用表和字段要及时清理。
3、从数据库删除数据一定要先备份再删除。
4、定期对数据库数据进行自动备份,以便在故障发生后尽快恢复最新的数据。定期检查备份的执行情况,确保备份操作正确执行。5.指定专人定期进行备份数据的恢复性试验。
1、严格操作原则:在系统上进行可能影响系统运行的参数设置、更改和维护等操作时,须有2人以上在场进行监护和确认,并作好详细的操作记录;
2、提前沟通确认原则:软件进行版本升级时,对于不影响业务的升级工作,必须提前与客户方进行沟通,避免操作中人为失误造成业务中断;对于影响业务的升级工作,须提前与客户方进行确认,达成一致后方可实施。
3、遵守保密原则:对被运维系统单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。
第五章 巡检管理
定期了解设备的运转情况,做好系统日常运行的基础数据记录,做到有问题早发现、早解决,避免隐患,确保设备的完好率,保证系统运行质量。
1、对硬件设备进行定期巡检,是确保系统稳定运行的重要措施,巡检工作包括例
行巡检、节假日和重要事件前的巡检
2、维护人员应根据工作计划,对维护的设备定期进行预防性巡视检查,巡查过程中应认真负责,及时发现问题,重点注意处在恶劣环境下、存在潜在质量故障的设备,巡查要认真做记录。
3、巡检过程中发现告警应立即进入处理流程,判定为故障的要立即进入故障处理流程
4、所有的巡检都应有详细的记录,包括时间、巡检情况和责任人,并应在巡检纪录卡上签字。
第六章 网络管理规范
关键业务流程
对以下业务系统流程监控,对业务系统是否正常运行、各项具体参数指标是否超标等进行掌控,避免或降低业务系统故障的发生率。
1、单位内部的关键业务流程。
2、网络吞吐量大的业务流程。
3、对系统造成大的压力,频繁使用数据库的业务流程
4、同其它系统集成的业务流程,这些集成会提高应用失败的风险。 用户体验同系统性能指标相关联
将网络中的所有网络基础架构都进行集中监测,包括对数据库服务器、应用服务器、路由器、交换机、防火墙的监控,收集网络运行信息,将性能数据同单位内部用户的体验相结合来分析网络的性能状况,诊断系统瓶颈。
建立网络运行基准指标并观察趋势
长期监测并通过对网络运行的观察,分析网络性能的变化和流量等指标的运行趋势;及时发现网络偏离系统基准模型时的异常状况,分析故障,达到预警的目的,防止更严重问题的发生。 设计报警策略,避免警报泛滥
配置报警的依据是根据信息服务管理网的网络运维管理目标,报警设置的原则:
1、对影响网络和业务的重要指标设置报警;
2、消除误报和重复报警;
3、报警应该以多种方式及时发送给相应的负责人。 创建自动化、规范化事件处理程序
信息服务网络运维,日常处理事务较多,需要在网络、链路和系统运行出现问题时能够有自动化、规范化的处理问题程序,快速处理各种潜在故障并且分配到相应的负责人,提高工作效率。另外可将工程师长期积累的知识和工作经验系统化和固化,达到快速定位故障的目的。
网络服务质量sla的量化管理 提高网络服务质量的设立量化指标,将其作为整个网络运维管理团队的整体目标。信息服务管理网网络性能管理的总体目标包括网络和设备、业务的可用性、网络的吞吐量、带宽使用百分比、网络延时、cpu和memory的负载,对于不同的网络指标还要根据网络的上下级连接关系分解到每一个子指标,作为对网络故障诊断和性能管理的依据。
制定网络的升级和改进策略
网络的升级和改进应该以对现有网络和系统性能数据的测量为前提,以对网络整体运行的现状及趋势分析为依据。通过对单一网络系统和整体网络系统性能数据的比较、单一网络组件和其它网络组件的数据比较、系统负载量最大时的性能数据和一般负载时的性能数据的比较等,判断是否需要对系统的局部或者整体进行升级,发现网络系统性能的瓶颈,提出网络系统改进的方法。 日常规范
1、每天两次进行业务系统、网络运行状况、业务流量及对外服务器服务状况监控巡查;
2、按照规定的时段巡统计并汇总运维表单。(流量统计、事件统计、问题统计、手里投诉统计等)按照规定的时段查看路由、防火墙等关键系统运行情况,包括网络流量、带宽占用率等,重点检测关键设施,并记录;
3、处理产品组网络问题应做完整、详细记录,快速响应,及时确定原因,积极组织处理,同时记录解决问题的操作过程,问题解决后应及时回复;
4、对网络资源调配管理(ip资源分配、设备端口划分、链路传输、负载均衡等)、核心和汇聚层等核心网络运维的调试,做好汇报申请并记录。
5、故障分析及处理,网络拓扑更新及网络优化。网络安全方案实施部署,更新维护录入知识库。
6、处理各种网络故障,并作记录,保障网络正常运行。7.遇到不能处理的问题时,通知相关人员或及时汇报,并记录;
8、工作人员要有强烈的安全意识,巡查时应注意发现各种可能的安全隐患并及时排除。
第七章 请示报告制度
为加强相关信息处理和反馈管理,有效的控制系统和设备的运行状态,通过规范的请示报告流程,提高运行维护的管理效率。
例行性请示报告
1、按照规程和制度规定的周报、月报、季报和年报。2.系统升级、交接和重大数据变更请示报告。3.各类专项请示报告和合理化建议。紧急性请示报告
1、各种事故、严重设备故障、严重电路故障、系统运行异常等情况。2.各项工作中发现的严重泄密、安全性事故报告 3.客户要求的其他紧急性报告。
no.2 运维管理制度-第2篇
一、机房工作人员管理制度
1、严格注意防火、防盗,机房内严禁吸烟和使用明火,不得存放各种易燃、易爆、放射性及强磁场物品。机房工作人员外出及下班时要锁好门窗。
2、机房工作人员应时刻注意机房空调运行状态,保持机房及设备恒温、湿度状态,出现故障要及时通知有关人员配合解决。
3、为保证计算机信息系统正常运行,机房的服务器须每天24小时开机(包括双休日),未经批准不得擅自关闭服务器。因机房设备检测、维修或其他原因关闭服务器,应事先征得相关负责人批准。
4、机房工作人员要定期维护机房设备,保持正常运行。发现异常情况应及时处理并好记录,如不能解决须报告相关负责人研究处理方案。
5、机房内计算机系统软硬件的配置及更改,须由系统管理员进行。为防止计算机感染病毒,使用外来的软盘、光盘、u盘、移动硬盘等移动存储介质前,要先查毒后使用。
6、机房内的设备、资料、物品只限在机房内用,外借时需经批准并登记,用后及时收回。
7、保持机房清洁卫生,每两周集中打扫1次清洁卫生。严禁在机房堆放杂物,禁止将食品或与工作无关的物品带入机房。
8、其他部门人员可进入机房,但未经批准一律不准上机操作。外单位人员进入机房,须经信息化研究中心负责人批准,机房人员陪同并登记,做好记录。
二、技术服务人员管理制度
技术服务人员主要指:机房设备原厂服务商、系统集成商、第三方服务人员,为机房工作人员提供技术凯发体育注册平台的服务支持。
1、技术服务人员进入机房前应事先与机房工作人员沟通交流,判断故障出现的原因,拟定故障排除计划,估计故障影响范围。
2、技术服务人员进入机房前,应填写《机房出入登记表》,由机房工作人员全程陪同,进行相关维护、维修操作,并做好所有操作记录。
3、技术服务人员不得复制服务器、交换路由、安全设备等相关配置,不得将相关配置告诉第三方,不得将相关信息外泄。
4、技术服务人员在新安装设备时,应告诉机房管理人员设备使用、维护的注意事项。
三、技术开发人员管理制度
1. 开发人员进入机房前,应填写《机房出入登记表》。由机房工作人员全程陪同,进行相关维护、维修操作,并做好所有操作记录。
2. 未经负责人批准,开发人员不得在中心机房设备上编写、修改、更换各类软件系统及更改设备参数配置。
3. 开发人员在配置好新系统后,应以书面形式告诉机房管理人员需要备份的`数据和备份周期。
4. 开发人员从服务器上传和下载数据,原则上使用ftp软件,除特殊需求,并在负责人批准后,方能使用u盘或移动硬盘等便携式设备在服务器上传输数据。
5. 开发人员安装新应用系统时,禁止盲目的把程序拿到服务器上测试,应在自己的测试机上测试程序,并确保应用软件的安全性。不得私自在服务器上搭建安装测试环境。
6. 开发人员在服务器上操作时,遇异常情况,应及时通知机房管理人员,切勿在服务器上进行测试操作。
7. 开发人员在服务器上的主要操作内容为:
(1)上传和下载数据。
(2)对自己开发的系统进行升级和维护。
(3)对新开发的应用系统进行安装和配置。
8. 开发人员不得进行以下操作:
(1)修改服务器系统配置,特别是涉及安全方面,如端口的开放,注册表的修改等。
(2)在服务器上调试程序代码。
(3)未经许可重启服务器和系统服务。
no.3 运维管理制度-第3篇
一、矿井必须有完整、独立的通风系统。改变全矿井一翼或一个水平的通风系统时,必须报公司总工程师批准;改变一个采区的通风系统时,必须报矿总工程师批准。
二、水平延深及采区开拓从设计上要确保通风系统合理,并在实际施工及生产过程中严格实施。
三、矿井在组织生产、安排生产布局、采掘接续时,首先要考虑通风能力,做到以风定产、定头,避免出现因生产过于集中、追求产量进度,造成的系统不合理、区域风量不足及违规串联通风等现象。
四、严禁不符合《煤矿安全规程》的串联风、扩散风、老塘风,严禁出现串联风中的“并─串”或“串─并”形式的二次串联风。
五、实行分区通风。采掘工作面都应采用独立通风系统,布置独立通风有困难时,经矿总工程师批准可以采用符合《煤矿安全规程》要求的一次串联风,同一采区内一次串联风不得超过一处。进入串联风流中的沼气和二氧化碳浓度不得超过0.5%,在串联风流中,必须安装沼气自动检测报警断电装置。
六、非长壁采煤法、残采、回收煤柱、地质构造复杂地段的。回采,无法形成通风系统的通过制订专门措施,经公司总工程师批准,可以采用局扇供风,但必须实施“三专二闭锁”或“双局扇双电源”,必须安装沼气自动检测报警断电装置。
七、井下爆破材料库必须有单独的通风系统,回风风流必须直接引入矿井的总回风道或主要回风道中。
八、矿井及各地点所需风量,应按《煤矿安全规程执行说明》进行计算。
九、全矿井风量每旬至少测定一次,重点区域经常测定。对供风量不足地点要及时查明原因并进行调整,确保合理供风。
十、矿井回风道失修率不得高于7%,其中严重失修率不得高于3%。
十一、加强通风设施管理,矿井有效风量率不得低于85%,外部漏风率不得超过5%,风井外部漏风率每年至少测定一次。
十二、反风设施由矿长组织有关部门每季度至少检查一次,检查结果要有记录备查,每年进行一次矿井反风演习。
十三、主要通风机至少每月由矿机电部门检查一次,检查矿井主扇的运转情况、反风设施、电器设备的工作情况。