一、维护目的
保障机房设备正常运行,和对机房环境支撑系统、服务器主机设备定期检测、维护和保养,保障机房设备运行稳定,通过保养延长设备生命周期,降低故障率。确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护人员的产品维修和技术支持,并快速解决故障。
一、 维护内容
1、平台规划:在平台建设初期,就硬件需求、网络规划提出合理建议并与七师财务局就平台实际需求进行规划。
2、机房主机设备维护管理:计算机服务器(应用/数据库服务器、CA管理、ROSE热备软件);网络设备(交换路由设备等);平台规划文件归类存档。
3、机房供电设备维护管理:供配电监测系统、温度环境检测系统。
4、机房空调与备用电源维护管理:空调设备、通风设施、UPS电池及主机、主配电箱。
5、机房消防设备维护管理:烟感热感探测器、灭火器的控制装置。
6、机房电路及照明维护管理:电路管线及接口的检查维护。
7、机房基础维护管理:机柜线路的整理、标签检查更换、机房除尘清洁、地面、墙面、吊顶、门窗及相关配套的维护管理。
三、具体维护方案
服务器维护及安全:
1、定期巡检制度 :
每星期按时检查机房内设备的运行状态,做好巡检记录。遇故障及时与七师财务局联系,并商定解决时间、解决方法。对常见的故障进行快速判断或修复,维持平台的正常运行。
2、定期检查服务器软件运行情况:
每星期检查各服务器运行情况,关闭或删除影响服务器稳定运行的软件或系统垃圾,定期清理过期的自动备份文件,在保证服务器安全的基础上节省空间资源。
3、定期刻录备份制度 :
每星期至少备份一次数据库,并刻录光盘留存,做好备份记录。
如遇法定节假日,在放假前一工作日提前巡检机房并备份数据库。
4、口令管理
服务器登陆口令的长度一般不少于8个字符,口令的组成应以无规则的大小写字母、数字和符号相结合,严格避免用英语单词或词组等设置口令,定期更换。
Windows主机可以通过组策略中的密码策略强制使用强密码并要求定期修改,还需要为administrator账号改名。
Linux主机口令的保护涉及到对/etc/passwd和/etc/shadow文件的保护,必须做到只有系统管理员才有权限访问这2个文件。安装口令过滤工具加npasswd,可检查系统口令是否可经受攻击。
5、完整的日志管理
日志文件记录着系统运行情况,攻击者往往在攻击时修改日志文件,来隐藏踪迹;因此需要对日志文件及目录设置严格的访问权限,禁止其他用户的读取和写入权限。
Windows主机开启审核策略,对账户管理、登录事件、
对象访问、策略更改、特权使用、系统事件、目录服务访问、账户登录事件的成功 失败进行审核,产生日志文件,同时只有系统管理员对日志文件有访问权限。
6、使用安全工具软件:
Windows主机可部署防病毒软件,安装微软基线安全分析器MBSA扫描服务器操作系统漏洞,及时下载server pack和漏洞补丁。部署主机IDS(入侵检测系统);如免费的轻量级网络入侵检测系统snort,
网络设备安全
1、机房除尘及环境要求:定期对设备进行除尘处理,防止由于机器运转、静电等因素将尘土吸入设备内部。同时检查机房通风、散热、净尘、供电等设施。机房室内温度应控制在+12℃~+26℃,相对湿度应控制在10%~80%。
2、机房空调及新风维护:检查空调运行是否正常,换风设备运转是否正常。从视镜观察制冷剂液面,看是否缺少制冷剂。检查空调压缩机高、低压保护开关、干燥过滤器及其他附件。
3、UPS及电池维护:根据实际情况进行电池核对性容量测试;进行电池组充放电维护及调整充电电流,确保电池组正常工作;检查记录输出波形、谐波含量、零地电压;查清各参数是否配置正确;定期进行UPS功能测试,如UPS同市电的切换试验。
4、消防设备维护:检查火警探测器、手动报警按钮、火灾警报装置外观及试验报警功能;检查火灾警报控制器的自检、消音、复位功能及主备用电源切换功能。
6、电路及照明电路维护:镇流器或灯管、开关及时更换;线头氧化处理,标签巡查更换;供电线路绝缘检查,防止意外短路。
7、机房基础维护:地板清洗清洁,地面除尘;缝隙调整,损坏更换;接地电阻测试;主接地点除锈、街头紧固;防雷器检查;接地线触点防氧化加固。
8、机房运维管理体系:完善机房运维规范,优化机房运维管理体系。维护人员24小时及时响应。