- 由 虚拟的现实创建于10月 06, 2023 需要 2 分钟阅读时间
目的
确保物流仓服务器正常运行,保障仓库业务系统正常运作和数据安全。
适用范围
XXX体系内所有物流仓
原则
执行标准
XXX体系内弱电工程标准参照“0003-弱电工程评估规范及标准流程”执行。
服务器
物流数据库服务器2台(SSD*3+SAS*2)、WEB服务器1台(SAS*2),过保服务器3年更换1台
1、物流仓库物理服务器由外省公司采购,物流本地负责运维。参考弱电标准。
2、重点跟进:空调、UPS、深信服WOC、派网上网行为管理、双线路隔离(办公网络、WOC网络)
3、服务器标准配置(BIOS):通电后不自动重启
4、硬件设备配置双电源的必须接入双电源
网络及设备配置
1、配置2条线路:一条用于办公区域日常上网(使用普通ADSL 100M),另一条用于物流VPN(上下行对称20M,含固定IP),VPN线路故障可使用办公线路应急使用
2、上网行为管理设备:派网;VPN设备:深信服WOC;UPS设备:APC SURT3000XLICH
3、以上设备仅适合分公司通过VPN连接总部,不适用分公司之间的互联
4、以上设备的标准保修期为一年,建议使用三年;设备使用三年后更换 WOC 设备,更换后的旧设备备用,确保业务稳定。(设备损坏导致业务中断时间>2天)
4、服务器及相关设备同网络,隔离办公网络和监控网络
5、服务器运维不允许物流通过物流办公本地网络远程,只能到机房现场或SSL远程到总部堡垒机远程(安装双因子软件)
数据库配置
1、2台数据库服务器采用数据库镜像方案
2、故障发生后通过手工方式切换到镜像数据库(预计业务中断时间30分钟)
安全标准
1、原则参照“0004-信息安全管理规范”
2、各物流服务器不开放公网远程桌面服务。分公司运维人员通过SSL VPN拨入总部线路,通过总部线路远程各物流服务器,权限审核由运维部负责,云中心根据审核结果开通对应权限
3、物流运维人员每天上下班巡检服务器资源。包括:服务器硬件状态灯、操作系统日志、应用程序日志、系统安全日志,如有无法定位的异常情况及时联系零方科技云中心协助处理
责任人员
仓库系统管理员;时捷、彩运、华雪各兄弟公司、子公司IT人员敦促执行。
日常运维
1、物流系统授权给物流本地,物流系统问题由仓库本地运维人员第一时间联系物流信息部,如果问题无法及时解决,联系总部人员协助处理。问题处理完成后,物流运维人员按问题报告模板(客服部)提交问题分析报告。
2、MPS授权给系统管理员,MPS问题原则上本地系统管理员处理,如果问题无法及时解决,第一时间联系分区服务部,分区服务部评估无法处理的联系总部人员协助处理。问题完成后,系统管理员按问题报告模板(客服部)提交问题分析报告。
3、物流的查询报表及打印模板由仓库本地运维人员负责。
3、参考总部信息安全标准(启用Deny_RDP)
4、不允许安装第三方远控软件和其它软件,定期(每季度)更新补丁包,安装主机安全软件
a、补丁启用自动更新,使用内部192.168.5.98服务器(参考补丁更新标准操作)
b、补丁更新后手工安排重启时间,确保服务器重启不影响物流分拣作业
c、提供备用PC机(WEB服务器),安装标准操作系统作为应急使用
5、SSL账号申请、禁止由产品部供应链确认(书面),原则上一个物流仓配置一个SSL账号【系统管理员】,物流SSL账号接入堡垒机,按堡垒机授权
6、安装zabbix监控系统
7、物流仓库日常运维内容:
- 服务器、WOC、派网网关、空调、UPS硬件状态检查
- 服务器系统日志、应用程序日志检查
- 数据库服务器日志检查、磁盘剩余空间检查
- 物流内部网络维护(确保物流内网网络不丢包)
- 物流外部网络维护及故障处理
- 服务器操作系统重装及网络配置
- 物流新硬件(例如服务器、网络设备)上机柜及配置
数据库维护
1、物流仓库数据库配置2台服务器,使用数据库镜像功能
2、每天登录检查数据库状态:查看服务器系统安全日志、应用程序日志、系统日志及数据库日志,作业运行情况
3、always on数据库服务器不能随意更改密码,如需要更新密码,提前通知信息云中心备案(更新堡垒机、检查数据库切换)
4、数据库服务器不能2台同时重启,必须要一台重启成功后再重启另一台
与第三方对接
1、与第三方物流系统或第三方业务系统对接,采用API方式。API部署到XXX总部,如会员中心的电商业务,由彩运大亚湾物流进行分拣,由第三方物流进行配送的,全部通过总部API对接第三方物流系统。
服务器巡检流程
1、观察服务器前置面板有无告警灯亮起,前面板系统错误LED不亮(见下图),且其他部件LED全部亮绿灯,表示服务器运行状态良好。
2、如系统错误LED亮起黄灯,则表明在服务器上检测到错误。故障原因可能包括但不限于以下错误:
• 服务器的温度达到了非临界温度阈值。
• 服务器的电压达到了非临界电压阈值。
• 已检测到风扇运行速度较低。
• 已卸下热插拔风扇。
• 电源模块有严重错误。
• 电源模块未连接电源
此时应当先检查服务器后端电源线是否松动,电源输入是否正常以及前面板硬盘是否存在告警(硬盘亮起黄灯);随后登录管理口进一步确认告警信息。
3、登录带内管理口查看告警信息(适用于Windows系统环境,现场无笔记本的情况)
• 登录服务器,检查NDIS远程网卡是否启动,如未启用则把其启用。
• ping 169.254.95.118,确认能ping通。
• 浏览器访问https://169.254.95.118,打开带内管理Web界面,输入默认账号 USERID(全大写),密码PASSW0RD(第六位为数字0),即可登录管理界面;在Event/感叹号下面可以查看到具体的告警信息与告警部件。
4、登录带外管理口查看告警信息(适用于所有情况)
• 电脑有线网卡IP配置成192.168.70.201,子网掩码255.255.255.0,网关和DNS留空,如下图所示:
• 把上一步配置了IP地址的有线网卡通过网线与服务器的带外管理口连接,带外管理口一般有扳手或IMM1的标记,如下图:
• 命令行窗口ping 192.168.70.125 -t;能ping通后访问https://192.168.70.125即可打开带外管理界面,输入默认账号 USERID(全大写),密码PASSW0RD(第六位为数字0),即可登录管理界面;在Event/感叹号下面可以查看到具体的告警信息与告警部件。
服务器报修指南
1、访问http://support.lenovo.com.cn/EsWeb/Index.aspx,输入机器SN号查询保修信息,如有特殊非联想机器,请到对应官网进行查询。SN号在服务器前面板可以看到,一般为8位大写英文字母与数字组合,如下图:
2、如已过保,请确认该服务器归属;如是承运商自行采购,需自行找供应商进行维保,如是总部采购,请联系零方科技网络云中心。
3、如未过保,请拨打联想企业级产品支持热线 4001068888进行报修。
其他注意事项
1、如发现硬盘损坏,应及时备份该服务器重要数据到其他电脑或移动存储介质。
2、所有经总部寄出的服务器均有配置冗余性的RAID,在只有一块硬盘告警的情况下,可直接以正常部件更换。
3、服务器巡检时,应当注意现场环境是否有漏水、温度过高或过低、湿度过高或过低、灰尘过多等可能影响服务器正常运行的因素,如有,应及时整改处理。(数据中心建议温度为20摄氏度-28摄氏度,建议湿度为40%-55%)
版本
- 无标签
0 评论