人工智能、大数据、云计算等工作负载都离不开服务器。由此,被架到风口上的服务器产业驶入发展快车道,国内的服务器厂家也越来越多。
服务器,也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。
服务器的构成包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。在使用过程中,有时候会产生一些故障问题,那么服务器出现故障了怎么办呢?作为国内知名的工业级服务器生产厂家,将为大家介绍服务器的常见故障以及解决方法!
一. 服务器无法供电
1.市电、UPS、电源线故障(断电或接触不良)
2.电源或电源模组故障,检查电源,将所有的电源接口拔下,将电源的主板供 电口的绿线和黑线短接,看看电源是否启动
3.注意开关按钮是否弹起良
4.主板或其它插卡造成中断冲突
二. 服务器可供电但无法显示
1.检查各种板卡是否接触良好、I/O接线是否连接正常(可拔插部件测试)。
2.将服务器设为Z小配置(只接单颗cpu,Z少的内存,只连接显示器和键盘) 直接短接主板开关跳线,看看是否能够启动。
3.如果判断电源正常,则需要用替换法来排除故障,替换法是在Z小化配置下 先由Z容易替换的配件开始替换(内存、cpu、主板)
三. 系统频繁重启
电源故障(替换法判断解决)温度过高,尤其是CPU温度,并注意查看各个风扇内存故障(可从BIOS错误报告中查出)网络端口数据流量过大(工作压力过大)服务器死机故障判断处理:软件故障(更新或重装操作系统解决)
四. 服务器死机故障判断处理
服务器死机故障比较难以判断,一般分为软件和硬件两个方面:
A、软件故障
首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因。
电脑病毒的原因。
系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。
软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是否能够解决
B、硬件故障
硬件冲突 电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。
硬盘故障(通过扫描硬盘表面来检查是否有坏道)
内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断)
主板故障(使用替换法来判断)
CPU故障(使用替换法)
板卡故障(一般是SCSI/RAID卡或其他pci设备也有可能造成系统死机,可用替换法判断处理)
系统死机故障需要在处理完后需要在一段时间内进行一定压力的拷机测试来尽一步检查故障是否彻底解决。
0755-27644157 | |
13925282285 | |
4117728@qq.com | |
深圳市坪山区兰竹东路13号东城大厦3楼3A03 |