选型注意事项
实施注意事项
硬件建设中期为项目实施阶段,在实施阶段选择有效的配置将进一步增加云平台的稳定性和性能。
- 项目实施时,若硬件条件不满足或者现场硬件中存在黑名单硬件,需进行及时采购和更换,避免后期因硬件问题导致客户业务被影响且进行二次变更。
- 现场实施时需要对已有硬件进行合理规划和使用,包括磁盘调整、内存数量调整、网卡调整等信息。
目前硬件中为了让CPU空闲时节约能源,可以让 CPU 进入低功耗模式。
- 对应原理为降低 CPU 内空闲单元的时钟信号和功率,通过降低时钟信号和电压停止(甚至完全关闭)的CPU单元越多,功耗就越低。
- 当从休眠模式中完全“唤醒”CPU需要花费更多时间,生产环境如果开启C-state,将造成CPU在不同模式下切换、休眠从而导致延迟,同时可能触发某些kernel的BUG导致物理机异常重启,因此建议关闭C-state。
项目实施时推荐根据硬件厂家中的最佳实践配置BIOS进行配置,避免硬件已知问题造成平台的不稳定。
运维注意事项
硬件建设后期为运维阶段,在运维阶段需关注硬件负载和硬件故障情况,针对不同的硬件需考量故障时间,避免应硬件故障导致业务影响。
- 生产环境中需时刻关注内存条故障信息,需置备相同型号内存设备,当出现内存故障时及时进行更换。
- 生产环境中针对SSD寿命进行监控,当出现寿命低于20%时因及时进行更换,避免因SSD故障导致存储池性能降低以及存储池故障等现象。
- 生产环境中周期性进行安全巡检,提前避免硬件故障问题。
硬件黑名单
服务器 | 网卡 | RAID卡 | HBA卡 | 交换机 | SSD |
---|---|---|---|---|---|
Lenovo ThinkSystem SR650 | Inter E810 25GB | RAID 430-8i(LSI 3408) | Qlogic crop ISP2722-based | 浪潮 cn8672up | 镁光5200 |
Lenovo ThinkSystem SR550 | Broadcom BCM57810 | LSI SAS3508(LSI 3508) | NULL | 浪潮 cn3348upq | 三星PM883 |
Lenovo ThinkSystem SR590 | NULL | LSI SAS3416(板载RAID卡 LSI 3416) | NULL | NULL | 镁光5300 PRO |
NULL | NULL | 联想RAID 530-8i(LSI 3408) | NULL | NULL | NULL |
NULL | NULL | 联想RAID 930-8i(LSI 3508) | NULL | NULL | NULL |
NULL | NULL | 联想RAID 930-16i(LSI 3516) | NULL | NULL | NULL |