且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

《构建高可用Linux服务器 第3版》—— 2.7 系统维护时应注意的非技术因素

更新时间:2022-10-06 20:47:21

本节书摘来自华章出版社《构建高可用Linux服务器 第3版》一 书中的第2章,第2.7节,作者:余洪春 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.7 系统维护时应注意的非技术因素

我们在平时进行系统维护时,除了技术方面的因素外,还要注意一些非技术的因素,因为它们也是安全隐患,如果大意,极有可能影响网站运行,我特地归纳了几点,如下所示:

在机房巡视时,我发现很多的管理员特别喜欢用root进行维护,并且不logout就直接走人了,这种做法是极其危险的。因为如果机房的机器多,会涉及几个部门的System Admin,极容易出现误操作的情况,所以正确的做法应该是操作完成后应立即用CTRL+D快捷键退出,然后锁上机房门。另外,我建议重要的服务器不设监视器和键盘,一切操作都远程处理,有特别需求,才进机房进行维护。

无论是网站还是系统,要正常运行,其实都会涉及很复杂的工作,比如需要防火墙、程序、应用、数据库等都能够正常运行,在正式上线后还要考虑复杂的大量并发和安全问题,在测试环境下能够顺利运行的程序或脚本,未必能在线上正常运行。

如果是刚刚接触系统管理工作的新人,我建议先从sudo用户用起,在熟练到一个级别后再用root进行Linux系统运维工作。虽然sudo用户操作麻烦,但在一些危险性或毁灭性的操作前还是有一定的预警或防范作用的。

我和同事们在Linux服务器上操作配置文件时养成了一个好习惯,即从不删除任何文件。当需要更改重要文件时,我们一般会先备份.bak文件,然后再编辑。如果是配置文件的某个语段,我们一般会用#注释掉,而不用清除;大家以后慢慢地会发现,这个好习惯会给你的工作带来许多便利,消除危险因素。

如果是用Xshell 3.0来操作线上环境的服务器,而且是多窗口多服务器的操作,我的建议是操作完后就立即退出当前窗口,这也是消除不安全因素的一种做法。因为当测试环境和线上环境的服务器都在Xshell 3.0窗口时,极容易出现误操作的情况。