admin管理员组

文章数量:1547183

运维工程师工作内容整理

    • 稳定
    • 安全
    • 大性能
    • 自动化
    • 素养
    • 团队沟通
    • 其他

总结两句话:
1、保障业务长期稳定运行(如网站服务器、游戏服务器等)。
2、保障数据安全可靠(如用户名密码、游戏数据、博客文章、交易数据等)。

由这两句话推演运维工程师要学些什么?

稳定

出一点点差错,用户就要投诉了。

1、业务跑在什么上面?
网站服务器一般是apache,nginx,tomcat等。但是真正跑通流程还需要Mysql数据库来存储用户密码及其它。很多程序都要php的解析,所以LNMP、LAMP(即nginx、apache、mysql、php)环境部署是必须掌握的技能。

2、业务出了问题怎么及时知道?
这就需要监控软件来邮件或短信来通知你,常用的有zabbix,nagios等。报警发邮件,也得一个邮件程序呀,sendmail或postfix。

3、在家里收到报警,但服务器是内网IP,怎么也得解决问题吧?
在公司搭建openvpn或pptp或openswan,在家里通过VPN拨入内网,24小时解决问题…唉,半夜爬起来解决问题也没工资。

安全

出一点点差错,领导要找你喝茶了。

1、有时需要手动改数据库内容?
所以要会基本的Mysql数据库增删查改命令。

2、万一数据库服务器硬件坏了怎么办?
需要有个备库以备不时之需,所以需要Mysql主从复制。

3、数据库要还原怎么办?
所以需要在crond中定期全备Mysql数据,以便还原使用。如果要还原到指定时间点,还要学会Mysql增量备份与恢复。

4、如果是用户上传的图片或文件服务器坏了怎么办?
定时备份可能还不够,需要使用rsync加inotify来实时备份。以便任一时刻主服务器坏掉,也能保障所有图片有备份可以用来恢复。

5、小心黑客,要增加服务器安全性?
ssh轻易不能让外人访问,那么就设置只允许公司的IP或跳板机IP访问,这些都通过iptables来控制。

6、说一下你们公司怎么发版的(代码怎么发布的)?
笔者回答:我说什么来着,这个问题又问到了。发布:jenkins配置好代码路径(SVN或GIT),然后拉代码,打tag。需要编译就编译,编译之后推送到发布服务器(jenkins里面可以调脚本),然后从分发服务器往下分发到业务服务器上。

7、如果你们公司的网站访问很慢,你会如何排查?
其实这种问题都没有具体答案,只是看你回答的内容与面试官契合度有多高,能不能说到他想要的点上,主要是看你排查问题的思

本文标签: 工程师内容工作