也说说监控
最近在用空闲时间看十月份就买的《SRE:Google运维解密》,说到IT监控就有了话题;
自从08年来到魔都,第一份工作就是运维监控,是中软的外派工,常驻太保南汇机房,对IT硬件、存储、网络、磁带机、大型机等硬件设备有了一个直观的认识;
金融保险行业的IT监控主要是从软硬两方面来做的,每天机房、机器巡检、空调温度、状态等这些都是硬件方面,此处不做过描述。
软件方面那会基本大部分是商业监控工具,时间太久名字都记不清了,总之会对服务器各个状态进行监控,根据状态阈值进行事件等级自动升级等等,比较完善;
游戏行业就多了,各类开源工具,nagios、cacti、zenoss、zabbix等等,也有一些公司自己基于开源工具自己开发的,最近几年zabbix使用率比较高;
对于运维来说,不管是那个行业,监控是必不可少的,基本是运维的眼睛了,这点Google的SRE也不例外,不过他们更多的是把监控工具当作软件工程来做,精细化很高,基本成了业内的标杆,国内做到这点的公司不多;事故萌芽期、高峰期等等,是分析系统的瓶颈、故障的利器。
Tag标签:「监控」更新时间:「2021-11-04 23:32:14」阅读次数:「730」