Zabbix监控进程日志的配置过程-创新互联
监控日志是运维人员日常生活里必不可少的一个环节,而且日志是一个进程执行的重中之重,由于日志记录了程序运行的吃喝拉撒所有事件,所以在故障排除的时候,结合日志找障碍点是必不可少的!而且我们也会要主动去被提醒日志里的几个重点词语,比如“ERROR!”,比如“WARINIG!”,比如“Alarm!”,比如“女排姑娘好样的你们真给国家争气,看这些女排妹子真喜欢一个个都是大长腿美颜外加D罩杯”。而zabbix作为一个优秀的监控软件,就可以当以上几个关键词出现在日志的第一时间或报警或记录。
成都创新互联凭借在网站建设、网站推广领域领先的技术能力和多年的行业经验,为客户提供超值的营销型网站建设服务,我们始终认为:好的营销型网站就是好的业务员。我们已成功为企业单位、个人等客户提供了成都网站设计、成都做网站、外贸网站建设服务,以良好的商业信誉,完善的服务及深厚的技术力量处于同行领先地位。举个例子,假设我们要监控一个进程日志,这个进程叫mrs,这个是我公司内部用的是一个程序。而目标就是当这个mrs.log日志里出现ERROR的时候,就要报警,通知悲摧的运维和开发pl们。
首先我们先建立一个item,如图:
注意一下,这里的type是active,因为被监控的服务器是需要主动把日志送给server端的。而key写的是log[/mnt/hswx/mrs/logs/mrs.log,ERROR,,,skip,],我这里详细说一下。
log这个key的格式是这样的:log[file,
由于在这里我们只需要挑出"ERROR"的语句,后面的那些七七八八都用不上,所以就直接写log[/mnt/hswx/mrs/logs/mrs.log,ERROR,,,skip,]就好了。如果要挑选“ERROR 或者 error”,那么就是log[/mnt/hswx/mrs/logs/mrs.log,(ERROR|error),,,skip,]
日志的格式选择“log”,每10秒钟一次更新,保存90天,这些都是老话常谈。至于Log time format写成yyyy-MM-dd hh:mm:ss是规范了纪录时间的格式,我们采用的格式就是“年-月-日:小时-分钟-秒”,一会就会看到效果。
写完之后,保存,返回到Monitoring---lastest Data,找到我们刚刚建立的这个item,
点击右侧的history,就可以看到这样的内容了。
这里的local time就是我们设置item时候的那个log time format,它也的确是按着“年-月-日:小时-分钟-秒”这个格式记录的。
我们可以看到value里说18:39:53有一个ERROR日志,那么登陆到这台服务器上,去服务器的mrs.log里看一下是否有这样一模一样的日志内容呢?
可以看到内容是一模一样的,就这样,我们达到了监控日志的目的!
然后就是根据这个item设定trigger和action,这些东西看个人具体需求我也就不赘述了。这里说几个常用的trigger:
{Template名称:keyi名称].str(ABC)}=1 表示如果匹配到“ABC”关键字,表达式为真。这个与上面那个key合用就是在ERROR的语句里是否含有ABC,如果有,就是真。 {Template名称:keyi名称].nodata(60)}=0 表示60秒内有数据产生则表达式为真,即60秒内如果没有新数据了,则表达式为假。具体的trigger表达式:{Template App Java logs:log[/app/wutongshu/monitorlog/error.log,ERROR,,,skip,].str(ERROR)}=1 and {Template App Java logs:log[/app/wutongshu/monitorlog/error.log,ERROR,,,skip,].nodata(60)}=0
当然有人会有提问,日志文件在实际生产的时候是常常需要被切割的,比如这个mrs.log,总不会永无止境的保存下去,而是会按时间/大小切成mrs.log.1、mrs.log.2...,既然这样怎么办?那么就要用logrt这个key,这个key是支持正则表达式的,针对上面这个情况我们只需要把原来的key改成“logrt[/绝对路径/mrs.log.*,ERROR,,,,]”就可以啦。
但是要注意哦,logrt只能给文件增加正则表达式,对路径是不支持的~~
如果配置了之后,监控日志没有正确运行,调日志看一下,如果日志显示:
14523:20171214:152022.958 active check "监控日志的KEY" is not supported: Cannot obtain information for file "要监控的文件名.log": [13] Permission denied那么需要把文件所在的路径都要开r权限。
如果日志里有:
2972:20171214:144031.449 no active checks on server [zabbix服务器IP:10051]: host [服务器hostname] not found那么检查在agentd.conf里的Hostname与web端的host的名称是否一致,这个必须要一致,不然active模式是不会好使的(非active模式没关系)。
另外有需要云服务器可以了解下创新互联cdcxhl.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。
文章名称:Zabbix监控进程日志的配置过程-创新互联
标题路径:http://cdiso.cn/article/djhhis.html