记一次nagios故障及解决
情景如下:
10多年的聂荣网站建设经验,针对设计、前端、开发、售后、文案、推广等六对一服务,响应快,48小时及时工作处理。网络营销推广的优势是能够根据用户设备显示端的尺寸不同,自动调整聂荣建站的显示方式,使网站能够适用不同显示终端,在浏览器中调整网站的宽度,无论在任何一种浏览器上浏览网站,都能展现优雅布局与设计,从而大程度地提升浏览体验。创新互联公司从事“聂荣网站设计”,“聂荣网站推广”以来,每个客户项目都认真落实执行。
OS: Ubuntu 12.04 LTS x86_64;
Nagios版本3.2.3;
Nagiosql版本3.2.0;
Pnp4nagios版本0.6.13;
虚拟机,四核,1.5内存;
模式:被动监控
监控主机数量:169
监控服务数量:745
绘图数量:923 (find /var/lib/pnp4nagios/perfdata -name "*.rrd"|wc -l)
绘图模式:Synchronous mode
故障现象: 报警和监控持续性延迟,但绘图正常,各种调优依然无解;关闭pnp4nagios绘图之后,监控和报警立刻恢复正常;个人感觉像是监控和绘图在争抢系统资源;
解决方法: 更改pnp4nagios绘图模式为bulk-npcd即可.
简单叙述一下,个人对pnp4nagios的几种绘图模式工作原理的理解:
第一种:synchronous mode 中文:同步模式 。 个人理解,只要接收到数据,就立刻绘图,如下图:
第二种:bulk mode中午:容器模式。个人理解,把需要绘图的数据做一下转存先,到达一定的量,再绘图,听说这种方式再同时要处理比较多的数据时会造成超时;可以通过修改特定参数缓解。如下图:
第三种:bulk mode with npcd 中文:由npcd来管理的bulk模式。 个人理解: 等同于第二种,但是由npcd来管理何时绘图,笔者的解决方案就是这种。见下图:
第四种: Bulk Mode with npcdmod ;以nagios模块化运行npcd,但貌似官网介绍说不支持nagios4,笔者也未做过多的测试,见下图:
第五种: Gearman Mode..不知道怎么翻译...看官方说的很牛的样子,能让pnp4nagios和nagios分布在不同的机器上,笔者未做深入了解,有兴趣去官网吧...见下图:
更改方法参考pnp4nagios官网即可。
参考:
http://docs.pnp4nagios.org/pnp-0.6/modes
http://www.360doc.com/content/11/0810/11/1208969_139346861.shtml
当前标题:记一次nagios故障及解决
文章出自:http://cdiso.cn/article/jeopih.html