打印
[ZLG-ARM]

linux系统基于cacti的监控和报警

[复制链接]
1143|2
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
lpczcy|  楼主 | 2009-6-4 13:54 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
一、监控基础 snmp和rrdtool的编译安装和汉化 
1、snmpd的安装简单,掠过 
提示:由于硬件防火墙原因,可能导致异地的udp包有问题 
提供下修改snmp端口的方法: 
snmpd tcp:端口或snmpd udp:端口 
也可以直接在linux修改:/etc/rc.d/init.d/snmpd 
例如更改为 tcp协议:100001端口 
如下: 
修改前 
OPTIONS='  -s -l /dev/null -P /var/run/snmpd -a' 
修改后 
OPTIONS=' tcp:100001 -s -l /dev/null -P /var/run/snmpd -a' 
然后 
/etc/rc.d/init.d/snmpd restart 就ok了 
2、rrdtool 
如果没有汉化的要求,最好安装rpm包。 
注意:安装时要一起安装,否则可能会出错:rpm -ivh perl-rrdtool-1.2.23-1.el5.rf.i386.rpm rrdtool-1.2.23-1.el5.rf.i386.rpm 
要求支持mbstring,mbstring需要libmbfl库,Cacti使用了pcre,所以在自己编译的时候,一定要加入--with-pcre-regex --with-mbstring  --with-libmbfl三项,都无需指定路径(切记). 
自己编译: 
cp /usr/local/server/libpng/lib/pkgconfig/libpng12.pc /usr/local/server/libpng/lib/pkgconfig/libpng.pc /usr/local/server/freetype/lib/pkgconfig/freetype2.pc /usr/local/server/fontconfig/lib/pkgconfig/fontconfig.pc /usr/lib/pkgconfig/ 

3、cacti的安装和使用 
基础应用: 
解压到web目录下, 
执行   mysql -uroot -p cacti < cacti.sql  
vi include/config.php 更改数据库的连接信息 
建议新建一个用户newuser,把cacti下rrd和log目录权限给新用户, 
新建任务 crontab -u newuser -e 
添加下面这条  */5 * * * * /usr/local/server/php5/bin/php /usr/local/server/www/cacti/poller.php > /dev/null 2>&1 
到此,基础应用已经可以了。 
另外需要配置被监控主机的snmp 密码 等信息: 
vi /etc/snmp/snmpd.conf 
更改  
1、com2sec notConfigUser  default       public 
改为:com2sec notConfigUser   127.0.0.1(改成监控服务器的ip)       public(改成自己的密码) 
2、access  notConfigGroup ''      any       noauth    exact  systemview  none none 
改为:access  notConfigGroup ''      any       noauth    exact  all  none  none 
3、#view all    included  .1         80 
将前面的 # 注释 去掉。 

二、晋级应用 
1、监控windows主机: 
需要在windows上面安装snmp简单网络管理协议 
(1)、打开“控制面板”—“添加删除程序”—“添加删除组建”,在“管理和监视工具”中选中“简单网络管理协议(snmp)”,点击“下一步”,开始安装,在安装过程中需要i386文件 
(2)、打开“开始”—“程序”—“管理工具”—“服务”,找到“snmp service”,右键打开“属性”,选择“安全”,在“接受团体名称”处,点“添加”,在“团体名称”处写入你的cacti使用的community,选中“接受来自这些主机的snmp数据包”,默认值为“localhost”,点击“编辑”,将“localhost”改为cacti监控服务器的实际 ip地址 
2、监控linux主机 
需要修改net-snmp的配置文件:否则不能取到CPU和系统负载的数据 
Linux(RedHat)的配置 
打开默认的/etc/snmp/snmpd.conf文件,更改如下配置: 
(1)、查找以下字段: 
# sec.name source community 
com2sec notConfigUser default public 
将'comunity'字段改为你要设置的密码.比如'public'. 
将“default”改为你想哪台机器可以看到你的snmp信息,如10.10.10.10。 
(2)、查找以下字段: 
# group context sec.model sec.level prefix read write notif 
access notConfigGroup '' any noauth exact all none none 
将'read'字段改为all. 
(3)、查找以下字段: 

## incl/excl subtree mask 
#view all included .1 80 
将该行前面的'#'去掉. 
保存关闭. 
(4)、运行/etc/init.d/snmpd start命令运行snmpd. 
最后运行netstat -ln查看161端口是否打开了. 
3、FreeBSD 
如果使用port安装net-snmp,默认的配置文件应该是在/usr/local/share/snmp/snmpd.conf(没有默认的文件)。 
可以建立一个简单的配置文件,如: 

syslocation YourDefineName 
syscontact YourEmailAddress 
sysservices 77 
rocommunity public (请更改) 
load 12 12 12 

然后运行snmpd,netstat 看是否打开了161端口。 

4、监控squid服务器: 
(1).最开始,要让squid支持snmp。编辑squid.conf 
#vi /etc/squid/squid.conf 
acl CactiServer src 127.0.0.1 //写本机,因为要用net-snmp做代理 
acl SNMP snmp_community passwd 
snmp_port 3401 
snmp_access allow SNMP CactiServer 
snmp_access deny ALL 
#squid -k reconfigure 
重新载入配置 
使用netstat -tunlp |grep squid 
查看是否监听3401端口。 
测试一下squid的snmp是不是正常,要安装一个snmp的工具包 
#yum install -y net-snmp-utils 
#snmpwalk -v 1 -c passwd localhost:3401 .1.3.6.1.4.1.3495.1 
这个有数据出来才对,没有的话,检查上面的配置. 
(2).在snmpd.conf中代理squid的snmp 
#vim /etc/snmp/snmpd.conf 
添加以下行至snmpd.conf 
#proxy -v 1 -c passwd 127.0.0.1:3401 .1.3.6.1.4.1.3495.1 
测试一下.看看有没有数据 
#snmpwalk -v 1 -c passwd localhost:161 .1.3.6.1.4.1.3495.1 
(3).在cacti中导入别人写好的squid模板 
下载地址:http://forums.cacti.net/download.php?id=79 
1)把以下文件拷贝到此目录 <cacti_path>/resource/snmp_queries: 
webcache_squid_core.xml 
webcache_squid_median.xml 
2)在Cacti的配置界面“Import Templates”中导入cacti_host_template_webcache_squid_server_snmp.xml 
(4).squid的所有信息都能画出图来。 
安装就完成了。 
1)在“Devices”选项中添加新主机,注意“Host Template”选择'squid sever'。就是导入进的那个.并注意填写以下内容: 
SNMP Community = passwd 
SNMP Version = 1 
SNMP Port = 3401 
2)在Cacti的'settings'里面, poller页的'Downed Host Detection'选择 Ping, 不要选择带有snmp字样的会出错. 
在你的设备主机的最下面会见到 
WebCache - Squid Statistics - Core (Verbose Query) Uptime Goes Backwards Success [1 Item, 1 Row] 
WebCache - Squid Statistics - Median Based (Verbose Query) Uptime Goes Backwards Success [3 Items, 3 Rows] 
注意: 
1.提示:'No SNMP data returned' 
可以尝试改变这个设置 
view systemview included .1.3.6.1.2.1.1 
为 
view systemview included .1.3.6.1.2.1 
2.Cacti不能生成图象.  
注意,主机设置中,一定是要活的。也就是讲icmp之类一定要能ping通. 
也可以尝试禁用掉存活检查。 

附:测试snmp抓取数据的方法: 
测试普通数据: 
snmpwalk -v 1 -c passwd  127.0.0.1:161 if 
snmpwalk -v 2c -c passwd  127.0.0.1:161 if 
测试squid数据: 
snmpwalk -v 1 -c passwd  127.0.0.1:3401 1.3.6.1.4.1.3495.1 
snmpwalk -v 2c -c passwd  127.0.0.1:3401 1.3.6.1.4.1.3495.1 
5、增加cacti插件的方法:为cacti系统安装Thold、Monitor等插件 
插件下载地址:http://cactiusers.org/downloads/ 
注意下载时注意相应版本,版本不对会产生问题。 
monitor插件,提供更简略、直观的设备状态图示; 
thold插件,提供设备异常预警。 
安装thold、monitor插件:注意要先备份一下 
(1)、安装Plugin Architecture补丁,安装后,才能启用thold、monitor插件 
shell> tar zxvf cacti-plugin-arch.tar.gz -C /var/www/cacti 
shell> cd /var/www/cacti/ 
shell> patch -p1 -N < cacti-plugin-arch/cacti-plugin-0.8.7a-PA-v2.1.diff 
shell> /opt/mysql/bin/mysql -u cactiuser -p cactidb < pa.sql 
(2)、安装thold、monitor插件 
shell> tar zxvf settings-0.5.tar.gz -C /var/www/cacti/plugins 
shell> tar zxvf thold-0.3.4.tar.gz -C /var/www/cacti/plugins 
shell> tar zxvf monitor-0.8.2.tar.gz -C /var/www/cacti/plugins 
shell> cd /var/www/cacti/plugins/ 
shell> /opt/mysql/bin/mysql -u cactiuser -p cactidb < thold/thold.sql 
shell> /opt/mysql/bin/mysql -u cactiuser -p cactidb < monitor/monitor.sql 
  
(3)、修改config.php配置文件 
shell> vi /var/www/cacti/include/config.php 
$config['url_path'] = '/cacti/';  //改为cacti对应于web目录下的路径,本处为cacti 
$plugins = array(); 
$plugins[] = thold; 
$plugins[] = monitor; 
(4)、刷新cacti系统的web管理界面,可以看到多出两个标签页(thold、monitor)。 
(5)、使用monitor插件 
1>打开“Console->Settings->Misc”,可以调整Monitor的各项配置。例如:勾选“Show Icon Legend”可以在监控页面显示图例; 
“View”可以选用Tiles类型,以显示设备状态表格。 
2>为cacti添加新设备时,勾选上“Monitor Host”项。对已添加的设备可以通过“Management->Devices”进去修改。 
3>单击Web页面上方的“monitor”标签链接,可以进入查看各设备/主机的状态图示。 
(6)、使用thold插件 
1>打开“Console->Settings->Mail/DNS”,可以调整“SMTP Options”和“DNS Options”等配置,用于确保预警邮件能够发出。 
2>打开“Console->Settings->Alerting/Thold”,可以调整Thold的各项配置。例如:“Dead Host Notifications Email”处可填写设备当机时发送警告信息到哪个邮箱;勾选“Send alerts as text”项,可以设置只发送文本格式的邮件。 
3>打开“Templates->Threshold Templates”,可以添加、取出需要关联到预警系统的模板,例如:可以添加和“Interface-Traffic”模板的关联,选择“traffic_in”、“traffic_out”数据项,分别设置警告阈值“High Threshold”(如200000000比特/秒);可以添加和“Unix-Disk Space”模板的关联……。 
4>打开“Create->New Graphs”,选择需要提供预警的设备,单击右侧上方的“Auto-create thresholds”创建预警项目。 
5>打开“Management->Thresholds”,可以管理已经创建的预警项目。 
6、cacti监控硬盘I/O的方法: 
cacti本身的模板只可以监控硬盘的使用大小,而不能监控使用百分率,所以我们可以自定义cdef来监控硬盘使用率,并借助thold插件实现报警功能。网上找的资料都是在cacti.0.8.6版上实现的,而我用的是cacti.0.8.7版。因此,根据实际情况做如下改动: 
在cacti目录下,vi global_arrays.php 
搜索custom_data_source_types,修改这一段如下: 
$custom_data_source_types = array( 
        'CURRENT_DATA_SOURCE' => 'Current Graph Item Data Source', 
        'ALL_DATA_SOURCES_NODUPS' => 'All Data Sources (Don't Include Duplicates)', 
        'ALL_DATA_SOURCES_DUPS' => 'All Data Sources (Include Duplicates)', 
        'SIMILAR_DATA_SOURCES_NODUPS' => 'All Similar Data Sources (Don't Include Duplicates)', 
        'SIMILAR_DATA_SOURCES_DUPS' => 'All Similar Data Sources (Include Duplicates)', 
        'CURRENT_DS_MINIMUM_VALUE' => 'Current Data Source Item: Minimum Value', 
        'CURRENT_DS_MAXIMUM_VALUE' => 'Current Data Source Item: Maximum Value', 
        'CURRENT_GRAPH_MINIMUM_VALUE' => 'Graph: Lower Limit', 
//添加以下两行 
'CURRENT_GRAPH_MAXIMUM_VALUE' => 'Graph: Upper Limit', 
        'VALUE_OF_HDD_TOTAL' => 'Value of hdd_total data source'); 
//中文版汉化为: 
        'CURRENT_GRAPH_MAXIMUM_VALUE' => '图像: 上限', 
        'VALUE_OF_HDD_TOTAL' => '所有硬盘数据的值'); 
在cacti界面的Graph Management-cdefs新建cdef模块,名字自己起,添加字段如下: 
Item #1 Special Data Source: CURRENT_DATA_SOURCE      
Item #2 Custom String: 100      
Item #3 Operator: *      
Item #4 Special Data Source: VALUE_OF_HDD_TOTAL      
Item #5 Operator: /  

也就是说 
cdef=CURRENT_DATA_SOURCE,100,*,VALUE_OF_HDD_TOTAL,/ 
  
这样就可以在Threshold Templates里面添加监控硬盘的模块了,我添加的是Host MIB - Hard Drive Space ,最后在Threshold CDEF里面选择刚自定义的cdef,这样就可以正常监控硬盘使用率了。 
官方论坛上有介绍,地址:http://forums.cacti.net/about8777-0-asc-0.html 
下面把使用方法摘录如下: 
1. Copy net-snmp_devio.xml to /resource/snmp_queries/net-snmp_devio.xml 
2. Import all *_templ.xml via Cacti 'Import Templates' interface - These templates should include all their dependancies 
3. Add 'ucd/net - Get Device I/O' Data Query to your SNMP Enabled host using the 'Index Count Changed' Re-index Method. 
4. Create Graphs for your desired Disk and/or Memory devices. 

总体注意事项: 
1)、很重要的一点:在cacti的设备中一定要选择snmp的版本为>=2,否则会获取不到cpu和网卡等相关信息。 
2)、cacti自带的local视图内存监控单位是错误的,可以删掉重新创建,就会改正。 
3)、系统监控中,cpu图标的 200m这类数字,表示的是 万分之多少,我的理解cacti是为了方便显示画图。 
4)、权限问题:cacti_path/rra log目录的权限一定要给cacti的新用户,否则会出错:有图,但是没有数据。
 
   

相关帖子

沙发
miclinux| | 2009-6-4 14:02 | 只看该作者

很好,顶

使用特权

评论回复
板凳
billen| | 2009-6-4 15:56 | 只看该作者

很好,不错

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

42

主题

77

帖子

0

粉丝