一、监控基础 snmp和rrdtool的编译安装和汉化 1、snmpd的安装简单,掠过 提示:由于硬件防火墙原因,可能导致异地的udp包有问题 提供下修改snmp端口的方法: snmpd tcp:端口或snmpd udp:端口 也可以直接在linux修改:/etc/rc.d/init.d/snmpd 例如更改为 tcp协议:100001端口 如下: 修改前 OPTIONS=' -s -l /dev/null -P /var/run/snmpd -a' 修改后 OPTIONS=' tcp:100001 -s -l /dev/null -P /var/run/snmpd -a' 然后 /etc/rc.d/init.d/snmpd restart 就ok了 2、rrdtool 如果没有汉化的要求,最好安装rpm包。 注意:安装时要一起安装,否则可能会出错:rpm -ivh perl-rrdtool-1.2.23-1.el5.rf.i386.rpm rrdtool-1.2.23-1.el5.rf.i386.rpm 要求支持mbstring,mbstring需要libmbfl库,Cacti使用了pcre,所以在自己编译的时候,一定要加入--with-pcre-regex --with-mbstring --with-libmbfl三项,都无需指定路径(切记). 自己编译: cp /usr/local/server/libpng/lib/pkgconfig/libpng12.pc /usr/local/server/libpng/lib/pkgconfig/libpng.pc /usr/local/server/freetype/lib/pkgconfig/freetype2.pc /usr/local/server/fontconfig/lib/pkgconfig/fontconfig.pc /usr/lib/pkgconfig/
3、cacti的安装和使用 基础应用: 解压到web目录下, 执行 mysql -uroot -p cacti < cacti.sql vi include/config.php 更改数据库的连接信息 建议新建一个用户newuser,把cacti下rrd和log目录权限给新用户, 新建任务 crontab -u newuser -e 添加下面这条 */5 * * * * /usr/local/server/php5/bin/php /usr/local/server/www/cacti/poller.php > /dev/null 2>&1 到此,基础应用已经可以了。 另外需要配置被监控主机的snmp 密码 等信息: vi /etc/snmp/snmpd.conf 更改 1、com2sec notConfigUser default public 改为:com2sec notConfigUser 127.0.0.1(改成监控服务器的ip) public(改成自己的密码) 2、access notConfigGroup '' any noauth exact systemview none none 改为:access notConfigGroup '' any noauth exact all none none 3、#view all included .1 80 将前面的 # 注释 去掉。
二、晋级应用 1、监控windows主机: 需要在windows上面安装snmp简单网络管理协议 (1)、打开“控制面板”—“添加删除程序”—“添加删除组建”,在“管理和监视工具”中选中“简单网络管理协议(snmp)”,点击“下一步”,开始安装,在安装过程中需要i386文件 (2)、打开“开始”—“程序”—“管理工具”—“服务”,找到“snmp service”,右键打开“属性”,选择“安全”,在“接受团体名称”处,点“添加”,在“团体名称”处写入你的cacti使用的community,选中“接受来自这些主机的snmp数据包”,默认值为“localhost”,点击“编辑”,将“localhost”改为cacti监控服务器的实际 ip地址 2、监控linux主机 需要修改net-snmp的配置文件:否则不能取到CPU和系统负载的数据 Linux(RedHat)的配置 打开默认的/etc/snmp/snmpd.conf文件,更改如下配置: (1)、查找以下字段: # sec.name source community com2sec notConfigUser default public 将'comunity'字段改为你要设置的密码.比如'public'. 将“default”改为你想哪台机器可以看到你的snmp信息,如10.10.10.10。 (2)、查找以下字段: # group context sec.model sec.level prefix read write notif access notConfigGroup '' any noauth exact all none none 将'read'字段改为all. (3)、查找以下字段:
## incl/excl subtree mask #view all included .1 80 将该行前面的'#'去掉. 保存关闭. (4)、运行/etc/init.d/snmpd start命令运行snmpd. 最后运行netstat -ln查看161端口是否打开了. 3、FreeBSD 如果使用port安装net-snmp,默认的配置文件应该是在/usr/local/share/snmp/snmpd.conf(没有默认的文件)。 可以建立一个简单的配置文件,如:
syslocation YourDefineName syscontact YourEmailAddress sysservices 77 rocommunity public (请更改) load 12 12 12
然后运行snmpd,netstat 看是否打开了161端口。
4、监控squid服务器: (1).最开始,要让squid支持snmp。编辑squid.conf #vi /etc/squid/squid.conf acl CactiServer src 127.0.0.1 //写本机,因为要用net-snmp做代理 acl SNMP snmp_community passwd snmp_port 3401 snmp_access allow SNMP CactiServer snmp_access deny ALL #squid -k reconfigure 重新载入配置 使用netstat -tunlp |grep squid 查看是否监听3401端口。 测试一下squid的snmp是不是正常,要安装一个snmp的工具包 #yum install -y net-snmp-utils #snmpwalk -v 1 -c passwd localhost:3401 .1.3.6.1.4.1.3495.1 这个有数据出来才对,没有的话,检查上面的配置. (2).在snmpd.conf中代理squid的snmp #vim /etc/snmp/snmpd.conf 添加以下行至snmpd.conf #proxy -v 1 -c passwd 127.0.0.1:3401 .1.3.6.1.4.1.3495.1 测试一下.看看有没有数据 #snmpwalk -v 1 -c passwd localhost:161 .1.3.6.1.4.1.3495.1 (3).在cacti中导入别人写好的squid模板 下载地址:http://forums.cacti.net/download.php?id=79 1)把以下文件拷贝到此目录 <cacti_path>/resource/snmp_queries: webcache_squid_core.xml webcache_squid_median.xml 2)在Cacti的配置界面“Import Templates”中导入cacti_host_template_webcache_squid_server_snmp.xml (4).squid的所有信息都能画出图来。 安装就完成了。 1)在“Devices”选项中添加新主机,注意“Host Template”选择'squid sever'。就是导入进的那个.并注意填写以下内容: SNMP Community = passwd SNMP Version = 1 SNMP Port = 3401 2)在Cacti的'settings'里面, poller页的'Downed Host Detection'选择 Ping, 不要选择带有snmp字样的会出错. 在你的设备主机的最下面会见到 WebCache - Squid Statistics - Core (Verbose Query) Uptime Goes Backwards Success [1 Item, 1 Row] WebCache - Squid Statistics - Median Based (Verbose Query) Uptime Goes Backwards Success [3 Items, 3 Rows] 注意: 1.提示:'No SNMP data returned' 可以尝试改变这个设置 view systemview included .1.3.6.1.2.1.1 为 view systemview included .1.3.6.1.2.1 2.Cacti不能生成图象. 注意,主机设置中,一定是要活的。也就是讲icmp之类一定要能ping通. 也可以尝试禁用掉存活检查。
附:测试snmp抓取数据的方法: 测试普通数据: snmpwalk -v 1 -c passwd 127.0.0.1:161 if snmpwalk -v 2c -c passwd 127.0.0.1:161 if 测试squid数据: snmpwalk -v 1 -c passwd 127.0.0.1:3401 1.3.6.1.4.1.3495.1 snmpwalk -v 2c -c passwd 127.0.0.1:3401 1.3.6.1.4.1.3495.1 5、增加cacti插件的方法:为cacti系统安装Thold、Monitor等插件 插件下载地址:http://cactiusers.org/downloads/ 注意下载时注意相应版本,版本不对会产生问题。 monitor插件,提供更简略、直观的设备状态图示; thold插件,提供设备异常预警。 安装thold、monitor插件:注意要先备份一下 (1)、安装Plugin Architecture补丁,安装后,才能启用thold、monitor插件 shell> tar zxvf cacti-plugin-arch.tar.gz -C /var/www/cacti shell> cd /var/www/cacti/ shell> patch -p1 -N < cacti-plugin-arch/cacti-plugin-0.8.7a-PA-v2.1.diff shell> /opt/mysql/bin/mysql -u cactiuser -p cactidb < pa.sql (2)、安装thold、monitor插件 shell> tar zxvf settings-0.5.tar.gz -C /var/www/cacti/plugins shell> tar zxvf thold-0.3.4.tar.gz -C /var/www/cacti/plugins shell> tar zxvf monitor-0.8.2.tar.gz -C /var/www/cacti/plugins shell> cd /var/www/cacti/plugins/ shell> /opt/mysql/bin/mysql -u cactiuser -p cactidb < thold/thold.sql shell> /opt/mysql/bin/mysql -u cactiuser -p cactidb < monitor/monitor.sql (3)、修改config.php配置文件 shell> vi /var/www/cacti/include/config.php $config['url_path'] = '/cacti/'; //改为cacti对应于web目录下的路径,本处为cacti $plugins = array(); $plugins[] = thold; $plugins[] = monitor; (4)、刷新cacti系统的web管理界面,可以看到多出两个标签页(thold、monitor)。 (5)、使用monitor插件 1>打开“Console->Settings->Misc”,可以调整Monitor的各项配置。例如:勾选“Show Icon Legend”可以在监控页面显示图例; “View”可以选用Tiles类型,以显示设备状态表格。 2>为cacti添加新设备时,勾选上“Monitor Host”项。对已添加的设备可以通过“Management->Devices”进去修改。 3>单击Web页面上方的“monitor”标签链接,可以进入查看各设备/主机的状态图示。 (6)、使用thold插件 1>打开“Console->Settings->Mail/DNS”,可以调整“SMTP Options”和“DNS Options”等配置,用于确保预警邮件能够发出。 2>打开“Console->Settings->Alerting/Thold”,可以调整Thold的各项配置。例如:“Dead Host Notifications Email”处可填写设备当机时发送警告信息到哪个邮箱;勾选“Send alerts as text”项,可以设置只发送文本格式的邮件。 3>打开“Templates->Threshold Templates”,可以添加、取出需要关联到预警系统的模板,例如:可以添加和“Interface-Traffic”模板的关联,选择“traffic_in”、“traffic_out”数据项,分别设置警告阈值“High Threshold”(如200000000比特/秒);可以添加和“Unix-Disk Space”模板的关联……。 4>打开“Create->New Graphs”,选择需要提供预警的设备,单击右侧上方的“Auto-create thresholds”创建预警项目。 5>打开“Management->Thresholds”,可以管理已经创建的预警项目。 6、cacti监控硬盘I/O的方法: cacti本身的模板只可以监控硬盘的使用大小,而不能监控使用百分率,所以我们可以自定义cdef来监控硬盘使用率,并借助thold插件实现报警功能。网上找的资料都是在cacti.0.8.6版上实现的,而我用的是cacti.0.8.7版。因此,根据实际情况做如下改动: 在cacti目录下,vi global_arrays.php 搜索custom_data_source_types,修改这一段如下: $custom_data_source_types = array( 'CURRENT_DATA_SOURCE' => 'Current Graph Item Data Source', 'ALL_DATA_SOURCES_NODUPS' => 'All Data Sources (Don't Include Duplicates)', 'ALL_DATA_SOURCES_DUPS' => 'All Data Sources (Include Duplicates)', 'SIMILAR_DATA_SOURCES_NODUPS' => 'All Similar Data Sources (Don't Include Duplicates)', 'SIMILAR_DATA_SOURCES_DUPS' => 'All Similar Data Sources (Include Duplicates)', 'CURRENT_DS_MINIMUM_VALUE' => 'Current Data Source Item: Minimum Value', 'CURRENT_DS_MAXIMUM_VALUE' => 'Current Data Source Item: Maximum Value', 'CURRENT_GRAPH_MINIMUM_VALUE' => 'Graph: Lower Limit', //添加以下两行 'CURRENT_GRAPH_MAXIMUM_VALUE' => 'Graph: Upper Limit', 'VALUE_OF_HDD_TOTAL' => 'Value of hdd_total data source'); //中文版汉化为: 'CURRENT_GRAPH_MAXIMUM_VALUE' => '图像: 上限', 'VALUE_OF_HDD_TOTAL' => '所有硬盘数据的值'); 在cacti界面的Graph Management-cdefs新建cdef模块,名字自己起,添加字段如下: Item #1 Special Data Source: CURRENT_DATA_SOURCE Item #2 Custom String: 100 Item #3 Operator: * Item #4 Special Data Source: VALUE_OF_HDD_TOTAL Item #5 Operator: /
也就是说 cdef=CURRENT_DATA_SOURCE,100,*,VALUE_OF_HDD_TOTAL,/ 这样就可以在Threshold Templates里面添加监控硬盘的模块了,我添加的是Host MIB - Hard Drive Space ,最后在Threshold CDEF里面选择刚自定义的cdef,这样就可以正常监控硬盘使用率了。 官方论坛上有介绍,地址:http://forums.cacti.net/about8777-0-asc-0.html 下面把使用方法摘录如下: 1. Copy net-snmp_devio.xml to /resource/snmp_queries/net-snmp_devio.xml 2. Import all *_templ.xml via Cacti 'Import Templates' interface - These templates should include all their dependancies 3. Add 'ucd/net - Get Device I/O' Data Query to your SNMP Enabled host using the 'Index Count Changed' Re-index Method. 4. Create Graphs for your desired Disk and/or Memory devices.
总体注意事项: 1)、很重要的一点:在cacti的设备中一定要选择snmp的版本为>=2,否则会获取不到cpu和网卡等相关信息。 2)、cacti自带的local视图内存监控单位是错误的,可以删掉重新创建,就会改正。 3)、系统监控中,cpu图标的 200m这类数字,表示的是 万分之多少,我的理解cacti是为了方便显示画图。 4)、权限问题:cacti_path/rra log目录的权限一定要给cacti的新用户,否则会出错:有图,但是没有数据。
|