Ein unangenehmes Phänomen bei NFS-gemounteten Filesysteme tritt auf, wenn der Fileserver abstürzt oder ein Netzwerkproblem zwischen NFS-Server und -Client besteht. Sämtliche Prozesse, die auf Dateien auf so einem Filesystem zugreifen wollen, bleiben einfach hängen. Das gilt auch für Nagios-Plugins. Nach Ablauf des Timeouts wird der Nagios-Kernel den Plugin-Prozess zwar abschiessen, jedoch bleibt dieser in der Prozessliste und zwar so lange, bis der NFS-Server wieder antwortet.

more...

Author:Admin
Tags:Nagios, nfs
Categories:nagios

Es gibt ein neues Mitglied in der check_<datenbank>_health-Familie. Nach Oracle, MS SQL und MySQL habe ich mir DB2 vorgenommen und ein Plugin geschrieben, das leicht erweiterbar ist und grundlegende Anforderungen out of the box abdeckt.

more...

Author:Gerhard Laußer
Tags:DB2, Nagios, Plugins
Categories:nagios

Im Rahmen des Münchner Nagios-Stammtisches hielt Roland Huß gestern einen Vortrag über sein Framework Jmx4Perl. Mittlerweile haben sich mehrere Leute erkundigt, wie die Service- und Commanddefinitionen für das dazugehörige Plugin check_jmx4perl aussehen könnten. Deshalb soll hier erläutert werden, wie man ein paar grundlegende Messwerte aus einem Applicationserver ausliest und mit Nagios überwacht.

more...

Author:Gerhard Laußer
Tags:check_jmx4perl, Jmx4Perl, Nagios
Categories:jmx4perl

Die check_[datenbank]_health-Plugins lassen sich leicht in ihrem Funktionsumfang erweitern, indem sie zur Laufzeit Zusatzmodule einlesen. Dieses Feature wurde eingebaut, damit für vorhandenen, u.U. firmenspezifischen Code kein eigenes Plugin geschrieben werden muss. Man steckt ihn einfach in Dateien, die einer bestimmten Namenskonvention folgen.
Als Beispiel soll hier gezeigt werden, wie man das Alter des letzten Backups einer Datenbank überwacht.

more...

Author:Gerhard Laußer
Tags:Backup, check_mssql_health, Nagios, SQL Server
Categories:nagios

Das Redesign von check_hpasm (Hauptgrund war die Unterstützung der neuen Proliant *G6) ist nun doch umfangreicher geworden, als ich dachte. Dafür ist der Code jetzt um einiges wartbarer und ermöglicht es, neue Features schneller und ohne Gefrickel einzubauen. Geplant ist ausserdem die Unterstützung von HP BladeCenter und Storagesystemen (Proliant 4LEE). Ein erstes Testrelease ist nun fertig.

more...

Author:Gerhard Laußer
Tags:check_hpasm, Nagios, Plugins, proliant
Categories:nagios
check_mssql_health 1.5.3

Eine neue Version von check_mssql_health ist soeben erschienen. In erster Linie wurde ein Bug im Mode database-free beseitigt, der zu ungenauen bzw. falschen Ergebnissen führte, wenn der freie Plattenplatz knapp wurde.
Daneben wurde der neue Mode database-backup-age eingeführt, mit dem sich überwachen lässt, wie lange der Zeitpunkt des letzten Backups zurückliegt.

more...

Author:Gerhard Laußer
Tags:check_mssql_health, Nagios, Plugins
Categories:nagios

Betreibt man eine hochverfügbare Nagios-Installation mit dem Heartbeat-Cluster, so benötigt man für die einzelnen Softwarekomponenten (Resourcen genannt) Agenten, die sich um Start, Stop und Überwachung derselben kümmern. Folgendes Script ermöglicht die Einbindung des NDO2DB-Daemons in so einen Cluster. Dazu muss man es nur nach /usr/lib/ocf/resource.d/<heartbeat oder ein eigener Provider>/ndo2db kopieren.

Download: ndo2db

Author:Gerhard Laußer
Tags:cluster, heartbeat, Nagios, ndo, ndo2db, ocf
Categories:nagios

Das neue Release 4.0 von check_hpasm ist prinzipiell fertig und mit den Daten von über 500 Proliants getestet. Vorsichtshalber möchte ich aber noch eine letzte Testversion veröffentlichen. Hauptsächlich wurde die Erkennung von Speicherbausteinen verbessert. Vielen Maschinen, die bisher  “status of all * dimms is n/a (please upgrade firmware)” meldeten, werden nun durch ein paar Tricks doch noch die fehlenden Informationen entlockt bzw. mit Hilfe bisher unbeachteter OIDs rekonstruiert.

check_hpasm-4pre3.tar.gz

Author:Gerhard Laußer
Tags:check_hpasm, hpasm, Nagios, Plugins, proliant
Categories:nagios

Big news around: jmx4perl supports now an agentless mode in which the target platform can be monitored without installing the j4p agent servlet. This works by using j4p.war as a JMX Proxy, which translates our JSON/HTTP protocol on the frontside to JSR-160 JMX remote requests on the backend and vice versa.

more...

Author:Roland Huß
Tags:jmx, Jmx4Perl, Nagios, proxy
Categories:jmx4perl

As described in the last post jmx4perl can be operated in a so called agentless mode. For this to work, the target java server must be prepared for accepting remote JMX connections as described in JSR-160.

Unfortunately, this setup is not really standardized and specific to the Java JDK in use and the application server itself. In this post we concentrate on how to setup JMX remoting for JBoss.

more...

Author:Roland Huß
Tags:jboss, jmx, Jmx4Perl, jsr-160, Nagios
Categories:jmx4perl

jmx4perl knows since some time how to restrict access to the agent (and soon proxy) servlet based on various criteria. However, this feature is unfortunately not yet well documented and a little bit hidden. This blog describes the nifty details and future roadmap.

more...

Author:Roland Huß
Tags:jmx, Jmx4Perl, Nagios
Categories:jmx4perl

Nagios-Installationen, die über die Command Pipe Checkergebnisse von externen Kommandos entgegennehmen, sollten überprüfen, ob diese auch tatsächlich eintreffen und verarbeitet werden. Dieses Plugin schickt ein Testergebnis in die Pipe und sieht nach, ob im Logfile eine Bestätigung aufgetaucht ist.

<br />
$ check_nagios_external_commands -t 120 -p /usr/local/nagios/var/rw/nagios.cmd \<br />
    -l /usr/local/nagios/var/nagios.log<br />
WARNING - command took 23s|command_write=0.85s command_read=22s<br />

check_nagios_external_commands_0.1.tar

Author:Sven Nierlein
Tags:check_nagios_external_commands, Nagios
Categories:nagios

Statt zwei Wochen hat das Redesign von check_hpasm nun doch zwei Monate gedauert, aber dafür ist das Plugin für künftige Erweiterungen bestens gerüstet. Hinzugekommen ist die Unterstützung der neuen G6-Proliants und die Fähigkeit, auch HP BladeCenter (wenn auch nicht so detailliert) und HP Storage-Systeme überwachen zu können. Es wurden auch ein paar Verbesserungen an der (nicht ganz einfachen) Erkennung der Speichermodule vorgenommen. Bei einigen Anwendern dürften jetzt defekte Riegel ans Tageslicht kommen, deren Zustand sich mit der 3.x-Version nicht feststellen liess.

more...

Author:Gerhard Laußer
Tags:check_hpasm, hp, Nagios, proliant
Categories:nagios

In our series of articles about configuring remote JMX access for the jmx4perl proxy mode, this article tackles how to enable JMX remoting for Weblogic Server 9 and 10. It is not specific to jmx4perl and explains several different setups and possible problems.

more...

Author:Roland Huß
Tags:J2EE, jmx, Jmx4Perl, jsr-160, Nagios
Categories:jmx4perl

Das neueste Release von check_hpasm ermittelt jetzt nicht mehr nur den globalen Status der cpqRack-MIB eines BladeCenters, sondern liest die wichtigsten Tabellen detailliert aus. Aufgerufen mit -v liefert check_hpasm eine Übersicht der verbauten Komponenten samt deren Status. Und so sieht das dann aus:

more...

Author:Gerhard Laußer
Tags:Blade, BladeCenter, check_hpasm, cpqRack, hp, Nagios, Plugins
Categories:nagios
Jmx4perl Mule Agent

In its standalone mode, Mule provides a simple to use interface for custom agents to plug in. This blog post is about the new jmx4perl mule agent which can be used with jmx4perl and the Nagios check check_jmx4perl.

more...

Author:Roland Huß
Tags:check_jmx4perl, jmx, Jmx4Perl, Mule, Nagios
Categories:jmx4perl

Folgende Anfrage wurde von einem Kunden an mich gerichtet:

Jetzt kam von den Admin die Anfrage ob es nicht möglich ist alle Meldungen (winwarncrit) erstmal als Warning an Nagios zu melden, um dann bestimmte Meldungen nach und nach als Critical einzustufen, oder komplett zu verwerfen (exclude).
Geht das?

more...

Author:Gerhard Laußer
Tags:check_logfiles, Eventlog, Nagios
Categories:nagios

Es gibt mal wieder ein Update für check_hpasm, diesmal mit dem Schwerpunkt auf HP Bladesystems. Neu hinzugekommen ist die Überwachung von Sicherungen (Fuses) und Enclosure Managern. Ausserdem werden jetzt bei fehlerhaften Komponenten auch gleich die Spare-Part-Nummern angezeigt.

more...

Author:Gerhard Laußer
Tags:BladeCenter, check_hpasm, Nagios, Plugins, snmp
Categories:nagios

If you have defined services using the nrpe mechanism, you might know the following scenario:
The NRPE daemon fails and all services using it go critical. One first step to avoid these false alarms is to create an additional service which monitors the NRPE daemon itself (called check_nrpe_daemon in this example) and install a dependency between your services and check_nrpe_daemon.

more...

Author:Gerhard Laußer
Tags:Nagios, nrpe
Categories:nagios

Since version 0.70, check_jmx4perl has support for configuration files. JMX Nagios checks are now considerably simpler to configure and multi checks add even more performance and flexibility.

more...

Author:Roland Huß
Tags:check_jmx4perl, jmxp4erl, Nagios
Categories:jmx4perl, nagios
Thruk 0.70

Thruk 0.70 has been released at (download). The three major changes from user perspective are

  • side menu is completly adjustable by config file
  • excel export for hosts and services
  • search includes comments and downtimes

more...

Author:Sven Nierlein
Tags:Nagios, Thruk
Categories:nagios

Die Datenbank-Plugins check_oracle_health, check_mysql_health, check_mssql_health und check_db2_health unterstützen auf vielfachen Wunsch auch den Parameter --extra-opts. Damit ist es jetzt möglich, z.B. Login-Daten von den Kommandozeilenparametern in Konfigurationsdateien zu verlagern. Neben Environmentvariablen gibt es somit eine weitere Alternative, Passwörter aus der Prozessliste zu entfernen und dadurch vor neugierigen Blicken zu schützen.

more...

Author:Gerhard Laußer
Tags:check_mysql_health, extra-opts, Nagios, Plugins
Categories:nagios

A small Nagios plugin for monitoring search hit counts. Don’t take it too seriously.

more...

Author:Roland Huß
Tags:Nagios
Categories:nagios

OMD, the new star on the open monitoring scene, has been released in version 0.44 two weeks ago with a lot of enhancements and new addons.

more...

Mod-Gearman 1.0 released

Mod-Gearman 1.0 has been released (download).
About half a year after starting development of Mod-Gearman it’s time to finish main development and release the stable 1.0.

  • use gearman to spread the load of your nagios box onto several worker
  • avoid core blocking events like eventhandler
  • distribute writing performance data

more...

Author:Sven Nierlein
Tags:Distribution, Gearman, Nagios
Categories:nagios

Seit einigen Versionen ist check_oracle_health auch unter Windows lauffähig, was anscheinend nur wenig bekannt ist. In vielen Firmen ist auf den Arbeitsplatz-PCs ein Oracle-Client installiert, mit dem Applikationen auf die Unternehmensdatenbanken zugreifen. Es ist daher nur logisch, wenn beim Monitoring die Verfügbarkeit einer Datenbank aus der Sicht so eines PCs geprüft wird.

more...

Author:Gerhard Laußer
Tags:check_oracle_health, Nagios, oracle, windows
Categories:nagios

Wer sich die neueste Version von Icinga zum Ausprobieren herunterladen will, greift aus Bequemlichkeit sicher auf die virtuelle Maschine zurück, die bereits eine vorgefertigte, vollständige Installation enthält. Das dabei verwendete ova-Format kann allerdings nicht ohne weiteres in einer VMware-Umgebung verwendet werden. Zwar taucht auch ova in den von VMware unterstützten Virtualisierungsformaten auf, in diesem speziellen Fall trifft das jedoch nicht zu. Der VMware vCenter Converter zumindest weigert sich, die Icinga-Datei anzunehmen. Was man tun muss, um Icinga.ova in einen ESX-Server hochzuladen, wird hier beschrieben.

more...

Author:Gerhard Laußer
Tags:Icinga, Nagios, OVF, ovftool, vmware
Categories:nagios
OMD 0.46 is there!

The developer team of OMD released the version 0.46 last week. Now you will not only be able to run Nagios out of the box. Shinken has been added as an alternative core. This enables you to create one set of configuration files and switch between two monitoring technologies with only a few commands.

more...

Author:Gerhard Laußer
Tags:Nagios, omd, Shinken
Categories:nagios, omd, shinken
Thruk Release 0.94

Straight on the road to the Thruk 1.0 this will probably the last feature release so far.
The main focus was on usability and accessibility. This version will also be in the next OMD release.

more...

Author:Sven Nierlein
Tags:Nagios, Thruk
Categories:nagios, omd, thruk

Seit heute gibt es die Version 1.6.9 von check_oracle_health. Hauptzweck ist die Beseitigung eines Problems, das auftaucht, wenn man das Plugin unter OMD einsetzt. Daneben ist aber auch die Liste der Modi erweitert worden, um noch mehr Fehlersituationen in großen Oracle-Installationen rechtzeitig erkennen zu können.

more...

Author:Gerhard Laußer
Tags:check_oracle_health, datafiles, Nagios, ora-00059, oracle, rman
Categories:nagios, shinken

Mod-Gearman 1.0.8 has been released (download).
This release mostly contains bugfixes only and a minor change to use the identifier more often.

more...

Author:Sven Nierlein
Tags:Mod-Gearman, Nagios
Categories:mod-gearman, nagios
OMD Repository

There is a now an ‘unofficial’ OMD Repository OMD Repository.
This makes new installations and upgrading your OMD sites even more easier.

more...

Author:Sven Nierlein
Tags:Nagios, omd
Categories:nagios, omd
Thruk Release 1.0.9

Thruk 1.0.9 has just been released and contains a couple of cool new features. This version will also be in the next OMD release. Besides the release itself, new documentation about plugins and themes has been published.

more...

Author:Sven Nierlein
Tags:Nagios, omd, Thruk
Categories:nagios, omd, thruk

Jolokia and Jmx4Perl will go on tour this autumn. Roland Huss will talk about both projects in November at Devoxx, Antwerp, which is the biggest independent Java community conference in the world and at the Open Source Monitoring Conference, Nuremberg.

more...

Author:Roland Huß
Tags:jmx, Jmx4Perl, Jolokia, Nagios
Categories:jolokia
OMD 0.50 is available

The developer team of OMD (Open Monitoring Distribution) released the version 0.50 today. This version contains bugfixes and lots of updated packages including Shinken, Thruk, PNP4Nagios, Mod-Gearman, check_oracle_health and check_mysql_health.

more...

Author:Sven Nierlein
Tags:check_mysql_health, check_oracle_health, Nagios, omd, repository, Thruk
Categories:nagios, omd

The upcoming version 1.1.2 of Mod-Gearman will have embedded Perl support which greatly improves performance when you have lots of Perl checks.

more...

Author:Sven Nierlein
Tags:Mod-Gearman, Nagios
Categories:mod-gearman, nagios
Pimp my Livestatus

In the early days of the Shinken monitoring system you were quite limited in how many web user interfaces you could use. There was the old CGI-based Nagios-Webinterface or (thanks to the merlin-mysql broker module) the Ninja GUI from OP5.
At the same time, two Projects, Thruk and Multisite, became very popular. The success of these two web guis was mainly based on the way they communicated with the Nagios core.

more...

Author:Gerhard Laußer
Tags:livestatus, mongodb, Nagios, Shinken
Categories:nagios, shinken

In my last post i was explaining why it became necessary to have an alternative to the sqlite-based storing of log data. One of the many new features of the upcoming release 1.0 “Heroic Hedgehog” of the Shinken monitoring software will be a MongoDB backend used by the livestatus module.

In this post i will show how to configure the livestatus module with a MongoDB cluster.

more...

Author:Gerhard Laußer
Tags:livestatus, mongodb, monitoring, Nagios, Shinken
Categories:nagios, shinken

Version 1.2.2 of Mod-Gearman has just been released. It now comes with better orphaned check detection and easier installation for rpm based linux systems.

more...

Author:Sven Nierlein
Tags:Mod-Gearman, Nagios
Categories:mod-gearman, nagios

check_oracle_health, check_mysql_health, check_mssql_health und check_db2_health bringen von Haus aus schon eine Menge Funktionalität mit. Allerdings wurden sie speziell für die Belange von Datenbankadministratoren entwickelt. Um auch den Betreibern von datenbankgestützten Applikationen die Möglichkeit zu geben, bestimmte Werte per SQL abzufragen, gibt es den Parameter "--mode sql". Damit lässt sich das numerische Ergebnis eines SQL-Aufrufs mit Schwellwerten vergleichen und in einen Nagios-Exitcode verwandeln. Üblicherweise sind die Anforderungen der Applikation an das Monitoring jedoch etwas komplexer. Am Beispiel von check_mysql_health und Wordpress wird gezeigt, wie man so etwas einfach umsetzen kann.

more...

Version 1.2.6 of Mod-Gearman has just been released. You may now configure the worker queues by custom variables instead of host/servicegroups.

more...

Author:Sven Nierlein
Tags:Mod-Gearman, Nagios
Categories:mod-gearman, nagios

Virtualisierung spart Kosten und Ressourcen, stellt aber hohe Ansprüche an Verwaltung und Monitoring. Die schwedische Firma op5 entwickelte für ihr gleichnamiges Nagios-basierendes Produkt das Plugin check_esx3, welches ein umfassendes Monitoring von VMWare ESX-Umgebungen ermöglicht.

more...

Author:Simon Meggle
Tags:esx, esxi, Nagios, omd, Plugins, vmware
Categories:nagios
OMD 0.54 is available

OMD-LOGO_FINAL2 The developer team of OMD (Open Monitoring Distribution) released the version 0.54 today. This version contains bugfixes and lots of updated packages including Shinken 1.0.1, Thruk 1.26, PNP4Nagios 0.6.17, NagVis 1.6.5 and many more.

more...

Author:Gerhard Laußer
Tags:Mod-Gearman, Nagios, omd, Shinken, Thruk
Categories:nagios, omd, shinken, thruk

You probably have noticed that development of the new Nagios-compatible monitoring system Shinken progresses very fast. Every few hours there is another commit at GitHub, where Shinken’s code repository is hosted. Now if you want to try all these new features immediately, there’s a very easy method which requires a simple update-command instead of a fresh install.

more...

Author:Gerhard Laußer
Tags:monitoring, Nagios, omd, Shinken, Thruk
Categories:nagios, omd, shinken

Keeping an eye on cpu usage of your servers is one of the basic things in system monitoring. For Nagios (and Shinken, of course) you’ll find plenty of plugins for this task. However, i was never happy with the way they work. Most of the plugins you can download work like this: read a counter - sleep - re-read the counter. This technique not only adds an extra delay to the execution time of the plugin, but it only shows the state of things within a small time frame. If you run such a plugin every 5 minutes and it sleeps 5 seconds between the two measurements, you don’t know what happens in the other 295 seconds. This is a very small sample rate.

more...

Author:Gerhard Laußer
Tags:check_logfiles, cpu, Icinga, linux, Nagios, Shinken
Categories:nagios, omd, shinken

One of my bigger OMD installations consists of 13 sites. The visualization layer uses the Thruk interface. This alternative web ui can read data from multiple livestatus backends and display the host and service objects in one unified view. For this purpose i have one extra site called gui which only starts an apache process. I then point my browser to http://…./gui/thruk

The addresses of the livestatus backends have to be written into a config file, thruk_local.cfg. Now what if my list of 13 sites would be constantly changing? What if new OMD sites would be created, others deleted on a daily basis? I would have to edit the config file every time. With the new init-hook-feature, OMD will do this automatically for me.

more...

Author:Gerhard Laußer
Tags:livestatus, Nagios, Shinken, Thruk
Categories:nagios, omd, shinken, thruk

Every now and then some of our 7x24 hosts / services need a daily or weekly maintmode for regular restarts. Normally you would have to create 2 new timeperiods because you don’t want both hosts in a cluster to be restarted at the same time. This is not just way to much work, it also adds unnecessary complexity because
nobody can see the maintmode unless you look into the config files.

Thats where recurring downtimes will become handy and latest Thruk Version includes this new feature.

more...

Author:Sven Nierlein
Tags:Nagios, omd, Thruk
Categories:nagios, omd, thruk

The well-known plugin check_by_ssh is a wrapper around the ssh client program. Unfortunately the path to ssh is defined at compile-time and remains hard-coded in the check_by_ssh binary. Usually this is /usr/bin/ssh. If you want to use features which are not implemented in your distribution’s ssh, but in an alternative ssh binary, you have to recompile check_by_ssh. Here is a patch which makes it easy to switch between multiple ssh binaries using a command line parameter.

more...

Author:Gerhard Laußer
Tags:check_by_ssh, controlmaster, Nagios, plugin, Shinken, ssh
Categories:nagios

Monitoring Unix clients is very easy with the check_by_ssh plugin. The only prerequisite is public-key-based access and installation of some plugins on the remote side. Then, running a check is as easy as:

<br />
check_by_ssh –host 10.177.3.39 –logname nagios \<br />
    –command “lib/nagios/plugins/check_swap -w 15% -c 8%”<br />

The drawback of this method is extra load on the nagios server. With every check, a ssh process is forked which has to do a complete handshake with the remote side. With newer ssh implementations it is possible to have a persistent connection which requires only one handshake at startup. All the following ssh connects use the already established connection, which saves a lot of cpu cycles.
Here are the instructions to combine check_by_ssh with such a persistent tunnel.

more...

Author:Gerhard Laußer
Tags:check_by_ssh, controlmaster, Nagios, omd, Shinken, ssh
Categories:nagios, omd
Thruk 1.36 Released

Version 1.36 of the Thruk monitoring gui has just been released. The changelog is quite huge this time. There is a new dashboard plugin called the ‘Panorama View’ Addon. There are a lot more reports included now. And finally there is a plugin manager included in the config tool which lets you easily manage your plugins and addons.

more...

Author:Sven Nierlein
Tags:Nagios, omd, Shinken, Thruk
Categories:nagios, thruk

Während der letzten Wochen habe ich viel Geduld aufgebracht, um auf meinem neuen Raspberry Pi die Open Monitoring Distribution zu bauen und zuletzt ein Debian-Install-Paket zu erstellen. Geduld deshalb, weil ein “make” schon mal einen Tag und mehr läuft. Wenn dann immer wieder Anpassungen im Build-Prozess für diese spezielle Hardware nötig sind, zieht sich das ganze Unternehmen ordentlich in die Länge. Aber nun ist es überstanden und die Version 0.56 von OMD kann auf dem Raspberry Pi installiert werden.

more...

Author:Gerhard Laußer
Tags:Nagios, omd, omdistro, raspberry, Shinken
Categories:nagios, omd

Monitoring Minutes

Die erste Folge der ConSol "Monitoring Minutes" ist soeben auf YouTube erschienen;
darin geben wir einen Überblick über den Aufbau und die Funktionsweise von OMD und zeigen zuletzt, wie OMD mit wenigen Handgriffen über die Repositories von ConSol installiert und aktualisiert werden kann.

 

 

 

Hier gehts zur ersten Folge: OMD im Überblick - ConSol* Monitoring Minutes

more...

Anlässlich der neuen Videoserie "ConSol* Monitoring Minutes" habe ich mir überlegt, wie man die Zahl der Zugriffe auf ein YouTube-Video mit einem Nagios-Plugin auslesen und mit PNP4Nagios aufzeichnen kann. Ein eigenes Plugin müsste dazu die Informationen herunterladen, Kennzahlen aus dem Resultat herausparsen, ausgeben und nicht zuletzt irgendwie auf Download-Fehler reagieren. Mit check_logfiles, einer kleinen Konfigurationsdatei und der YouTube-API ist das aber kein Problem.

more...

Author:Gerhard Laußer
Tags:check_logfiles, heino, Icinga, Nagios, Shinken, youtube
Categories:monitoring minutes, nagios, shinken

Consulting im Bereich Monitoring wird nie langweilig. Ständig wird man mit neuen Anforderungen konfrontiert, so wie vergangene Woche:

Blue Coat ProxyNG Appliances sollten überwacht werden, genauer gesagt das Modell SG600. Diese Appliances finden Verwendung in Application Delivery Networks (ADN), wo sie für die performante Auslieferung von Geschäftsanwendungen und Schutz vor web-basierten Bedrohungen sorgen.
Und jetzt zum Monitoring…

more...

Author:Gerhard Laußer
Tags:blue coat, check_nwc_health, Icinga, Nagios, plugin, proxyng, Shinken
Categories:nagios

Cisco WLC dienen dazu, Access Points zu verwalten und an ein Backbone-Netz anzubinden. Es gibt zwar schon ein paar Plugins, um diese Geräte mit Nagios zu überwachen, aber ich mag es nicht, für jeden Service ein eigenes Plugin installieren zu müssen. Daher hat das Schweizer Taschenmesser check_nwc_health jetzt eine weitere Klinge bekommen.

more...

Author:Gerhard Laußer
Tags:check_nwc_health, cisco, Icinga, Nagios, Shinken, wlan, wlc
Categories:nagios, shinken

There won’t be general multi-language support in Thruk, but you may now choose different languages for your reports. The brand new release v1.64 comes with 5 built-in languages and it’s
super easy to add a new one.

more...

Author:Sven Nierlein
Tags:Nagios, omd, reporting, Thruk
Categories:nagios

mm_mg

Soeben erschienen: die zweite Folge der ConSol* Monitoring Minutes. Getreu unserem Motto “aus der Praxis für die Praxis” zeigen wir darin live, wie die Checks einer großen Nagios-Installation (hier: einer OMD-Site) mit Mod-Gearman an Worker delegiert werden können.

Beim “Schweizer Taschenmesser” OMD (erhältlich über das ConSol*-Repository) ist Mod-Gearman bereits integriert.

more...

mm_mg Wie in der dritten Folge schon angekündigt, habe ich zum Thema HSRP ein eigenes Filmchen erstellt. Hier ist die vierte Folge der ConSol* Monitoring Minutes, in der gezeigt wird, wie eine mit dem HSRP-Protokoll redundant gemachte Gruppe von Cisco-Routern mit check_nwc_health überwacht wird.

more...

Author:Gerhard Laußer
Tags:cisco, hsrp, Icinga, Nagios, Shinken, snmp
Categories:monitoring minutes, nagios, omd, shinken, thruk

fritzdect200-smallIm Februar bestellt und in der letzten Mai-Woche eingetroffen. Die intelligenten Steckdosen von AVM scheinen heiss begehrt zu sein. Jedenfalls kann ich jetzt über meine FRITZ!BOX aufzeichnen, wieviel Strom gewisse Geräte momentan oder aber über einen langen Zeitraum verbrauchen.
Von Berufs wegen juckt's mich natürlich jedesmal in den Fingern, wenn irgendwo Messwerte anfallen. Mein Plugin check_nwc_health kann ja bereits CPU, Speicher und Interfaces einer FRITZ!BOX 7390 abfragen, also war klar, daß die Überwachung der FRITZ!DECT 200 bzw. des gemessenen Energieverbrauchs unbedingt dazugehört.

Die fünfte Ausgabe der ConSol* Monitoring Minutes, die sich mit diesem Thema befasst, ist heute ebenfalls entstanden.

more...

Author:Gerhard Laußer
Tags:avm, dect, fritz!box, Icinga, Nagios, Shinken
Categories:monitoring minutes, nagios, omd, shinken, thruk
OMD 1.00 just arrived

OMD-LOGO_FINAL2 The developer team of OMD (Open Monitoring Distribution) released the version 1.00 today. Three years after the project started we decided it was time to show that OMD is no longer under development but is a mature, proven product.

This version contains lots of updated packages including Nagios 3.5.0, Shinken 1.4, Multisite 1.2.2p2, Thruk 1.72, PNP4Nagios 0.6.21, NagVis 1.7.1, check_mk 1.2.2p2 and many more.

Using the OMD Repository installation is as simple as a apt-get install omd. If you have an rpm-based system, it's as simple as yum install omd or zypper install omd.

For those who weren't using OMD yet, now there is no more reason to hesitate.

Author:Gerhard Laußer
Tags:Icinga, monitoring, Nagios, omd, Shinken
Categories:nagios, omd

Lange hat’s gedauert, aber seit heute kann man sich das Debian-Paket für OMD-1.00 vom ConSol-Labs-Repository herunterladen.

root@raspberrypi:~# apt-get install omd-1.00

Die Maschinen unserer Kunden, auf denen wir uns tagtäglich bewegen und Monitoring-Systeme betreiben, haben üblicherweise CPUs und Gigabytes im zweistelligen Bereich. Da wird es schon zur Geduldsprobe, wenn ein Build auf dem Raspberry Pi den halben Tag braucht. Ein ARM11 ist eben kein Xeon und SD ist nicht SSD.

more...

Author:Gerhard Laußer
Tags:arm, Icinga, Nagios, odroid, omd, omdistro, raspberry, raspberry pi, Shinken
Categories:nagios, omd

 

2296OS

Der Verlag Packt Publishing ist an mich herangetreten und hat mich gebeten, eine Rezension zum soeben erschienenen Buch Icinga Network Monitoring von Viranch Mehta zu schreiben.

Eigentlich hatte ich keine Zeit, aber wenn mir jemand mit „Keeping in mind your knowledge in this subject and having looked at your contributions, I feel you'd make an excellent reviewer of this book.“ kommt, dann werde ich natürlich schwach.

Das Buch richtet sich an eine Leserschaft, die bisher keinen Kontakt zur Icinga (bzw. Nagios, Naemon oder Shinken) hatte. Linux-Kenntnisse werden aber dennoch vorausgesetzt. Ziel des Autors war es, eine nachvollziehbare (im Sinne von: sofort am Rechner umsetzbar) und möglichst vollständige Anleitung zu erstellen, anhand derer ein Icinga-Neuling (mit ein bisschen Hirnschmalz sind die Schritte aber auch auf die o.g. Geschwister von Icinga anwendbar) in kurzer Zeit ein Basis-Monitoring für seine IT-Landschaft aufsetzen kann.

more...

Author:Gerhard Laußer
Tags:Icinga, linux, Nagios, Shinken
Categories:nagios
Erstes Naemon Release

Der als Nagios 4 Nachfolger angetretene Fork “Naemon” veröffentlichte heute sein erstes Stable Release mit der Nummer 0.8.0.
Aber was macht Naemon nun besser als Nagios?

more...

Author:Sven Nierlein
Tags:monitoring, naemon, Nagios, omd, Thruk
Categories:naemon

Monitoring von SAP mit den bisher vorhandenen Plugins beschränkte sich auf die Abfrage von CCMS-Metriken. In einem SAP-System steckt aber noch viel mehr, das sich überwachen lässt. Check_sap_health ist ein neues Plugin, welches in Perl geschrieben wurde. Es entstand in einem Projekt, bei dem von unterschiedlichen Standorten aus die Laufzeiten von BAPI-Aufrufen gemessen werden sollten. Durch die einfache Erweiterung des Plugins um selbstgeschriebene Perl-Elemente lassen sich beliebige Funktionen per RFC aufrufen und somit firmenspezifische Logik implementieren.

more...

Author:Gerhard Laußer
Tags:bapi, ccms, Icinga, naemon, Nagios, netweaver, rfc, rz20, sap, Shinken
Categories:naemon, nagios, omd, shinken
Naemon & Thruk

Auf dem diesjährigen Monitoring Workshop in Berlin durfte ich Neuigkeiten aus 2 Projekten vorstellen.

more...

Author:Sven Nierlein
Tags:Business Process, Dashboard, Nagios, reporting, Thruk
Categories:naemon, nagios, thruk

Mit Sakuli lassen sich unabhängig vom Betriebssystem User-Aktionen in Anwendungen (Fat-Client, Citrix, Web, …) simulieren; die Stati und dabei gemessenen Laufzeiten werden von Nagios ausgewertet und visualisiert. Unter der Haube stecken die Tools

die wir unter dem Namen “Sakuli” über ihre gemeinsame API zu einem Team zusammenspannt und auf GitHub veröffentlicht haben.

more...

Author:Simon Meggle
Tags:e2e, end2end, monitoring, Nagios, omd, sakuli
Categories:nagios, omd, sakuli

Ich habe in letzter Zeit viel Aufwand in die Entwicklung bzw. Erweiterung von SNMP-Plugins gesteckt. Die, die ich veröffentliche habe sind: check_nwc_health für Netzwerkkomponenten, check_ups_health für unterbrechungsfreie Stromversorgungen und check_tl_health für Tape Libraries. Allen drei haben gemeinsam, daß sie bei einheitlichem Kommandozeilenformat möglichst viele unterschiedliche Hersteller und Modelle abdecken. Wenn ich nun eine neue Anforderung bekomme und ein Plugin für ein bisher unbekanntes Gerät erweitern muss, dann brauche ich erstmal eine Übersicht über die MIBs und OIDs, welche bei diesem Gerät implementiert wurden. Ich kann natürlich die Dokumentation durchschauen, aber die steht nicht immer zur Verfügung bzw. ist nicht sehr aufschlussreich. Ein Snmpwalk ist auch einer der ersten Schritte, aber der liefert mir einfach nur endlose Zahlenkolonnen, die ich mühsam interpretieren muss. Daher habe ich einen --mode supportedmibs eingeführt, mit dessen Hilfe ich die Namen der unterstützten MIBs angezeigt bekomme.

more...

Author:Gerhard Laußer
Tags:check_nwc_health, Nagios, Plugins, snmp
Categories:nagios

Vorgestern habe ich auf der diesjährigen Open-Source-Monitoring-Konferenz in Nürnberg einen Vortrag über check_nwc_health gehalten.
Hier sind die Folien für diejenigen, die das Pech hatten, nicht dabei zu sein (damit meine ich die Konferenz an sich, nicht meinen Vortrag)

Author:Gerhard Laußer
Tags:cisco, Icinga, juniper, naemon, Nagios, plugin, Shinken, snmp
Categories:nagios

Wem meine Folien zum Thema Netzwerkmonitoring mit check_nwc_health zu trocken sind kann sich meinen Vortrag auch als Video anschauen. Film ab!

Author:Gerhard Laußer
Tags:cisco, Icinga, juniper, naemon, Nagios, plugin, Shinken, snmp
Categories:nagios

One of the most often requested features is the possibility to place hosts, services and host/servicegroups on a geomap.
Now with release 1.88 Thruk made a major change in its panorama dashboard to support this kind of map too.

more...

Author:Sven Nierlein
Tags:Nagios, Thruk, omd, Icinga, naemon, Dashboard, GeoMap
Categories:nagios, omd, thruk, naemon

Beim Monitoring von SAP mit check_sap_health wurden bisher die Bereiche CCMS, Verbuchungssystem und Shortdumps abgedeckt. Mit der neuen Version können nun auch Hintergrundjobs überwacht werden. Folgende Anforderungen wurden implementiert:

  • check_sap_health soll Jobs melden, welche einen fehlerhaften Status haben. Würde man in SM37 nachschauen, dann würde man bei diese(n) Job(s) den Status aborted angezeigt bekommen
  • Defaultmäßig interessiert sich das Plugin nur für die vergangenen 60 Minuten, also die Jobs die in der letzten Stunde fertig geworden (oder abgebrochen) sind. Eine andere Zeitspanne ist einstellbar (so gibt es das auch beim Shortdump-Check). Dadurch hat der Service bei einem üblichen 5-Minuten-Check-1-Minute-Retry-Intervall die Gelegenheit, kritisch zu werden und eine Notification zu verschicken und nach kurzer Zeit wieder grün zu werden.
  • Die Sicht des Plugins kann mit Hilfe des Parameters --name auch auf bestimmte Jobs eingegrenzt werden. Es interessiert sich dann ausschließlich für Jobs dieses Namens. Damit lassen sich eigene Services einrichten, die speziell die Jobs bestimmter Applikationen bzw. des Systeme überwachen.
  • Bei allen Jobs, die in den letzten 30 Minuten fertig geworden sind, wird die Laufzeit mit vorgegebenen Schwellwerten verglichen. (--warning/critical). Bei Überschreitung gibt es Alarm. Die Laufzeit wird als <jobname>_runtime=… in den Performancedaten auftauchen.

more...

Author:Gerhard Laußer
Tags:Nagios, SAP, omd, Icinga, naemon, Netweaver
Categories:nagios, omd


Eine neue Ausgabe der ConSol*-Monitoring-Minutes ist seit heute bei Youtube online. Matthias Gallinger erklärt, wie man in einer DMZ einen Gearman-Worker einrichtet, ohne daß man sich beim Firewall-Admin unbeliebt macht.

Author:Gerhard Laußer
Tags:Nagios, mod-gearman, dmz
Categories:nagios, omd

Jeder Icinga-Admin kennt das: Ein Gerät, eine Applikation oder eine Datenbank soll überwacht werden, es gibt auch eine extra Monitoring-Kennung dafür, aber das zugehörige Passwort ist einfach nur grauenhaft. Sei es aufgrund einer Vorschrift oder weil der DBA ein Sadist ist, häufig enthält das Passwort Zeichen, welche bei der Ausführung des Plugins durch eine Shell Probleme bereiten können. Dazu zählen alle Arten von Anführungszeichen, Strichpunkt, Kaufmanns-Und oder gar nicht druckbare Zeichen.
So eine Command-Definition

<br />
define command {<br />
  command_name check_mssql_health<br />
  command_line $USER1$/check_mssql_health --hostname $ARG1$ --username ‘$ARG2$’ --password ‘$ARG3$’ …<br />
}<br />

schließt zwar den ganzen Dreck in einfache Hochkommas ein, aber was, wenn das Passwort selber ein Hochkomma enthält?

Current Status:WARNING (for 0d 0h 6m 3s)
Status Information:[sh: -c: line 0: unexpected EOF while looking for matching `''
sh: -c: line 1: syntax error: unexpected end of file]


Damit das nicht passiert und auch die Icinga-Konfigurationsdateien von Sonder- und Schmierzeichen aller Art verschont bleiben, können die Plugins aus der check_*_health-Familie sowie check_hpasm seit den letzten Releases mit encodierten Passwörtern versorgt werden. Man hantiert also nur noch mit [A-Za-z0-9].

more...

Author:Gerhard Laußer
Tags:Nagios, check_oracle_health, check_mssql_health, check_hpasm, coshsh
Categories:nagios, omd

logo_thruk.png Today [Thruk][1] has released version 2.00 wich is a great milestone and a huge step forward. Instead of adding lots of things, we tried to remove unnecessary dependencies. Version 2.00 comes without the Catalyst framework and many performance improvements, especcially on larger setups.

more...

Author:Sven Nierlein
Tags:Nagios, Thruk, omd, Icinga, naemon
Categories:nagios, omd, thruk, naemon

oracle_solaris_logo.png Aller guten Dinge sind drei. Bisher konnte man mit [check_nwc_health][1] die lokalen Interfaces von Linux und Windows-Rechnern überwachen, jetzt geht das auch bei Solaris. Das Betriebsteam eines MySQL-Cluster auf Oracle Solaris wollte die Auslastung der Netzwerk-Interfaces aufzeichen, da die übertragene Datenmenge sich allmählich dem GBit/s-Bereich nähert.

more...

Author:Gerhard Laußer
Tags:Nagios, omd
Categories:nagios, omd, solaris, oracle

Es gibt wieder mal ein neues Plugin, diesmal geht es um die Überwachung von Postfächern/Mailservern/Mailempfang etc. Mit [check_mailbox_health][1] prüft man,

  • ob ein Mailserver antwortet bzw. ein Login zulässt
  • Mails im Postfach liegen
  • wie alt diese sind
  • ob sie ein bestimmtes Subject haben (oder ein Suchmuster im Text vorkommt)
  • ob sie Attachments (ggf. eines bestimmten Typs) haben

Mit check_mailbox_health lassen sich so auch nicht ganz triviale, auf Mail basierende Geschäftsvorgänge monitoren.

more...

Author:Gerhard Laußer
Tags:plugin, Nagios, Icinga, check_mailbox_health, imap
Categories:nagios, omd

cisco-wan.pngDas Plugin check_nwc_health erfreut sich größter Beliebtheit beim Monitoring von Komponenten in den Core-, Access- und Distribution-Layern, oder kurz: den Netzwerkkomponenten innerhalb von Gebäuden und Standorten.
Das WAN-Monitoring geht aber weit über die üblichen Hardware/CPU/Memory/Interfaces-Checks hinaus.
Für einen OMD-Kunden wurde das Plugin so erweitert, daß er sein europaumspannendes Netzwerk, bestehend aus mehreren tausend WAN-Knoten, umfassend überwachen kann. Den Vergleich mit schweineteuren proprietären Lösungen braucht das Gespann OMD/check_nwc_health seitdem nicht mehr zu fürchten.

more...

Author:Gerhard Laußer
Tags:plugin, Nagios, Icinga, check_nwc_health, ospf, wan, cisco, bgp, mpls, vpn
Categories:nagios, omd