Bei der Ablösung des alten SAP-Monitorings eines unserer Kunden bin ich über Ungereimtheiten beim Auslesen von CCMS-Metriken gestolpert. Nicht alle Werte, welche man per RZ20 in der SAP-GUI angezeigt bekommt, werden nagios-seitig korrekt wiedergegeben. Teilweise sind die Messwerte um den Faktor 1000 zu hoch und werden so auch in den entsprechenden RRD-Files abgespeichert bzw. sorgen für ungläubiges Kopfschütteln. Das ist beispielsweise dann der Fall wenn der SAP-Server eine Load von 7.06 hat, laut Monitoring aber 706. Bisher ist das halt nicht aufgefallen, weil üblicherweise der von SAP gelieferte Status eins zu eins in Nagios verwendet wurde.

Update 23.6.14: im Git von check_mk wurde mein Patch mittlerweile eingespielt.
Update 26.6.14: im Git von Netways auch.
Update: Die beiden angemeckerten Plugins sind (Stand 26.6.14) gefixt und somit ist meiner Stänkerei jede Grundlage entzogen. Alles ist gut :-)

 

more...

Author:Gerhard Laußer
Tags:ccms, mte, rz20, sap
Categories:nagios, omd, shinken

Monitoring von SAP mit den bisher vorhandenen Plugins beschränkte sich auf die Abfrage von CCMS-Metriken. In einem SAP-System steckt aber noch viel mehr, das sich überwachen lässt. Check_sap_health ist ein neues Plugin, welches in Perl geschrieben wurde. Es entstand in einem Projekt, bei dem von unterschiedlichen Standorten aus die Laufzeiten von BAPI-Aufrufen gemessen werden sollten. Durch die einfache Erweiterung des Plugins um selbstgeschriebene Perl-Elemente lassen sich beliebige Funktionen per RFC aufrufen und somit firmenspezifische Logik implementieren.

more...

Author:Gerhard Laußer
Tags:bapi, ccms, Icinga, naemon, Nagios, netweaver, rfc, rz20, sap, Shinken
Categories:naemon, nagios, omd, shinken

fritzdect200-smallIm Februar bestellt und in der letzten Mai-Woche eingetroffen. Die intelligenten Steckdosen von AVM scheinen heiss begehrt zu sein. Jedenfalls kann ich jetzt über meine FRITZ!BOX aufzeichnen, wieviel Strom gewisse Geräte momentan oder aber über einen langen Zeitraum verbrauchen.
Von Berufs wegen juckt's mich natürlich jedesmal in den Fingern, wenn irgendwo Messwerte anfallen. Mein Plugin check_nwc_health kann ja bereits CPU, Speicher und Interfaces einer FRITZ!BOX 7390 abfragen, also war klar, daß die Überwachung der FRITZ!DECT 200 bzw. des gemessenen Energieverbrauchs unbedingt dazugehört.

Die fünfte Ausgabe der ConSol Monitoring Minutes, die sich mit diesem Thema befasst, ist heute ebenfalls entstanden.

more...

Author:Gerhard Laußer
Tags:avm, dect, fritz!box, Icinga, Nagios, Shinken
Categories:monitoring minutes, nagios, omd, shinken, thruk

mm_mg Wie in der dritten Folge schon angekündigt, habe ich zum Thema HSRP ein eigenes Filmchen erstellt. Hier ist die vierte Folge der ConSol Monitoring Minutes, in der gezeigt wird, wie eine mit dem HSRP-Protokoll redundant gemachte Gruppe von Cisco-Routern mit check_nwc_health überwacht wird.

more...

Author:Gerhard Laußer
Tags:cisco, hsrp, Icinga, Nagios, Shinken, snmp
Categories:monitoring minutes, nagios, omd, shinken, thruk

mm_mg

Soeben erschienen: die zweite Folge der ConSol Monitoring Minutes. Getreu unserem Motto “aus der Praxis für die Praxis” zeigen wir darin live, wie die Checks einer großen Nagios-Installation (hier: einer OMD-Site) mit Mod-Gearman an Worker delegiert werden können.

Beim “Schweizer Taschenmesser” OMD (erhältlich über das ConSol-Repository) ist Mod-Gearman bereits integriert.

more...

Cisco WLC dienen dazu, Access Points zu verwalten und an ein Backbone-Netz anzubinden. Es gibt zwar schon ein paar Plugins, um diese Geräte mit Nagios zu überwachen, aber ich mag es nicht, für jeden Service ein eigenes Plugin installieren zu müssen. Daher hat das Schweizer Taschenmesser check_nwc_health jetzt eine weitere Klinge bekommen.

more...

Author:Gerhard Laußer
Tags:check_nwc_health, cisco, Icinga, Nagios, Shinken, wlan, wlc
Categories:nagios, shinken

Anlässlich der neuen Videoserie "ConSol Monitoring Minutes" habe ich mir überlegt, wie man die Zahl der Zugriffe auf ein YouTube-Video mit einem Nagios-Plugin auslesen und mit PNP4Nagios aufzeichnen kann. Ein eigenes Plugin müsste dazu die Informationen herunterladen, Kennzahlen aus dem Resultat herausparsen, ausgeben und nicht zuletzt irgendwie auf Download-Fehler reagieren. Mit check_logfiles, einer kleinen Konfigurationsdatei und der YouTube-API ist das aber kein Problem.

more...

Author:Gerhard Laußer
Tags:check_logfiles, heino, Icinga, Nagios, Shinken, youtube
Categories:monitoring minutes, nagios, shinken

Monitoring Minutes

Die erste Folge der ConSol "Monitoring Minutes" ist soeben auf YouTube erschienen;
darin geben wir einen Überblick über den Aufbau und die Funktionsweise von OMD und zeigen zuletzt, wie OMD mit wenigen Handgriffen über die Repositories von ConSol installiert und aktualisiert werden kann.

 

 

 

Hier gehts zur ersten Folge: OMD im Überblick - ConSol Monitoring Minutes

more...

Zu Hause habe ich eine Firewall/VPN-Appliance NS5GT stehen, die bisher noch nicht überwacht wurde. Schlag den Raab, Deutschland sucht den Superstar, Navy CIS und Andrea Berg – Die 20 Jahre Show waren der Grund dafür, dass sich das jetzt ändert. Aus Langeweile habe ich CPU- und Memory-Monitoring für die NS5GT implementiert. Das Plugin check_nwc_health ist also wieder um ein Feature reicher.

more...

Author:Gerhard Laußer
Categories:nagios, omd, shinken

Einer unserer Kunden, der check_mssql_health bereits intensiv nutzt, hat mich beauftragt, neue Anforderungen seiner DBAs umzusetzen.
Hier ist das Ergebnis:

more...

Author:Gerhard Laußer
Tags:dbcc, fn_trace_gettable, grow event, shrink event, sjobh, SQL Server, sybase
Categories:nagios, shinken

Die neuen Proliant Gen8 scheinen seit September Einzug in die Rechenzentren zu halten. Damals erhielt ich die erste Mail, in der mir von unrealistischen Ergebnissen berichtet wurde. Anscheinend waren bei mehreren Temperatursensoren im Server Schwellwerte von -99 Grad registriert. Zumindest war das der Wert, den die Sensoren meldeten, wenn sie mit check_hpasm abfragt wurden.

more...

Author:Gerhard Laußer
Tags:check_hpasm, gen8, proliant
Categories:nagios, shinken

Since Version 1.46 of Thruk the number of problems can be dynamically viewed in Thruks favicon. This is quite handy for creating a pinned app tab in Firefox.

more...

Author:Sven Nierlein
Categories:nagios, omd, shinken, thruk

One of my bigger OMD installations consists of 13 sites. The visualization layer uses the Thruk interface. This alternative web ui can read data from multiple livestatus backends and display the host and service objects in one unified view. For this purpose i have one extra site called gui which only starts an apache process. I then point my browser to http://…./gui/thruk

The addresses of the livestatus backends have to be written into a config file, thruk_local.cfg. Now what if my list of 13 sites would be constantly changing? What if new OMD sites would be created, others deleted on a daily basis? I would have to edit the config file every time. With the new init-hook-feature, OMD will do this automatically for me.

more...

Author:Gerhard Laußer
Tags:livestatus, Nagios, Shinken, Thruk
Categories:nagios, omd, shinken, thruk

Keeping an eye on cpu usage of your servers is one of the basic things in system monitoring. For Nagios (and Shinken, of course) you’ll find plenty of plugins for this task. However, i was never happy with the way they work. Most of the plugins you can download work like this: read a counter - sleep - re-read the counter. This technique not only adds an extra delay to the execution time of the plugin, but it only shows the state of things within a small time frame. If you run such a plugin every 5 minutes and it sleeps 5 seconds between the two measurements, you don’t know what happens in the other 295 seconds. This is a very small sample rate.

more...

Author:Gerhard Laußer
Tags:check_logfiles, cpu, Icinga, linux, Nagios, Shinken
Categories:nagios, omd, shinken

You probably have noticed that development of the new Nagios-compatible monitoring system Shinken progresses very fast. Every few hours there is another commit at GitHub, where Shinken’s code repository is hosted. Now if you want to try all these new features immediately, there’s a very easy method which requires a simple update-command instead of a fresh install.

more...

Author:Gerhard Laußer
Tags:monitoring, Nagios, omd, Shinken, Thruk
Categories:nagios, omd, shinken
OMD 0.54 is available

OMD-LOGO_FINAL2 The developer team of OMD (Open Monitoring Distribution) released the version 0.54 today. This version contains bugfixes and lots of updated packages including Shinken 1.0.1, Thruk 1.26, PNP4Nagios 0.6.17, NagVis 1.6.5 and many more.

more...

Author:Gerhard Laußer
Tags:Mod-Gearman, Nagios, omd, Shinken, Thruk
Categories:nagios, omd, shinken, thruk

check_oracle_health, check_mysql_health, check_mssql_health und check_db2_health bringen von Haus aus schon eine Menge Funktionalität mit. Allerdings wurden sie speziell für die Belange von Datenbankadministratoren entwickelt. Um auch den Betreibern von datenbankgestützten Applikationen die Möglichkeit zu geben, bestimmte Werte per SQL abzufragen, gibt es den Parameter "--mode sql". Damit lässt sich das numerische Ergebnis eines SQL-Aufrufs mit Schwellwerten vergleichen und in einen Nagios-Exitcode verwandeln. Üblicherweise sind die Anforderungen der Applikation an das Monitoring jedoch etwas komplexer. Am Beispiel von check_mysql_health und Wordpress wird gezeigt, wie man so etwas einfach umsetzen kann.

more...

In my last post i was explaining why it became necessary to have an alternative to the sqlite-based storing of log data. One of the many new features of the upcoming release 1.0 “Heroic Hedgehog” of the Shinken monitoring software will be a MongoDB backend used by the livestatus module.

In this post i will show how to configure the livestatus module with a MongoDB cluster.

more...

Author:Gerhard Laußer
Tags:livestatus, mongodb, monitoring, Nagios, Shinken
Categories:nagios, shinken
Pimp my Livestatus

In the early days of the Shinken monitoring system you were quite limited in how many web user interfaces you could use. There was the old CGI-based Nagios-Webinterface or (thanks to the merlin-mysql broker module) the Ninja GUI from OP5.
At the same time, two Projects, Thruk and Multisite, became very popular. The success of these two web guis was mainly based on the way they communicated with the Nagios core.

more...

Author:Gerhard Laußer
Tags:livestatus, mongodb, Nagios, Shinken
Categories:nagios, shinken

During evaluation of the migration of a customer’s Nagios installation to the Shinken monitoring system, i encountered a strange problem. Reading the configuration from a few files (hosts.cfg, services.cfg, etc) took a reasonable amount of time. But as soon as i divided the configuration into lots of smaller files (one directory for each host with several services files within), it took nearly an hour. What happened?

more...

Author:Gerhard Laußer
Tags:Python, Shinken
Categories:shinken

Seit heute gibt es die Version 1.6.9 von check_oracle_health. Hauptzweck ist die Beseitigung eines Problems, das auftaucht, wenn man das Plugin unter OMD einsetzt. Daneben ist aber auch die Liste der Modi erweitert worden, um noch mehr Fehlersituationen in großen Oracle-Installationen rechtzeitig erkennen zu können.

more...

Author:Gerhard Laußer
Tags:check_oracle_health, datafiles, Nagios, ora-00059, oracle, rman
Categories:nagios, shinken
OMD 0.46 is there!

The developer team of OMD released the version 0.46 last week. Now you will not only be able to run Nagios out of the box. Shinken has been added as an alternative core. This enables you to create one set of configuration files and switch between two monitoring technologies with only a few commands.

more...

Author:Gerhard Laußer
Tags:Nagios, omd, Shinken
Categories:nagios, omd, shinken