OMD Labs Edition 2.80 has been released today. The OMD Labs Edition is based on the standard OMD but adds some more useful addons like Grafana and Prometheus or additional cores like Icinga 2 and Naemon. This release updates many of the shiped components and adds some more usefull features.

more...

Author:Sven Nierlein
Tags:omd, nagios, naemon, grafana, thruk
Categories:omd, nagios
NEB Modules with Go

Have you ever written a NEB (Nagios Event Broker) module? This article will explain a tool which makes this a lot easier, especially if the reason was that you are not familiar with C or C++. In this case the “Go NEB Wrapper” could come very handy and if you are new to this topic it is a good point to start with.

more...

Author:Philip Griesbacher
Tags:nagios, naemon, go, neb
Categories:development, monitoring, nagios

OMD Labs Edition 2.60 has been released today. The OMD Labs Edition is based on the standard OMD but adds some more useful addons like Grafana and Prometheus or additional cores like Icinga 2 and Naemon. This release updates many of the shiped components and adds some interesting options when resolving update conflicts.

more...

Author:Sven Nierlein
Tags:omd, nagios, naemon, grafana, thruk
Categories:omd, nagios

OMD Labs Edition 2.40 for the Raspberry Pi has been released today. A month and a broken SD card (excessive use of /var/swap during the builds) after the release of the x86 version it is now possible to run a full-blown monitoring system on your ARM boards. It was tested on Raspberry 2 and Raspberry 3. If you want to run OMD on one of the older models, you might experience performance problems, especially when you enable InfluxDB and Grafana.

more...

Author:Gerhard Laußer
Tags:omd, nagios, grafana, thruk, raspberry
Categories:omd, nagios

OMD Labs Edition 2.40 has been released today. The OMD Labs Edition is based on the standard OMD but adds some more useful addons like Grafana and Influxdb or additional cores like Icinga 2 and Naemon. This releases focus is on security and maintainance and removes some recently discovered CVEs in Nagios, Icinga and Naemon.

more...

Author:Sven Nierlein
Tags:omd, nagios, grafana, thruk
Categories:omd, nagios
_nowhere_

Wenn man einen Dienst überwachen möchte und man diesen nicht selbst betreut, fehlt meist die Erfahrung, wie sich dieser verhalten sollte und was als „normal“ gilt. Im Folgenden wird beschrieben, wie man (Un)Regelmäßigkeiten automatisch erkennen lassen kann.

more...

Author:Philip Griesbacher
Tags:Anomalieerkennung, Holt-Winters, Nagios, InfluxDB, Grafana, DataScryer
Categories:monitoring, omd, nagios
_nowhere_

Oft kommt die Frage auf ob man mit den Performancedaten, die von Nagios und ähnlichen System erhoben werden, nicht auch Vorhersagen treffen kann, etwa wie sich die Systeme in den nächsten Tagen und Wochen entwickeln. Aus diesem Grund wird im Folgenden vorgestellt, wie man dies erreichen kann.

more...

IDoc ist das Austauschformat von SAP ERP-Systemen, welches benutzt wird, um per Import und Export Daten sowohl untereinander als auch mit Fremdsystemen auszutauschen. Typische Beispiele solcher Daten sind Bestellungen, Lieferscheine, Überweisungen, Stundenbuchungen, etc. Ein IDoc besitzt neben Control- und Data-Records auch Status-Records, in denen jeder einzelne Verarbeitungsschritt protokolliert wird. Diese Status-Records werden in der Tabelle EDIDS gespeichert. Die neue Version 1.9 von check_sap_health kennt den Mode failed-idocs, mit dem in EDIDS nach Fehlermeldungen gesucht wird.

more...

Author:Gerhard Laußer
Tags:Nagios, Plugins, SAP, IDOC, Netweaver
Categories:nagios, omd

Seit der Version 2.6.3 von check_mssql_health ist es möglich, den für das Monitoring benötigten Datenbankbenutzer direkt vom Plugin erzeugen zu lassen. Angenommen, der Benutzer soll NAGIOS heißen und das dazugehörige Passwort ES_ku_el. Der Plugin-Aufruf lautet dann:

<br />
$ check_mssql_health –hostname dbsrv1 –port 1433 \<br />
    –username sa –password ‘Str3ng!g3heim’ \<br />
    –mode create-monitoring-user \<br />
    –name NAGIOS –name2 ‘ES_Ku_el’ <br />

Anstelle des Benutzers sa kann man auch jeden beliebigen Administrator-Account nehmen. NAGIOS wird in jeder einzelnen Datenbank angelegt. Kommen neue Datenbanken dazu, so wiederholt man einfach den create-monitoring-user-Befehl.

Author:Gerhard Laußer
Tags:Nagios, Plugins, MS SQL
Categories:nagios, omd
Reguläre Schwellwerte

In der neuesten Version von GLPlugin habe ich die Möglichkeit vorgesehen, Thresholds auch als reguläre Ausdrücke anzugeben. Wie schaut das nun genau aus?

<br />
$ check_wut_health –hostname dcenv2.de.xxxx –community public –mode sensor-status<br />
OK - return air temperature Unit 1.1 is 21.40C, humidity Unit 1.1 is 49.40%, return air temperature Unit 2.1 is 22.40C, humidity Unit 2.1 is 46.80% | ‘temp_Unit 1.1’=21.40;25;28;; ‘hum_Unit 1.1’=49.40%;40:60;35:65;0;100 ‘temp_Unit 2.1’=22.40;25;28;; ‘hum_Unit 2.1’=46.80%;40:60;35:65;0;100<br />

Wir sehen hier die hartcodierten Default-Schwellwerte 25 und 28 für die Temperatur bzw. 40:60 und 35:65 für die Luftfeuchtigkeit.
Bisher gab es zwei Möglichkeiten, diese zu ändern, z.b. in 20 und 30 für die Temperaturen zu ändern.

more...

Author:Gerhard Laußer
Tags:Nagios, Plugins
Categories:nagios, omd

_nowhere_ “Sakuli”, das Open-Source-Framework zum automatisierten Testen von Applikationen, ist vor kurzem in Version 1.0 erschienen. Ein kleiner Blick auf die zurückliegenden Änderungen.

more...

Author:Simon Meggle
Tags:e2e, end2end, monitoring, nagios, omd, sakuli
Categories:sakuli, omd, nagios, development

The host- and servicecheck scheduling of Nagios has always been some kind of black box. Checks pile up when using timeperiods which often leads to performance issues while the Nagios host idles again just a minute later. Latest Thruk release (2.06) ships a new addon which visualizes and alleviates this issue.

Core Scheduling Plugin

more...

Author:Sven Nierlein
Tags:omd, nagios, icinga, thruk
Categories:omd, nagios
Sakuli v0.9.2 Released

Sakuli todays release is a great milestone because it introduces a brand new graphical installer and a bunch of other features!
Sakuli installer

Download and check it out sakuli-v0.9.2-installer.jar!

more...

Author:Tobias Schneck
Tags:e2e, end2end, monitoring, nagios, omd, sakuli
Categories:sakuli, omd, nagios, development

OMD Labs Edition 2.10 in has been released today. The OMD Labs Edition is based on the standard OMD but adds some
more useful addons like Grafana and Influxdb or additional cores like Icinga 2 and
Naemon. Todays release is a great milestone because it introduces grafana based graphing out of the box in the usual easy OMD way.

more...

Author:Sven Nierlein
Tags:omd, nagios, grafana, thruk
Categories:omd, nagios

In der OMD Labs Edition gibt es seit kurzem die Möglichkeit, die Performance-Daten in einer InfluxDB zu speichern. Die Daten werden dabei von der Komponente Nagflux in die InfluxDB geschrieben, Histou übernimmt das Erzeugen der Graphen auf Basis von Templates und Grafana übernimmt die eigentliche Anzeige.

Einen ausführlichen Vortrag vom Autor von Nagflux und Histou, Philip Griesbacher, wird es auf der diesjährigen OSMC geben.

Das Aktivieren des kompletten Gespanns ist ab der Version omd-2.01.20151021-labs-edition aus unserem Testing-Repository in einer OMD site sehr einfach möglich. Erfahrene OMD-Benutzer verwenden die folgenden Kommandos, für OMD-Einsteiger gibt es die ausführlichere bebilderte Anleitung weiter unten.

<br />
omd config set PNP4NAGIOS off<br />
omd config set GRAFANA on<br />
omd config set INFLUXDB on<br />
omd config set NAGFLUX on<br />

more...

Author:Michael Kraus
Tags:Grafana, Nagflux, InfluxDB, Nagios, Icinga
Categories:nagios, omd
Lidl sucht Mitarbeiter

Unser Kunde Lidl setzt beim Monitoring seiner europaweiten IT-Landschaft in großem Umfang Tools und Plugins von ConSol-Labs ein. Neu- und Weiterentwicklungen der check_*_health-Plugins oder Thruk entstehen häufig im Auftrag von Lidl, wobei die Kollegen dort im Gegensatz zu anderen Unternehmen kein Problem damit haben, die Ergebnisse der Öffentlichkeit zur Verfügung zu stellen. Von diesem Engagement für die Open-Source-Community kann sich mancher eine Scheibe abschneiden.

Unter https://www.it-bei-lidl.com/ findet sich eine Stellenausschreibung für den Bereich Geschäftsprozess-Monitoring. Ich habe das technische und menschliche Umfeld von Lidl kennengelernt und kann nur empfehlen, sich dort zu bewerben. Es erwartet einen eine tiptop gemanagte IT-Landschaft, die so ziemlich jede zeitgemäße Technologie umfasst. Und natürlich Monitoring made by ConSol.

Und jetzt kommt Werbung….

Author:Gerhard Laußer
Tags:OMD, Nagios, Thruk, check_nwc_health
Categories:nagios, omd

Beim Monitoring von Netzwerkinterfaces ist es üblich, daß man vier Services konfiguriert. Jeweils einen für Status (up/down), Bandbreite, Errors und Discards. Gelegentlich gab es auch die Anforderung, das alles in einen einzigen Service zu packen, in dem Fall half dann check_multi. Zwar wurde jeweils auch die Konfigurationsdatei für check_multi mit coshsh generiert, aber je simpler, desto besser, daher habe ich einen neuen Modus interface-health eingeführt, so daß check_nwc_health diese vier Checks selber bündelt.

<br />
$ check_nwc_health –hostname 10.37.6.2 –community kaas \<br />
    –mode interface-health –name FastEthernet0/0<br />
OK - FastEthernet0/0 is up/up, interface FastEthernet0/0 usage is in:0.01% (12041.88Bits/s) out:0.00% (1435.76Bits/s), interface FastEthernet0/0 errors in:0.00/s out:0.00/s , interface FastEthernet0/0 discards in:0.00/s out:0.00/s  | ‘FastEthernet0/0_usage_in’=0.01%;80;90;0;100 ‘FastEthernet0/0_usage_out’=0.00%;80;90;0;100 ‘FastEthernet0/0_traffic_in’=12041.88;80000000;90000000;0;100000000 ‘FastEthernet0/0_traffic_out’=1435.76;80000000;90000000;0;100000000 ‘FastEthernet0/0_errors_in’=0;1;10;; ‘FastEthernet0/0_errors_out’=0;1;10;; ‘FastEthernet0/0_discards_in’=0;1;10;; ‘FastEthernet0/0_discards_out’=0;1;10;;<br />

Author:Gerhard Laußer
Tags:plugin, Nagios, Icinga, check_nwc_health, cisco, juniper
Categories:nagios, omd

_nowhere_Das Plugin check_nwc_health erfreut sich größter Beliebtheit beim Monitoring von Komponenten in den Core-, Access- und Distribution-Layern, oder kurz: den Netzwerkkomponenten innerhalb von Gebäuden und Standorten.
Das WAN-Monitoring geht aber weit über die üblichen Hardware/CPU/Memory/Interfaces-Checks hinaus.
Für einen OMD-Kunden wurde das Plugin so erweitert, daß er sein europaumspannendes Netzwerk, bestehend aus mehreren tausend WAN-Knoten, umfassend überwachen kann. Den Vergleich mit schweineteuren proprietären Lösungen braucht das Gespann OMD/check_nwc_health seitdem nicht mehr zu fürchten.

more...

Author:Gerhard Laußer
Tags:plugin, Nagios, Icinga, check_nwc_health, ospf, wan, cisco, bgp, mpls, vpn
Categories:nagios, omd

Es gibt wieder mal ein neues Plugin, diesmal geht es um die Überwachung von Postfächern/Mailservern/Mailempfang etc. Mit [check_mailbox_health][1] prüft man,

  • ob ein Mailserver antwortet bzw. ein Login zulässt
  • Mails im Postfach liegen
  • wie alt diese sind
  • ob sie ein bestimmtes Subject haben (oder ein Suchmuster im Text vorkommt)
  • ob sie Attachments (ggf. eines bestimmten Typs) haben

Mit check_mailbox_health lassen sich so auch nicht ganz triviale, auf Mail basierende Geschäftsvorgänge monitoren.

more...

Author:Gerhard Laußer
Tags:plugin, Nagios, Icinga, check_mailbox_health, imap
Categories:nagios, omd

_nowhere_ Aller guten Dinge sind drei. Bisher konnte man mit [check_nwc_health][1] die lokalen Interfaces von Linux und Windows-Rechnern überwachen, jetzt geht das auch bei Solaris. Das Betriebsteam eines MySQL-Cluster auf Oracle Solaris wollte die Auslastung der Netzwerk-Interfaces aufzeichen, da die übertragene Datenmenge sich allmählich dem GBit/s-Bereich nähert.

more...

Author:Gerhard Laußer
Tags:Nagios, omd
Categories:nagios, omd, solaris, oracle

_nowhere_ Today [Thruk][1] has released version 2.00 wich is a great milestone and a huge step forward. Instead of adding lots of things, we tried to remove unnecessary dependencies. Version 2.00 comes without the Catalyst framework and many performance improvements, especcially on larger setups.

more...

Author:Sven Nierlein
Tags:Nagios, Thruk, omd, Icinga, naemon
Categories:nagios, omd, thruk, naemon

Jeder Icinga-Admin kennt das: Ein Gerät, eine Applikation oder eine Datenbank soll überwacht werden, es gibt auch eine extra Monitoring-Kennung dafür, aber das zugehörige Passwort ist einfach nur grauenhaft. Sei es aufgrund einer Vorschrift oder weil der DBA ein Sadist ist, häufig enthält das Passwort Zeichen, welche bei der Ausführung des Plugins durch eine Shell Probleme bereiten können. Dazu zählen alle Arten von Anführungszeichen, Strichpunkt, Kaufmanns-Und oder gar nicht druckbare Zeichen.
So eine Command-Definition

<br />
define command {<br />
  command_name check_mssql_health<br />
  command_line $USER1$/check_mssql_health --hostname $ARG1$ --username ‘$ARG2$’ --password ‘$ARG3$’ …<br />
}<br />

schließt zwar den ganzen Dreck in einfache Hochkommas ein, aber was, wenn das Passwort selber ein Hochkomma enthält?

Current Status:WARNING (for 0d 0h 6m 3s)
Status Information:[sh: -c: line 0: unexpected EOF while looking for matching `''
sh: -c: line 1: syntax error: unexpected end of file]


Damit das nicht passiert und auch die Icinga-Konfigurationsdateien von Sonder- und Schmierzeichen aller Art verschont bleiben, können die Plugins aus der check_*_health-Familie sowie check_hpasm seit den letzten Releases mit encodierten Passwörtern versorgt werden. Man hantiert also nur noch mit [A-Za-z0-9].

more...

Author:Gerhard Laußer
Tags:Nagios, check_oracle_health, check_mssql_health, check_hpasm, coshsh
Categories:nagios, omd


Eine neue Ausgabe der ConSol-Monitoring-Minutes ist seit heute bei Youtube online. Matthias Gallinger erklärt, wie man in einer DMZ einen Gearman-Worker einrichtet, ohne daß man sich beim Firewall-Admin unbeliebt macht.

Author:Gerhard Laußer
Tags:Nagios, mod-gearman, dmz
Categories:nagios, omd

Das Tape-Library-Plugin check_tl_health kann mittlerweile die meisten Geräte überwachen, die bei unseren Kunden im Einsatz sind. Kommen neue Modellvarianten hinzu, so werden diese i.d.R. vom Plugin erkannt. Möglich ist dies, weil gängige MIBs wie QUANTUM-SMALL-TAPE-LIBRARY-MIB, SEMI-MIB, SL-HW-LIB-T950-MIB, UCD-SNMP-MIB, ADIC-INTELLIGENT-STORAGE-MIB, ADIC-INTELLIGENT-STORAGE-MIB, BDT-MIB, … bereits enthalten sind. Durch Prüfen charakteristischer OIDs wird ermittelt, welche MIBs die zu überwachende Library implementiert hat, danach wird der entsprechende Zweig mit den spezifischen Abfragen ausgeführt.

more...

Author:Gerhard Laußer
Tags:Nagios, HP, Quantum, StorEver, FlexStor, i6000
Categories:nagios, omd

Beim Monitoring von SAP mit check_sap_health wurden bisher die Bereiche CCMS, Verbuchungssystem und Shortdumps abgedeckt. Mit der neuen Version können nun auch Hintergrundjobs überwacht werden. Folgende Anforderungen wurden implementiert:

  • check_sap_health soll Jobs melden, welche einen fehlerhaften Status haben. Würde man in SM37 nachschauen, dann würde man bei diese(n) Job(s) den Status aborted angezeigt bekommen
  • Defaultmäßig interessiert sich das Plugin nur für die vergangenen 60 Minuten, also die Jobs die in der letzten Stunde fertig geworden (oder abgebrochen) sind. Eine andere Zeitspanne ist einstellbar (so gibt es das auch beim Shortdump-Check). Dadurch hat der Service bei einem üblichen 5-Minuten-Check-1-Minute-Retry-Intervall die Gelegenheit, kritisch zu werden und eine Notification zu verschicken und nach kurzer Zeit wieder grün zu werden.
  • Die Sicht des Plugins kann mit Hilfe des Parameters --name auch auf bestimmte Jobs eingegrenzt werden. Es interessiert sich dann ausschließlich für Jobs dieses Namens. Damit lassen sich eigene Services einrichten, die speziell die Jobs bestimmter Applikationen bzw. des Systeme überwachen.
  • Bei allen Jobs, die in den letzten 30 Minuten fertig geworden sind, wird die Laufzeit mit vorgegebenen Schwellwerten verglichen. (--warning/critical). Bei Überschreitung gibt es Alarm. Die Laufzeit wird als <jobname>_runtime=… in den Performancedaten auftauchen.

more...

Author:Gerhard Laußer
Tags:Nagios, SAP, omd, Icinga, naemon, Netweaver
Categories:nagios, omd

One of the most often requested features is the possibility to place hosts, services and host/servicegroups on a geomap.
Now with release 1.88 Thruk made a major change in its panorama dashboard to support this kind of map too.

more...

Author:Sven Nierlein
Tags:Nagios, Thruk, omd, Icinga, naemon, Dashboard, GeoMap
Categories:nagios, omd, thruk, naemon

Mit den bisherigen Versionen von check_sap_health verband man sich unter Angabe von Hostname und System-Nummer direkt mit einem NetWeaver Application Server, um CCMS-Metriken abzufragen oder Geschäftslogik zu monitoren. In einer größeren Umgebung mit mehreren Application Servern gibt es noch eine weitere Komponente, die in der Überwachung nicht fehlen darf: Der Message Server der Zentralinstanz.
Seit der Version 1.4 kann sich check_sap_health nun auch zu diesem Server verbinden. Sogar der Weg über einen SAProuter ist möglich, so daß auch noch dieser wichtige Bestandteil einer SAP-Landschaft vom Monitoring abgedeckt wird.

more...

Author:Gerhard Laußer
Tags:sap, netweaver, rz20, ccms, mshost, ashost, saprouter
Categories:nagios

Wem meine Folien zum Thema Netzwerkmonitoring mit check_nwc_health zu trocken sind kann sich meinen Vortrag auch als Video anschauen. Film ab!

Author:Gerhard Laußer
Tags:cisco, Icinga, juniper, naemon, Nagios, plugin, Shinken, snmp, conference, talk
Categories:nagios

Vorgestern habe ich auf der diesjährigen Open-Source-Monitoring-Konferenz in Nürnberg einen Vortrag über check_nwc_health gehalten.
Hier sind die Folien für diejenigen, die das Pech hatten, nicht dabei zu sein (damit meine ich die Konferenz an sich, nicht meinen Vortrag)

Author:Gerhard Laußer
Tags:cisco, Icinga, juniper, naemon, Nagios, plugin, Shinken, snmp, conference, talk
Categories:nagios

Ich habe in letzter Zeit viel Aufwand in die Entwicklung bzw. Erweiterung von SNMP-Plugins gesteckt. Die, die ich veröffentliche habe sind: check_nwc_health für Netzwerkkomponenten, check_ups_health für unterbrechungsfreie Stromversorgungen und check_tl_health für Tape Libraries. Allen drei haben gemeinsam, daß sie bei einheitlichem Kommandozeilenformat möglichst viele unterschiedliche Hersteller und Modelle abdecken. Wenn ich nun eine neue Anforderung bekomme und ein Plugin für ein bisher unbekanntes Gerät erweitern muss, dann brauche ich erstmal eine Übersicht über die MIBs und OIDs, welche bei diesem Gerät implementiert wurden. Ich kann natürlich die Dokumentation durchschauen, aber die steht nicht immer zur Verfügung bzw. ist nicht sehr aufschlussreich. Ein Snmpwalk ist auch einer der ersten Schritte, aber der liefert mir einfach nur endlose Zahlenkolonnen, die ich mühsam interpretieren muss. Daher habe ich einen --mode supportedmibs eingeführt, mit dessen Hilfe ich die Namen der unterstützten MIBs angezeigt bekomme.

more...

Author:Gerhard Laußer
Tags:check_nwc_health, Nagios, Plugins, snmp
Categories:nagios

Usually we monitor processes with Nagios or Naemon but sometimes you want to have really detailed graphs of resource usage of single processes in realtime resolution. Maybe to find and visualize memory leaks or to watch resource usage over time. Nagios based solutions are not worth the effort since you probably just want to nail down a specific single problem. So i used this opportunity to write a small desktop application with node-webkit.

more...

Author:Sven Nierlein
Categories:misc, nagios

Mit Sakuli lassen sich unabhängig vom Betriebssystem User-Aktionen in Anwendungen (Fat-Client, Citrix, Web, …) simulieren; die Stati und dabei gemessenen Laufzeiten werden von Nagios ausgewertet und visualisiert. Unter der Haube stecken die Tools

die wir unter dem Namen “Sakuli” über ihre gemeinsame API zu einem Team zusammenspannt und auf GitHub veröffentlicht haben.

more...

Author:Simon Meggle
Tags:e2e, end2end, monitoring, Nagios, omd, sakuli
Categories:nagios, omd, sakuli

Bei der Ablösung des alten SAP-Monitorings eines unserer Kunden bin ich über Ungereimtheiten beim Auslesen von CCMS-Metriken gestolpert. Nicht alle Werte, welche man per RZ20 in der SAP-GUI angezeigt bekommt, werden nagios-seitig korrekt wiedergegeben. Teilweise sind die Messwerte um den Faktor 1000 zu hoch und werden so auch in den entsprechenden RRD-Files abgespeichert bzw. sorgen für ungläubiges Kopfschütteln. Das ist beispielsweise dann der Fall wenn der SAP-Server eine Load von 7.06 hat, laut Monitoring aber 706. Bisher ist das halt nicht aufgefallen, weil üblicherweise der von SAP gelieferte Status eins zu eins in Nagios verwendet wurde.

Update 23.6.14: im Git von check_mk wurde mein Patch mittlerweile eingespielt.
Update 26.6.14: im Git von Netways auch.
Update: Die beiden angemeckerten Plugins sind (Stand 26.6.14) gefixt und somit ist meiner Stänkerei jede Grundlage entzogen. Alles ist gut :-)

 

more...

Author:Gerhard Laußer
Tags:ccms, mte, rz20, sap
Categories:nagios, omd, shinken
Naemon & Thruk

Auf dem diesjährigen Monitoring Workshop in Berlin durfte ich Neuigkeiten aus 2 Projekten vorstellen.

more...

Author:Sven Nierlein
Tags:Business Process, Dashboard, Nagios, reporting, Thruk
Categories:naemon, nagios, thruk

Monitoring von SAP mit den bisher vorhandenen Plugins beschränkte sich auf die Abfrage von CCMS-Metriken. In einem SAP-System steckt aber noch viel mehr, das sich überwachen lässt. Check_sap_health ist ein neues Plugin, welches in Perl geschrieben wurde. Es entstand in einem Projekt, bei dem von unterschiedlichen Standorten aus die Laufzeiten von BAPI-Aufrufen gemessen werden sollten. Durch die einfache Erweiterung des Plugins um selbstgeschriebene Perl-Elemente lassen sich beliebige Funktionen per RFC aufrufen und somit firmenspezifische Logik implementieren.

more...

Author:Gerhard Laußer
Tags:bapi, ccms, Icinga, naemon, Nagios, netweaver, rfc, rz20, sap, Shinken
Categories:naemon, nagios, omd, shinken

 

2296OS

Der Verlag Packt Publishing ist an mich herangetreten und hat mich gebeten, eine Rezension zum soeben erschienenen Buch Icinga Network Monitoring von Viranch Mehta zu schreiben.

Eigentlich hatte ich keine Zeit, aber wenn mir jemand mit „Keeping in mind your knowledge in this subject and having looked at your contributions, I feel you'd make an excellent reviewer of this book.“ kommt, dann werde ich natürlich schwach.

Das Buch richtet sich an eine Leserschaft, die bisher keinen Kontakt zur Icinga (bzw. Nagios, Naemon oder Shinken) hatte. Linux-Kenntnisse werden aber dennoch vorausgesetzt. Ziel des Autors war es, eine nachvollziehbare (im Sinne von: sofort am Rechner umsetzbar) und möglichst vollständige Anleitung zu erstellen, anhand derer ein Icinga-Neuling (mit ein bisschen Hirnschmalz sind die Schritte aber auch auf die o.g. Geschwister von Icinga anwendbar) in kurzer Zeit ein Basis-Monitoring für seine IT-Landschaft aufsetzen kann.

more...

Author:Gerhard Laußer
Tags:Icinga, linux, Nagios, Shinken
Categories:nagios

A few months ago, Andreas Ericsson, the main developer of Nagios 4, has been kicked from the Nagios Developer Team for personal reasons. So he decided to continue development in a new fork called Naemon. The result so far is quite impressive.

more...

Author:Sven Nierlein
Categories:nagios
OMD 1.10 Release

OMD-LOGO_FINAL2 The developer team of OMD (Open Monitoring Distribution) released the version 1.10 today.

This version contains lots of updated packages including Thruk 1.80, Mod-Gearman 1.4.14, NagVis 1.8, check_mk 1.2.2p3 and many more.

Using the OMD Repository installation is as simple as a apt-get install omd. If you have an rpm-based system, it's as simple as yum install omd or zypper install omd.

Author:Sven Nierlein
Categories:mod-gearman, nagios, omd, thruk
Nagios belches Lava

This is the story, how I increased Nagios’ WAF by hooking up a Lava Lamp for notifying when the wood-burning stove needs to be inflamed.

more...

Author:Roland Huß
Categories:nagios

Business Prozesse in Nagios zu modellieren gehört zu den beinahe täglich anstehenden Aufgaben beim Thema Monitoring. Die neueste
Thruk Version (v1.78) bringt nun ein Business Prozess Addon mit dem sich Prozesse einfach per Gui modellieren lassen.

more...

Author:Sven Nierlein
Categories:nagios, omd, thruk

Lange hat’s gedauert, aber seit heute kann man sich das Debian-Paket für OMD-1.00 vom ConSol-Labs-Repository herunterladen.

root@raspberrypi:~# apt-get install omd-1.00

Die Maschinen unserer Kunden, auf denen wir uns tagtäglich bewegen und Monitoring-Systeme betreiben, haben üblicherweise CPUs und Gigabytes im zweistelligen Bereich. Da wird es schon zur Geduldsprobe, wenn ein Build auf dem Raspberry Pi den halben Tag braucht. Ein ARM11 ist eben kein Xeon und SD ist nicht SSD.

more...

Author:Gerhard Laußer
Tags:arm, Icinga, Nagios, odroid, omd, omdistro, raspberry, raspberry pi, Shinken
Categories:nagios, omd

Changing major releases on linux is always a risk, but Debian / Ubuntu dist-upgrades really worked fine the last years. If you are using OMD (Open Monitoring Distribution) for Nagios/Icinga/Shinken, then the release-update would disabled 3rd party repositorys and therefore remove your OMD installations during the update. This is usually not what you want, but with a small trick, updates work smoothly.

more...

Author:Sven Nierlein
Categories:nagios, omd
OMD 1.00 just arrived

OMD-LOGO_FINAL2 The developer team of OMD (Open Monitoring Distribution) released the version 1.00 today. Three years after the project started we decided it was time to show that OMD is no longer under development but is a mature, proven product.

This version contains lots of updated packages including Nagios 3.5.0, Shinken 1.4, Multisite 1.2.2p2, Thruk 1.72, PNP4Nagios 0.6.21, NagVis 1.7.1, check_mk 1.2.2p2 and many more.

Using the OMD Repository installation is as simple as a apt-get install omd. If you have an rpm-based system, it's as simple as yum install omd or zypper install omd.

For those who weren't using OMD yet, now there is no more reason to hesitate.

Author:Gerhard Laußer
Tags:Icinga, monitoring, Nagios, omd, Shinken
Categories:nagios, omd

fritzdect200-smallIm Februar bestellt und in der letzten Mai-Woche eingetroffen. Die intelligenten Steckdosen von AVM scheinen heiss begehrt zu sein. Jedenfalls kann ich jetzt über meine FRITZ!BOX aufzeichnen, wieviel Strom gewisse Geräte momentan oder aber über einen langen Zeitraum verbrauchen.
Von Berufs wegen juckt's mich natürlich jedesmal in den Fingern, wenn irgendwo Messwerte anfallen. Mein Plugin check_nwc_health kann ja bereits CPU, Speicher und Interfaces einer FRITZ!BOX 7390 abfragen, also war klar, daß die Überwachung der FRITZ!DECT 200 bzw. des gemessenen Energieverbrauchs unbedingt dazugehört.

Die fünfte Ausgabe der ConSol Monitoring Minutes, die sich mit diesem Thema befasst, ist heute ebenfalls entstanden.

more...

Author:Gerhard Laußer
Tags:avm, dect, fritz!box, Icinga, Nagios, Shinken
Categories:monitoring minutes, nagios, omd, shinken, thruk

mm_mg Wie in der dritten Folge schon angekündigt, habe ich zum Thema HSRP ein eigenes Filmchen erstellt. Hier ist die vierte Folge der ConSol Monitoring Minutes, in der gezeigt wird, wie eine mit dem HSRP-Protokoll redundant gemachte Gruppe von Cisco-Routern mit check_nwc_health überwacht wird.

more...

Author:Gerhard Laußer
Tags:cisco, hsrp, Icinga, Nagios, Shinken, snmp
Categories:monitoring minutes, nagios, omd, shinken, thruk

mm_mg

Soeben erschienen: die zweite Folge der ConSol Monitoring Minutes. Getreu unserem Motto “aus der Praxis für die Praxis” zeigen wir darin live, wie die Checks einer großen Nagios-Installation (hier: einer OMD-Site) mit Mod-Gearman an Worker delegiert werden können.

Beim “Schweizer Taschenmesser” OMD (erhältlich über das ConSol-Repository) ist Mod-Gearman bereits integriert.

more...

There won’t be general multi-language support in Thruk, but you may now choose different languages for your reports. The brand new release v1.64 comes with 5 built-in languages and it’s
super easy to add a new one.

more...

Author:Sven Nierlein
Tags:Nagios, omd, reporting, Thruk
Categories:nagios

Cisco WLC dienen dazu, Access Points zu verwalten und an ein Backbone-Netz anzubinden. Es gibt zwar schon ein paar Plugins, um diese Geräte mit Nagios zu überwachen, aber ich mag es nicht, für jeden Service ein eigenes Plugin installieren zu müssen. Daher hat das Schweizer Taschenmesser check_nwc_health jetzt eine weitere Klinge bekommen.

more...

Author:Gerhard Laußer
Tags:check_nwc_health, cisco, Icinga, Nagios, Shinken, wlan, wlc
Categories:nagios, shinken

Consulting im Bereich Monitoring wird nie langweilig. Ständig wird man mit neuen Anforderungen konfrontiert, so wie vergangene Woche:

Blue Coat ProxyNG Appliances sollten überwacht werden, genauer gesagt das Modell SG600. Diese Appliances finden Verwendung in Application Delivery Networks (ADN), wo sie für die performante Auslieferung von Geschäftsanwendungen und Schutz vor web-basierten Bedrohungen sorgen.
Und jetzt zum Monitoring…

more...

Author:Gerhard Laußer
Tags:blue coat, check_nwc_health, Icinga, Nagios, plugin, proxyng, Shinken
Categories:nagios

Anlässlich der neuen Videoserie "ConSol Monitoring Minutes" habe ich mir überlegt, wie man die Zahl der Zugriffe auf ein YouTube-Video mit einem Nagios-Plugin auslesen und mit PNP4Nagios aufzeichnen kann. Ein eigenes Plugin müsste dazu die Informationen herunterladen, Kennzahlen aus dem Resultat herausparsen, ausgeben und nicht zuletzt irgendwie auf Download-Fehler reagieren. Mit check_logfiles, einer kleinen Konfigurationsdatei und der YouTube-API ist das aber kein Problem.

more...

Author:Gerhard Laußer
Tags:check_logfiles, heino, Icinga, Nagios, Shinken, youtube
Categories:monitoring minutes, nagios, shinken

Zu Hause habe ich eine Firewall/VPN-Appliance NS5GT stehen, die bisher noch nicht überwacht wurde. Schlag den Raab, Deutschland sucht den Superstar, Navy CIS und Andrea Berg – Die 20 Jahre Show waren der Grund dafür, dass sich das jetzt ändert. Aus Langeweile habe ich CPU- und Memory-Monitoring für die NS5GT implementiert. Das Plugin check_nwc_health ist also wieder um ein Feature reicher.

more...

Author:Gerhard Laußer
Categories:nagios, omd, shinken

Einer unserer Kunden, der check_mssql_health bereits intensiv nutzt, hat mich beauftragt, neue Anforderungen seiner DBAs umzusetzen.
Hier ist das Ergebnis:

more...

Author:Gerhard Laußer
Tags:dbcc, fn_trace_gettable, grow event, shrink event, sjobh, SQL Server, sybase
Categories:nagios, shinken

Die neuen Proliant Gen8 scheinen seit September Einzug in die Rechenzentren zu halten. Damals erhielt ich die erste Mail, in der mir von unrealistischen Ergebnissen berichtet wurde. Anscheinend waren bei mehreren Temperatursensoren im Server Schwellwerte von -99 Grad registriert. Zumindest war das der Wert, den die Sensoren meldeten, wenn sie mit check_hpasm abfragt wurden.

more...

Author:Gerhard Laußer
Tags:check_hpasm, gen8, proliant
Categories:nagios, shinken

We often get asked about nagios server sizing, so we did some benchmarking. Here are the results.

more...

Author:Sven Nierlein
Categories:mod-gearman, nagios, omd

Während der letzten Wochen habe ich viel Geduld aufgebracht, um auf meinem neuen Raspberry Pi die Open Monitoring Distribution zu bauen und zuletzt ein Debian-Install-Paket zu erstellen. Geduld deshalb, weil ein “make” schon mal einen Tag und mehr läuft. Wenn dann immer wieder Anpassungen im Build-Prozess für diese spezielle Hardware nötig sind, zieht sich das ganze Unternehmen ordentlich in die Länge. Aber nun ist es überstanden und die Version 0.56 von OMD kann auf dem Raspberry Pi installiert werden.

more...

Author:Gerhard Laußer
Tags:Nagios, omd, omdistro, raspberry, Shinken
Categories:nagios, omd

Since Version 1.46 of Thruk the number of problems can be dynamically viewed in Thruks favicon. This is quite handy for creating a pinned app tab in Firefox.

more...

Author:Sven Nierlein
Categories:nagios, omd, shinken, thruk

Thruk uses the mod_fcgid apache module which makes Thruk start on the first request. The user then gets a “waiting” page till the fastcgi server has started. When using Thruk all the time, there is no reason to wait till someone makes the first request and you can just fire up the init script after apache starts.

In normal installations there is an rc script in /etc/init.d/thruk which fakes a request and makes the fastcgi server start.

 root@mo:~ #> /etc/init.d/thruk start
 Starting thruk.........(10492) OK

In OMD its even easier, latest snapshots have so called ‘init-hooks’ which are executed after the rc script. You
need to create two files in your site:

  • etc/init-hooks.d/apache-start-post
  • etc/init-hooks.d/apache-reload-post

One of them can be a symlink, because both files will have the same content:

 #!/bin/sh
 # check return code of apache start
 if [ $4 = 0 ]; then
   ./etc/init.d/thruk start
 fi

So when ever your apache starts / reloads, for example after logfile rotation, thruk will immediatly start too.

Author:Sven Nierlein
Categories:nagios, omd, thruk
Intensivkurs Jmx4Perl

Jmx4Perl und
Jolokia haben sich mittlerweile zum
de-Facto-Standard beim Nagios-Monitoring von Java entwickelt. Das
belegen etliche Blog-Postings, die Downloadzahlen und zahlreiche
Kundenprojekte, die ConSol durchgeführt hat.

Aus der Erfahrung von über einem Dutzend individueller Workshops haben
wir einen Intensivkurs destilliert, der in Bezug auf die Nagios-Anbindung von JEE-Applikationsservern keine Fragen mehr offen lässt.

In dieser Schulung lernen Administratoren, das Maximum aus Jmx4Perl
herauszuholen. Neben theoretischen Grundlagen wird vor allem viel Wert
auf praktische Übungen gelegt.

Weiterer Details zum Inhalt und eine Online-Anmeldung finden sich
unter
http://www.consol.de/allgemein/schulung-java-monitoring-mit-nagios/

Fragen zu dem Kurs beantworten wir auch gerne hier in den Kommentaren
oder im Forum.

Author:Gerhard Laußer
Categories:jmx4perl, jolokia, nagios
Thruk 1.36 Released

Version 1.36 of the Thruk monitoring gui has just been released. The changelog is quite huge this time. There is a new dashboard plugin called the ‘Panorama View’ Addon. There are a lot more reports included now. And finally there is a plugin manager included in the config tool which lets you easily manage your plugins and addons.

more...

Author:Sven Nierlein
Tags:Nagios, omd, Shinken, Thruk
Categories:nagios, thruk

Monitoring Unix clients is very easy with the check_by_ssh plugin. The only prerequisite is public-key-based access and installation of some plugins on the remote side. Then, running a check is as easy as:

<br />
check_by_ssh –host 10.177.3.39 –logname nagios \<br />
    –command “lib/nagios/plugins/check_swap -w 15% -c 8%”<br />

The drawback of this method is extra load on the nagios server. With every check, a ssh process is forked which has to do a complete handshake with the remote side. With newer ssh implementations it is possible to have a persistent connection which requires only one handshake at startup. All the following ssh connects use the already established connection, which saves a lot of cpu cycles.
Here are the instructions to combine check_by_ssh with such a persistent tunnel.

more...

Author:Gerhard Laußer
Tags:check_by_ssh, controlmaster, Nagios, omd, Shinken, ssh
Categories:nagios, omd

The well-known plugin check_by_ssh is a wrapper around the ssh client program. Unfortunately the path to ssh is defined at compile-time and remains hard-coded in the check_by_ssh binary. Usually this is /usr/bin/ssh. If you want to use features which are not implemented in your distribution’s ssh, but in an alternative ssh binary, you have to recompile check_by_ssh. Here is a patch which makes it easy to switch between multiple ssh binaries using a command line parameter.

more...

Author:Gerhard Laußer
Tags:check_by_ssh, controlmaster, Nagios, plugin, Shinken, ssh
Categories:nagios

Every now and then some of our 7x24 hosts / services need a daily or weekly maintmode for regular restarts. Normally you would have to create 2 new timeperiods because you don’t want both hosts in a cluster to be restarted at the same time. This is not just way to much work, it also adds unnecessary complexity because
nobody can see the maintmode unless you look into the config files.

Thats where recurring downtimes will become handy and latest Thruk Version includes this new feature.

more...

Author:Sven Nierlein
Tags:Nagios, omd, Thruk
Categories:nagios, omd, thruk

One of my bigger OMD installations consists of 13 sites. The visualization layer uses the Thruk interface. This alternative web ui can read data from multiple livestatus backends and display the host and service objects in one unified view. For this purpose i have one extra site called gui which only starts an apache process. I then point my browser to http://…./gui/thruk

The addresses of the livestatus backends have to be written into a config file, thruk_local.cfg. Now what if my list of 13 sites would be constantly changing? What if new OMD sites would be created, others deleted on a daily basis? I would have to edit the config file every time. With the new init-hook-feature, OMD will do this automatically for me.

more...

Author:Gerhard Laußer
Tags:livestatus, Nagios, Shinken, Thruk
Categories:nagios, omd, shinken, thruk

Keeping an eye on cpu usage of your servers is one of the basic things in system monitoring. For Nagios (and Shinken, of course) you’ll find plenty of plugins for this task. However, i was never happy with the way they work. Most of the plugins you can download work like this: read a counter - sleep - re-read the counter. This technique not only adds an extra delay to the execution time of the plugin, but it only shows the state of things within a small time frame. If you run such a plugin every 5 minutes and it sleeps 5 seconds between the two measurements, you don’t know what happens in the other 295 seconds. This is a very small sample rate.

more...

Author:Gerhard Laußer
Tags:check_logfiles, cpu, Icinga, linux, Nagios, Shinken
Categories:nagios, omd, shinken

You probably have noticed that development of the new Nagios-compatible monitoring system Shinken progresses very fast. Every few hours there is another commit at GitHub, where Shinken’s code repository is hosted. Now if you want to try all these new features immediately, there’s a very easy method which requires a simple update-command instead of a fresh install.

more...

Author:Gerhard Laußer
Tags:monitoring, Nagios, omd, Shinken, Thruk
Categories:nagios, omd, shinken
OMD 0.54 is available

OMD-LOGO_FINAL2 The developer team of OMD (Open Monitoring Distribution) released the version 0.54 today. This version contains bugfixes and lots of updated packages including Shinken 1.0.1, Thruk 1.26, PNP4Nagios 0.6.17, NagVis 1.6.5 and many more.

more...

Author:Gerhard Laußer
Tags:Mod-Gearman, Nagios, omd, Shinken, Thruk
Categories:nagios, omd, shinken, thruk

Virtualisierung spart Kosten und Ressourcen, stellt aber hohe Ansprüche an Verwaltung und Monitoring. Die schwedische Firma op5 entwickelte für ihr gleichnamiges Nagios-basierendes Produkt das Plugin check_esx3, welches ein umfassendes Monitoring von VMWare ESX-Umgebungen ermöglicht.

more...

Author:Simon Meggle
Tags:esx, esxi, Nagios, omd, Plugins, vmware
Categories:nagios

Version 1.2.6 of Mod-Gearman has just been released. You may now configure the worker queues by custom variables instead of host/servicegroups.

more...

Author:Sven Nierlein
Tags:Mod-Gearman, Nagios
Categories:mod-gearman, nagios

check_oracle_health, check_mysql_health, check_mssql_health und check_db2_health bringen von Haus aus schon eine Menge Funktionalität mit. Allerdings wurden sie speziell für die Belange von Datenbankadministratoren entwickelt. Um auch den Betreibern von datenbankgestützten Applikationen die Möglichkeit zu geben, bestimmte Werte per SQL abzufragen, gibt es den Parameter "--mode sql". Damit lässt sich das numerische Ergebnis eines SQL-Aufrufs mit Schwellwerten vergleichen und in einen Nagios-Exitcode verwandeln. Üblicherweise sind die Anforderungen der Applikation an das Monitoring jedoch etwas komplexer. Am Beispiel von check_mysql_health und Wordpress wird gezeigt, wie man so etwas einfach umsetzen kann.

more...

Version 1.2.2 of Mod-Gearman has just been released. It now comes with better orphaned check detection and easier installation for rpm based linux systems.

more...

Author:Sven Nierlein
Tags:Mod-Gearman, Nagios
Categories:mod-gearman, nagios

In my last post i was explaining why it became necessary to have an alternative to the sqlite-based storing of log data. One of the many new features of the upcoming release 1.0 “Heroic Hedgehog” of the Shinken monitoring software will be a MongoDB backend used by the livestatus module.

In this post i will show how to configure the livestatus module with a MongoDB cluster.

more...

Author:Gerhard Laußer
Tags:livestatus, mongodb, monitoring, Nagios, Shinken
Categories:nagios, shinken
Pimp my Livestatus

In the early days of the Shinken monitoring system you were quite limited in how many web user interfaces you could use. There was the old CGI-based Nagios-Webinterface or (thanks to the merlin-mysql broker module) the Ninja GUI from OP5.
At the same time, two Projects, Thruk and Multisite, became very popular. The success of these two web guis was mainly based on the way they communicated with the Nagios core.

more...

Author:Gerhard Laußer
Tags:livestatus, mongodb, Nagios, Shinken
Categories:nagios, shinken

The upcoming version 1.1.2 of Mod-Gearman will have embedded Perl support which greatly improves performance when you have lots of Perl checks.

more...

Author:Sven Nierlein
Tags:Mod-Gearman, Nagios
Categories:mod-gearman, nagios
Thruk Benchmarks

I often get asked if there are any benchmarks for Thruk so i finally decided to do some tests.

more...

Author:Sven Nierlein
Categories:nagios, omd, thruk
OMD 0.50 is available

The developer team of OMD (Open Monitoring Distribution) released the version 0.50 today. This version contains bugfixes and lots of updated packages including Shinken, Thruk, PNP4Nagios, Mod-Gearman, check_oracle_health and check_mysql_health.

more...

Author:Sven Nierlein
Tags:check_mysql_health, check_oracle_health, Nagios, omd, repository, Thruk
Categories:nagios, omd
Thruk Release 1.0.9

Thruk 1.0.9 has just been released and contains a couple of cool new features. This version will also be in the next OMD release. Besides the release itself, new documentation about plugins and themes has been published.

more...

Author:Sven Nierlein
Tags:Nagios, omd, Thruk
Categories:nagios, omd, thruk
OMD Repository

There is a now an ‘unofficial’ OMD Repository OMD Repository.
This makes new installations and upgrading your OMD sites even more easier.

more...

Author:Sven Nierlein
Tags:Nagios, omd
Categories:nagios, omd

Mod-Gearman 1.0.8 has been released (download).
This release mostly contains bugfixes only and a minor change to use the identifier more often.

more...

Author:Sven Nierlein
Tags:Mod-Gearman, Nagios
Categories:mod-gearman, nagios

Seit heute gibt es die Version 1.6.9 von check_oracle_health. Hauptzweck ist die Beseitigung eines Problems, das auftaucht, wenn man das Plugin unter OMD einsetzt. Daneben ist aber auch die Liste der Modi erweitert worden, um noch mehr Fehlersituationen in großen Oracle-Installationen rechtzeitig erkennen zu können.

more...

Author:Gerhard Laußer
Tags:check_oracle_health, datafiles, Nagios, ora-00059, oracle, rman
Categories:nagios, shinken
Thruk Release 0.94

Straight on the road to the Thruk 1.0 this will probably the last feature release so far.
The main focus was on usability and accessibility. This version will also be in the next OMD release.

more...

Author:Sven Nierlein
Tags:Nagios, Thruk
Categories:nagios, omd, thruk
OMD 0.46 is there!

The developer team of OMD released the version 0.46 last week. Now you will not only be able to run Nagios out of the box. Shinken has been added as an alternative core. This enables you to create one set of configuration files and switch between two monitoring technologies with only a few commands.

more...

Author:Gerhard Laußer
Tags:Nagios, omd, Shinken
Categories:nagios, omd, shinken

Wer sich die neueste Version von Icinga zum Ausprobieren herunterladen will, greift aus Bequemlichkeit sicher auf die virtuelle Maschine zurück, die bereits eine vorgefertigte, vollständige Installation enthält. Das dabei verwendete ova-Format kann allerdings nicht ohne weiteres in einer VMware-Umgebung verwendet werden. Zwar taucht auch ova in den von VMware unterstützten Virtualisierungsformaten auf, in diesem speziellen Fall trifft das jedoch nicht zu. Der VMware vCenter Converter zumindest weigert sich, die Icinga-Datei anzunehmen. Was man tun muss, um Icinga.ova in einen ESX-Server hochzuladen, wird hier beschrieben.

more...

Author:Gerhard Laußer
Tags:Icinga, Nagios, OVF, ovftool, vmware
Categories:nagios

Seit einigen Versionen ist check_oracle_health auch unter Windows lauffähig, was anscheinend nur wenig bekannt ist. In vielen Firmen ist auf den Arbeitsplatz-PCs ein Oracle-Client installiert, mit dem Applikationen auf die Unternehmensdatenbanken zugreifen. Es ist daher nur logisch, wenn beim Monitoring die Verfügbarkeit einer Datenbank aus der Sicht so eines PCs geprüft wird.

more...

Author:Gerhard Laußer
Tags:check_oracle_health, Nagios, oracle, windows
Categories:nagios
Mod-Gearman 1.0 released

Mod-Gearman 1.0 has been released (download).
About half a year after starting development of Mod-Gearman it’s time to finish main development and release the stable 1.0.

  • use gearman to spread the load of your nagios box onto several worker
  • avoid core blocking events like eventhandler
  • distribute writing performance data

more...

Author:Sven Nierlein
Tags:Distribution, Gearman, Nagios
Categories:nagios

Überwacht man mit check_oracle_health den Füllgrad von Tablespaces einer Oracle-Datenbank, so werden in der Ausgabe des Plugins grundsätzlich alle Tablespaces aufgeführt. Dabei spielt es keine Rolle, ob ein Tablespace genügend freien Speicherplatz hat oder bereits zu voll ist. Dies hatte in der Vergangenheit zur Folge, daß die Ausgabe bei großen Datenbanken mit vielen Tablespaces sehr, sehr lang war und somit in der Web-Oberfläche von Nagios etwas unübersichtlich erschien. Mit den neuesten Releases von check_oracle_health, check_db2_health, check_mysql_health und check_mssql_health ist es nun möglich, nur noch diejenigen Tablespaces/Datenbanken anzeigen zu lassen, die voller sind als es die Schwellwerte erlauben.

more...

OMD, the new star on the open monitoring scene, has been released in version 0.44 two weeks ago with a lot of enhancements and new addons.

more...

A small Nagios plugin for monitoring search hit counts. Don’t take it too seriously.

more...

Author:Roland Huß
Tags:Nagios
Categories:nagios

Die Datenbank-Plugins check_oracle_health, check_mysql_health, check_mssql_health und check_db2_health unterstützen auf vielfachen Wunsch auch den Parameter --extra-opts. Damit ist es jetzt möglich, z.B. Login-Daten von den Kommandozeilenparametern in Konfigurationsdateien zu verlagern. Neben Environmentvariablen gibt es somit eine weitere Alternative, Passwörter aus der Prozessliste zu entfernen und dadurch vor neugierigen Blicken zu schützen.

more...

Author:Gerhard Laußer
Tags:check_mysql_health, extra-opts, Nagios, Plugins
Categories:nagios
Thruk 0.70

Thruk 0.70 has been released at (download). The three major changes from user perspective are

  • side menu is completly adjustable by config file
  • excel export for hosts and services
  • search includes comments and downtimes

more...

Author:Sven Nierlein
Tags:Nagios, Thruk
Categories:nagios

Since version 0.70, check_jmx4perl has support for configuration files. JMX Nagios checks are now considerably simpler to configure and multi checks add even more performance and flexibility.

more...

Author:Roland Huß
Tags:check_jmx4perl, jmx4perl, Nagios
Categories:jmx4perl, nagios

This post explains why a dedicated Tomcat Connector reserved for the jmx4perl agent is a useful thing.

more...

Author:Roland Huß
Tags:jmx4perl, tomcat
Categories:jmx4perl, nagios

Die Plugins check_oracle_health und check_mssql_health haben mit den Versionen 1.6.6 bzw. 1.5.6 ein neues Feature bekommen. Critical- und Warning-Schwellwerte können jetzt auch direkt in der Datenbank hinterlegt werden. Bei Änderungswünschen muss der DBA nun nicht mehr den Nagios-Administrator belästigen, damit dieser die entsprechenden Servicedefinitionen anpasst.

more...

Author:Gerhard Laußer
Tags:check_mssql_health, check_oracle_health
Categories:nagios

If you have defined services using the nrpe mechanism, you might know the following scenario:
The NRPE daemon fails and all services using it go critical. One first step to avoid these false alarms is to create an additional service which monitors the NRPE daemon itself (called check_nrpe_daemon in this example) and install a dependency between your services and check_nrpe_daemon.

more...

Author:Gerhard Laußer
Tags:Nagios, nrpe
Categories:nagios

Es gibt mal wieder ein Update für check_hpasm, diesmal mit dem Schwerpunkt auf HP Bladesystems. Neu hinzugekommen ist die Überwachung von Sicherungen (Fuses) und Enclosure Managern. Ausserdem werden jetzt bei fehlerhaften Komponenten auch gleich die Spare-Part-Nummern angezeigt.

more...

Author:Gerhard Laußer
Tags:BladeCenter, check_hpasm, Nagios, Plugins, snmp
Categories:nagios

Folgende Anfrage wurde von einem Kunden an mich gerichtet:

Jetzt kam von den Admin die Anfrage ob es nicht möglich ist alle Meldungen (winwarncrit) erstmal als Warning an Nagios zu melden, um dann bestimmte Meldungen nach und nach als Critical einzustufen, oder komplett zu verwerfen (exclude).
Geht das?

more...

Author:Gerhard Laußer
Tags:check_logfiles, Eventlog, Nagios
Categories:nagios

Das neueste Release von check_hpasm ermittelt jetzt nicht mehr nur den globalen Status der cpqRack-MIB eines BladeCenters, sondern liest die wichtigsten Tabellen detailliert aus. Aufgerufen mit -v liefert check_hpasm eine Übersicht der verbauten Komponenten samt deren Status. Und so sieht das dann aus:

more...

Author:Gerhard Laußer
Tags:Blade, BladeCenter, check_hpasm, cpqRack, hp, Nagios, Plugins
Categories:nagios

Statt zwei Wochen hat das Redesign von check_hpasm nun doch zwei Monate gedauert, aber dafür ist das Plugin für künftige Erweiterungen bestens gerüstet. Hinzugekommen ist die Unterstützung der neuen G6-Proliants und die Fähigkeit, auch HP BladeCenter (wenn auch nicht so detailliert) und HP Storage-Systeme überwachen zu können. Es wurden auch ein paar Verbesserungen an der (nicht ganz einfachen) Erkennung der Speichermodule vorgenommen. Bei einigen Anwendern dürften jetzt defekte Riegel ans Tageslicht kommen, deren Zustand sich mit der 3.x-Version nicht feststellen liess.

more...

Author:Gerhard Laußer
Tags:check_hpasm, hp, Nagios, proliant
Categories:nagios

Nagios-Installationen, die über die Command Pipe Checkergebnisse von externen Kommandos entgegennehmen, sollten überprüfen, ob diese auch tatsächlich eintreffen und verarbeitet werden. Dieses Plugin schickt ein Testergebnis in die Pipe und sieht nach, ob im Logfile eine Bestätigung aufgetaucht ist.

<br />
$ check_nagios_external_commands -t 120 -p /usr/local/nagios/var/rw/nagios.cmd \<br />
    -l /usr/local/nagios/var/nagios.log<br />
WARNING - command took 23s|command_write=0.85s command_read=22s<br />

check_nagios_external_commands_0.1.tar

Author:Sven Nierlein
Tags:check_nagios_external_commands, Nagios
Categories:nagios

Das neue Release 4.0 von check_hpasm ist prinzipiell fertig und mit den Daten von über 500 Proliants getestet. Vorsichtshalber möchte ich aber noch eine letzte Testversion veröffentlichen. Hauptsächlich wurde die Erkennung von Speicherbausteinen verbessert. Vielen Maschinen, die bisher  “status of all * dimms is n/a (please upgrade firmware)” meldeten, werden nun durch ein paar Tricks doch noch die fehlenden Informationen entlockt bzw. mit Hilfe bisher unbeachteter OIDs rekonstruiert.

check_hpasm-4pre3.tar.gz

Author:Gerhard Laußer
Tags:check_hpasm, hpasm, Nagios, Plugins, proliant
Categories:nagios

Betreibt man eine hochverfügbare Nagios-Installation mit dem Heartbeat-Cluster, so benötigt man für die einzelnen Softwarekomponenten (Resourcen genannt) Agenten, die sich um Start, Stop und Überwachung derselben kümmern. Folgendes Script ermöglicht die Einbindung des NDO2DB-Daemons in so einen Cluster. Dazu muss man es nur nach /usr/lib/ocf/resource.d/<heartbeat oder ein eigener Provider>/ndo2db kopieren.

Download: ndo2db

Author:Gerhard Laußer
Tags:cluster, heartbeat, Nagios, ndo, ndo2db, ocf
Categories:nagios
check_mssql_health 1.5.3

Eine neue Version von check_mssql_health ist soeben erschienen. In erster Linie wurde ein Bug im Mode database-free beseitigt, der zu ungenauen bzw. falschen Ergebnissen führte, wenn der freie Plattenplatz knapp wurde.
Daneben wurde der neue Mode database-backup-age eingeführt, mit dem sich überwachen lässt, wie lange der Zeitpunkt des letzten Backups zurückliegt.

more...

Author:Gerhard Laußer
Tags:check_mssql_health, Nagios, Plugins
Categories:nagios

Das Redesign von check_hpasm (Hauptgrund war die Unterstützung der neuen Proliant *G6) ist nun doch umfangreicher geworden, als ich dachte. Dafür ist der Code jetzt um einiges wartbarer und ermöglicht es, neue Features schneller und ohne Gefrickel einzubauen. Geplant ist ausserdem die Unterstützung von HP BladeCenter und Storagesystemen (Proliant 4LEE). Ein erstes Testrelease ist nun fertig.

more...

Author:Gerhard Laußer
Tags:check_hpasm, Nagios, Plugins, proliant
Categories:nagios

Die check_[datenbank]_health-Plugins lassen sich leicht in ihrem Funktionsumfang erweitern, indem sie zur Laufzeit Zusatzmodule einlesen. Dieses Feature wurde eingebaut, damit für vorhandenen, u.U. firmenspezifischen Code kein eigenes Plugin geschrieben werden muss. Man steckt ihn einfach in Dateien, die einer bestimmten Namenskonvention folgen.
Als Beispiel soll hier gezeigt werden, wie man das Alter des letzten Backups einer Datenbank überwacht.

more...

Author:Gerhard Laußer
Tags:Backup, check_mssql_health, Nagios, SQL Server
Categories:nagios

Es gibt ein neues Mitglied in der check_<datenbank>_health-Familie. Nach Oracle, MS SQL und MySQL habe ich mir DB2 vorgenommen und ein Plugin geschrieben, das leicht erweiterbar ist und grundlegende Anforderungen out of the box abdeckt.

more...

Author:Gerhard Laußer
Tags:DB2, Nagios, Plugins
Categories:nagios

Ein unangenehmes Phänomen bei NFS-gemounteten Filesysteme tritt auf, wenn der Fileserver abstürzt oder ein Netzwerkproblem zwischen NFS-Server und -Client besteht. Sämtliche Prozesse, die auf Dateien auf so einem Filesystem zugreifen wollen, bleiben einfach hängen. Das gilt auch für Nagios-Plugins. Nach Ablauf des Timeouts wird der Nagios-Kernel den Plugin-Prozess zwar abschiessen, jedoch bleibt dieser in der Prozessliste und zwar so lange, bis der NFS-Server wieder antwortet.

more...

Author:Admin
Tags:Nagios, nfs
Categories:nagios