OMD Labs Edition 2.40 for the Raspberry Pi has been released today. A month and a broken SD card (excessive use of /var/swap during the builds) after the release of the x86 version it is now possible to run a full-blown monitoring system on your ARM boards. It was tested on Raspberry 2 and Raspberry 3. If you want to run OMD on one of the older models, you might experience performance problems, especially when you enable InfluxDB and Grafana.

more...

Author:Gerhard Laußer
Tags:omd, nagios, grafana, thruk, raspberry
Categories:omd, nagios

OMD Labs Edition 2.40 has been released today. The OMD Labs Edition is based on the standard OMD but adds some more useful addons like Grafana and Influxdb or additional cores like Icinga 2 and Naemon. This releases focus is on security and maintainance and removes some recently discovered CVEs in Nagios, Icinga and Naemon.

more...

Author:Sven Nierlein
Tags:omd, nagios, grafana, thruk
Categories:omd, nagios
Ansible limit pitfalls
assets/images/ansible-logo.png

Mit steigender Zahl der im [Ansible]-Inventory gepflegten Hosts verlängert sich die Laufzeit eines Playbooks. Ansible erkennt zwar, welche Tasks nicht ausgeführt müssen (z.B. weil bestimmte Pakete bereits installiert sind), jedoch kostet auch diese Überprüfung Zeit. Früher oder später wird man deshalb den Playbook-Parameter --limit|-l einsetzen - und sich wundern, warum Teile des Playbooks plötzlich nicht mehr funktionieren. Dieser Blogpost zeigt, in welche Probleme man laufen kann bzw. wie man sie vermeidet und löst.

more...

Author:Simon Meggle
Tags:Ansible
Categories:monitoring, omd
Ansible meets DokuWiki

Ansible meets DokuWiki

Dokumentation belegt in der Rangliste der beliebtesten Arbeiten eines Administrators sicher einen der hinteren Plätze. Neben der Beliebtheit der Aufgabe ist es auch mit zunehmender Anzahl der vorhandenen Systeme immer aufwändiger, die Dokumentation auf einem aktuellen Stand zu halten. Ein klassischer Fall also für Automatisierung.

Das Ziel in diesem Blog soll es sein, für jedes System eine DokuWiki Seite automatisch zu erzeugen. Weiter soll auf jeder Seite noch die Möglichkeit bestehen, individuelle Dokumentation mit einzufügen.

more...

Author:Matthias Gallinger
Tags:Ansible, Dokuwiki, OMD
Categories:monitoring, omd
PNP4Nagios and Grafana

Many Nagios folks use PNP4nagios to store performance data and draw graphs.
Nowadays time series databases like Influxdb are quite trendy and have their own pros and cons. But In the end
they visualize the stored metrics with Grafana which comes with a plugable
datasource api, so wouldn’t it be nice to use the already collected RRD data in Grafana as well? This
combines the speed of rrd with the more modern graphs from Grafana.

more...

Author:Sven Nierlein
Tags:grafana, pnp, pnp4nagios, nagios, omd
Categories:omd, graphing
_nowhere_

Wenn man einen Dienst überwachen möchte und man diesen nicht selbst betreut, fehlt meist die Erfahrung, wie sich dieser verhalten sollte und was als „normal“ gilt. Im Folgenden wird beschrieben, wie man (Un)Regelmäßigkeiten automatisch erkennen lassen kann.

more...

Author:Philip Griesbacher
Tags:Anomalieerkennung, Holt-Winters, Nagios, InfluxDB, Grafana, DataScryer
Categories:monitoring, omd, nagios
_nowhere_

Oft kommt die Frage auf ob man mit den Performancedaten, die von Nagios und ähnlichen System erhoben werden, nicht auch Vorhersagen treffen kann, etwa wie sich die Systeme in den nächsten Tagen und Wochen entwickeln. Aus diesem Grund wird im Folgenden vorgestellt, wie man dies erreichen kann.

more...

IDoc ist das Austauschformat von SAP ERP-Systemen, welches benutzt wird, um per Import und Export Daten sowohl untereinander als auch mit Fremdsystemen auszutauschen. Typische Beispiele solcher Daten sind Bestellungen, Lieferscheine, Überweisungen, Stundenbuchungen, etc. Ein IDoc besitzt neben Control- und Data-Records auch Status-Records, in denen jeder einzelne Verarbeitungsschritt protokolliert wird. Diese Status-Records werden in der Tabelle EDIDS gespeichert. Die neue Version 1.9 von check_sap_health kennt den Mode failed-idocs, mit dem in EDIDS nach Fehlermeldungen gesucht wird.

more...

Author:Gerhard Laußer
Tags:Nagios, Plugins, SAP, IDOC, Netweaver
Categories:nagios, omd

Seit der Version 2.6.3 von check_mssql_health ist es möglich, den für das Monitoring benötigten Datenbankbenutzer direkt vom Plugin erzeugen zu lassen. Angenommen, der Benutzer soll NAGIOS heißen und das dazugehörige Passwort ES_ku_el. Der Plugin-Aufruf lautet dann:

<br />
$ check_mssql_health –hostname dbsrv1 –port 1433 \<br />
    –username sa –password ‘Str3ng!g3heim’ \<br />
    –mode create-monitoring-user \<br />
    –name NAGIOS –name2 ‘ES_Ku_el’ <br />

Anstelle des Benutzers sa kann man auch jeden beliebigen Administrator-Account nehmen. NAGIOS wird in jeder einzelnen Datenbank angelegt. Kommen neue Datenbanken dazu, so wiederholt man einfach den create-monitoring-user-Befehl.

Author:Gerhard Laußer
Tags:Nagios, Plugins, MS SQL
Categories:nagios, omd
Reguläre Schwellwerte

In der neuesten Version von GLPlugin habe ich die Möglichkeit vorgesehen, Thresholds auch als reguläre Ausdrücke anzugeben. Wie schaut das nun genau aus?

<br />
$ check_wut_health –hostname dcenv2.de.xxxx –community public –mode sensor-status<br />
OK - return air temperature Unit 1.1 is 21.40C, humidity Unit 1.1 is 49.40%, return air temperature Unit 2.1 is 22.40C, humidity Unit 2.1 is 46.80% | ‘temp_Unit 1.1’=21.40;25;28;; ‘hum_Unit 1.1’=49.40%;40:60;35:65;0;100 ‘temp_Unit 2.1’=22.40;25;28;; ‘hum_Unit 2.1’=46.80%;40:60;35:65;0;100<br />

Wir sehen hier die hartcodierten Default-Schwellwerte 25 und 28 für die Temperatur bzw. 40:60 und 35:65 für die Luftfeuchtigkeit.
Bisher gab es zwei Möglichkeiten, diese zu ändern, z.b. in 20 und 30 für die Temperaturen zu ändern.

more...

Author:Gerhard Laußer
Tags:Nagios, Plugins
Categories:nagios, omd

_nowhere_ “Sakuli”, das Open-Source-Framework zum automatisierten Testen von Applikationen, ist vor kurzem in Version 1.0 erschienen. Ein kleiner Blick auf die zurückliegenden Änderungen.

more...

Author:Simon Meggle
Tags:e2e, end2end, monitoring, nagios, omd, sakuli
Categories:sakuli, omd, nagios, development

The host- and servicecheck scheduling of Nagios has always been some kind of black box. Checks pile up when using timeperiods which often leads to performance issues while the Nagios host idles again just a minute later. Latest Thruk release (2.06) ships a new addon which visualizes and alleviates this issue.

Core Scheduling Plugin

more...

Author:Sven Nierlein
Tags:omd, nagios, icinga, thruk
Categories:omd, nagios
Sakuli v0.9.2 Released

Sakuli todays release is a great milestone because it introduces a brand new graphical installer and a bunch of other features!
Sakuli installer

Download and check it out sakuli-v0.9.2-installer.jar!

more...

Author:Tobias Schneck
Tags:e2e, end2end, monitoring, nagios, omd, sakuli
Categories:sakuli, omd, nagios, development

OMD Labs Edition 2.10 in has been released today. The OMD Labs Edition is based on the standard OMD but adds some
more useful addons like Grafana and Influxdb or additional cores like Icinga 2 and
Naemon. Todays release is a great milestone because it introduces grafana based graphing out of the box in the usual easy OMD way.

more...

Author:Sven Nierlein
Tags:omd, nagios, grafana, thruk
Categories:omd, nagios

In der OMD Labs Edition gibt es seit kurzem die Möglichkeit, die Performance-Daten in einer InfluxDB zu speichern. Die Daten werden dabei von der Komponente Nagflux in die InfluxDB geschrieben, Histou übernimmt das Erzeugen der Graphen auf Basis von Templates und Grafana übernimmt die eigentliche Anzeige.

Einen ausführlichen Vortrag vom Autor von Nagflux und Histou, Philip Griesbacher, wird es auf der diesjährigen OSMC geben.

Das Aktivieren des kompletten Gespanns ist ab der Version omd-2.01.20151021-labs-edition aus unserem Testing-Repository in einer OMD site sehr einfach möglich. Erfahrene OMD-Benutzer verwenden die folgenden Kommandos, für OMD-Einsteiger gibt es die ausführlichere bebilderte Anleitung weiter unten.

<br />
omd config set PNP4NAGIOS off<br />
omd config set GRAFANA on<br />
omd config set INFLUXDB on<br />
omd config set NAGFLUX on<br />

more...

Author:Michael Kraus
Tags:Grafana, Nagflux, InfluxDB, Nagios, Icinga
Categories:nagios, omd
Lidl sucht Mitarbeiter

Unser Kunde Lidl setzt beim Monitoring seiner europaweiten IT-Landschaft in großem Umfang Tools und Plugins von ConSol-Labs ein. Neu- und Weiterentwicklungen der check_*_health-Plugins oder Thruk entstehen häufig im Auftrag von Lidl, wobei die Kollegen dort im Gegensatz zu anderen Unternehmen kein Problem damit haben, die Ergebnisse der Öffentlichkeit zur Verfügung zu stellen. Von diesem Engagement für die Open-Source-Community kann sich mancher eine Scheibe abschneiden.

Unter https://www.it-bei-lidl.com/ findet sich eine Stellenausschreibung für den Bereich Geschäftsprozess-Monitoring. Ich habe das technische und menschliche Umfeld von Lidl kennengelernt und kann nur empfehlen, sich dort zu bewerben. Es erwartet einen eine tiptop gemanagte IT-Landschaft, die so ziemlich jede zeitgemäße Technologie umfasst. Und natürlich Monitoring made by ConSol.

Und jetzt kommt Werbung….

Author:Gerhard Laußer
Tags:OMD, Nagios, Thruk, check_nwc_health
Categories:nagios, omd

Beim Monitoring von Netzwerkinterfaces ist es üblich, daß man vier Services konfiguriert. Jeweils einen für Status (up/down), Bandbreite, Errors und Discards. Gelegentlich gab es auch die Anforderung, das alles in einen einzigen Service zu packen, in dem Fall half dann check_multi. Zwar wurde jeweils auch die Konfigurationsdatei für check_multi mit coshsh generiert, aber je simpler, desto besser, daher habe ich einen neuen Modus interface-health eingeführt, so daß check_nwc_health diese vier Checks selber bündelt.

<br />
$ check_nwc_health –hostname 10.37.6.2 –community kaas \<br />
    –mode interface-health –name FastEthernet0/0<br />
OK - FastEthernet0/0 is up/up, interface FastEthernet0/0 usage is in:0.01% (12041.88Bits/s) out:0.00% (1435.76Bits/s), interface FastEthernet0/0 errors in:0.00/s out:0.00/s , interface FastEthernet0/0 discards in:0.00/s out:0.00/s  | ‘FastEthernet0/0_usage_in’=0.01%;80;90;0;100 ‘FastEthernet0/0_usage_out’=0.00%;80;90;0;100 ‘FastEthernet0/0_traffic_in’=12041.88;80000000;90000000;0;100000000 ‘FastEthernet0/0_traffic_out’=1435.76;80000000;90000000;0;100000000 ‘FastEthernet0/0_errors_in’=0;1;10;; ‘FastEthernet0/0_errors_out’=0;1;10;; ‘FastEthernet0/0_discards_in’=0;1;10;; ‘FastEthernet0/0_discards_out’=0;1;10;;<br />

Author:Gerhard Laußer
Tags:plugin, Nagios, Icinga, check_nwc_health, cisco, juniper
Categories:nagios, omd

_nowhere_Das Plugin check_nwc_health erfreut sich größter Beliebtheit beim Monitoring von Komponenten in den Core-, Access- und Distribution-Layern, oder kurz: den Netzwerkkomponenten innerhalb von Gebäuden und Standorten.
Das WAN-Monitoring geht aber weit über die üblichen Hardware/CPU/Memory/Interfaces-Checks hinaus.
Für einen OMD-Kunden wurde das Plugin so erweitert, daß er sein europaumspannendes Netzwerk, bestehend aus mehreren tausend WAN-Knoten, umfassend überwachen kann. Den Vergleich mit schweineteuren proprietären Lösungen braucht das Gespann OMD/check_nwc_health seitdem nicht mehr zu fürchten.

more...

Author:Gerhard Laußer
Tags:plugin, Nagios, Icinga, check_nwc_health, ospf, wan, cisco, bgp, mpls, vpn
Categories:nagios, omd

Es gibt wieder mal ein neues Plugin, diesmal geht es um die Überwachung von Postfächern/Mailservern/Mailempfang etc. Mit [check_mailbox_health][1] prüft man,

  • ob ein Mailserver antwortet bzw. ein Login zulässt
  • Mails im Postfach liegen
  • wie alt diese sind
  • ob sie ein bestimmtes Subject haben (oder ein Suchmuster im Text vorkommt)
  • ob sie Attachments (ggf. eines bestimmten Typs) haben

Mit check_mailbox_health lassen sich so auch nicht ganz triviale, auf Mail basierende Geschäftsvorgänge monitoren.

more...

Author:Gerhard Laußer
Tags:plugin, Nagios, Icinga, check_mailbox_health, imap
Categories:nagios, omd

_nowhere_ Aller guten Dinge sind drei. Bisher konnte man mit [check_nwc_health][1] die lokalen Interfaces von Linux und Windows-Rechnern überwachen, jetzt geht das auch bei Solaris. Das Betriebsteam eines MySQL-Cluster auf Oracle Solaris wollte die Auslastung der Netzwerk-Interfaces aufzeichen, da die übertragene Datenmenge sich allmählich dem GBit/s-Bereich nähert.

more...

Author:Gerhard Laußer
Tags:Nagios, omd
Categories:nagios, omd, solaris, oracle

_nowhere_ Today [Thruk][1] has released version 2.00 wich is a great milestone and a huge step forward. Instead of adding lots of things, we tried to remove unnecessary dependencies. Version 2.00 comes without the Catalyst framework and many performance improvements, especcially on larger setups.

more...

Author:Sven Nierlein
Tags:Nagios, Thruk, omd, Icinga, naemon
Categories:nagios, omd, thruk, naemon

Jeder Icinga-Admin kennt das: Ein Gerät, eine Applikation oder eine Datenbank soll überwacht werden, es gibt auch eine extra Monitoring-Kennung dafür, aber das zugehörige Passwort ist einfach nur grauenhaft. Sei es aufgrund einer Vorschrift oder weil der DBA ein Sadist ist, häufig enthält das Passwort Zeichen, welche bei der Ausführung des Plugins durch eine Shell Probleme bereiten können. Dazu zählen alle Arten von Anführungszeichen, Strichpunkt, Kaufmanns-Und oder gar nicht druckbare Zeichen.
So eine Command-Definition

<br />
define command {<br />
  command_name check_mssql_health<br />
  command_line $USER1$/check_mssql_health --hostname $ARG1$ --username ‘$ARG2$’ --password ‘$ARG3$’ …<br />
}<br />

schließt zwar den ganzen Dreck in einfache Hochkommas ein, aber was, wenn das Passwort selber ein Hochkomma enthält?

Current Status:WARNING (for 0d 0h 6m 3s)
Status Information:[sh: -c: line 0: unexpected EOF while looking for matching `''
sh: -c: line 1: syntax error: unexpected end of file]


Damit das nicht passiert und auch die Icinga-Konfigurationsdateien von Sonder- und Schmierzeichen aller Art verschont bleiben, können die Plugins aus der check_*_health-Familie sowie check_hpasm seit den letzten Releases mit encodierten Passwörtern versorgt werden. Man hantiert also nur noch mit [A-Za-z0-9].

more...

Author:Gerhard Laußer
Tags:Nagios, check_oracle_health, check_mssql_health, check_hpasm, coshsh
Categories:nagios, omd


Eine neue Ausgabe der ConSol-Monitoring-Minutes ist seit heute bei Youtube online. Matthias Gallinger erklärt, wie man in einer DMZ einen Gearman-Worker einrichtet, ohne daß man sich beim Firewall-Admin unbeliebt macht.

Author:Gerhard Laußer
Tags:Nagios, mod-gearman, dmz
Categories:nagios, omd

Das Tape-Library-Plugin check_tl_health kann mittlerweile die meisten Geräte überwachen, die bei unseren Kunden im Einsatz sind. Kommen neue Modellvarianten hinzu, so werden diese i.d.R. vom Plugin erkannt. Möglich ist dies, weil gängige MIBs wie QUANTUM-SMALL-TAPE-LIBRARY-MIB, SEMI-MIB, SL-HW-LIB-T950-MIB, UCD-SNMP-MIB, ADIC-INTELLIGENT-STORAGE-MIB, ADIC-INTELLIGENT-STORAGE-MIB, BDT-MIB, … bereits enthalten sind. Durch Prüfen charakteristischer OIDs wird ermittelt, welche MIBs die zu überwachende Library implementiert hat, danach wird der entsprechende Zweig mit den spezifischen Abfragen ausgeführt.

more...

Author:Gerhard Laußer
Tags:Nagios, HP, Quantum, StorEver, FlexStor, i6000
Categories:nagios, omd

Beim Monitoring von SAP mit check_sap_health wurden bisher die Bereiche CCMS, Verbuchungssystem und Shortdumps abgedeckt. Mit der neuen Version können nun auch Hintergrundjobs überwacht werden. Folgende Anforderungen wurden implementiert:

  • check_sap_health soll Jobs melden, welche einen fehlerhaften Status haben. Würde man in SM37 nachschauen, dann würde man bei diese(n) Job(s) den Status aborted angezeigt bekommen
  • Defaultmäßig interessiert sich das Plugin nur für die vergangenen 60 Minuten, also die Jobs die in der letzten Stunde fertig geworden (oder abgebrochen) sind. Eine andere Zeitspanne ist einstellbar (so gibt es das auch beim Shortdump-Check). Dadurch hat der Service bei einem üblichen 5-Minuten-Check-1-Minute-Retry-Intervall die Gelegenheit, kritisch zu werden und eine Notification zu verschicken und nach kurzer Zeit wieder grün zu werden.
  • Die Sicht des Plugins kann mit Hilfe des Parameters --name auch auf bestimmte Jobs eingegrenzt werden. Es interessiert sich dann ausschließlich für Jobs dieses Namens. Damit lassen sich eigene Services einrichten, die speziell die Jobs bestimmter Applikationen bzw. des Systeme überwachen.
  • Bei allen Jobs, die in den letzten 30 Minuten fertig geworden sind, wird die Laufzeit mit vorgegebenen Schwellwerten verglichen. (--warning/critical). Bei Überschreitung gibt es Alarm. Die Laufzeit wird als <jobname>_runtime=… in den Performancedaten auftauchen.

more...

Author:Gerhard Laußer
Tags:Nagios, SAP, omd, Icinga, naemon, Netweaver
Categories:nagios, omd

One of the most often requested features is the possibility to place hosts, services and host/servicegroups on a geomap.
Now with release 1.88 Thruk made a major change in its panorama dashboard to support this kind of map too.

more...

Author:Sven Nierlein
Tags:Nagios, Thruk, omd, Icinga, naemon, Dashboard, GeoMap
Categories:nagios, omd, thruk, naemon

Mit Sakuli lassen sich unabhängig vom Betriebssystem User-Aktionen in Anwendungen (Fat-Client, Citrix, Web, …) simulieren; die Stati und dabei gemessenen Laufzeiten werden von Nagios ausgewertet und visualisiert. Unter der Haube stecken die Tools

die wir unter dem Namen “Sakuli” über ihre gemeinsame API zu einem Team zusammenspannt und auf GitHub veröffentlicht haben.

more...

Author:Simon Meggle
Tags:e2e, end2end, monitoring, Nagios, omd, sakuli
Categories:nagios, omd, sakuli

Bei der Ablösung des alten SAP-Monitorings eines unserer Kunden bin ich über Ungereimtheiten beim Auslesen von CCMS-Metriken gestolpert. Nicht alle Werte, welche man per RZ20 in der SAP-GUI angezeigt bekommt, werden nagios-seitig korrekt wiedergegeben. Teilweise sind die Messwerte um den Faktor 1000 zu hoch und werden so auch in den entsprechenden RRD-Files abgespeichert bzw. sorgen für ungläubiges Kopfschütteln. Das ist beispielsweise dann der Fall wenn der SAP-Server eine Load von 7.06 hat, laut Monitoring aber 706. Bisher ist das halt nicht aufgefallen, weil üblicherweise der von SAP gelieferte Status eins zu eins in Nagios verwendet wurde.

Update 23.6.14: im Git von check_mk wurde mein Patch mittlerweile eingespielt.
Update 26.6.14: im Git von Netways auch.
Update: Die beiden angemeckerten Plugins sind (Stand 26.6.14) gefixt und somit ist meiner Stänkerei jede Grundlage entzogen. Alles ist gut :-)

 

more...

Author:Gerhard Laußer
Tags:ccms, mte, rz20, sap
Categories:nagios, omd, shinken

Monitoring von SAP mit den bisher vorhandenen Plugins beschränkte sich auf die Abfrage von CCMS-Metriken. In einem SAP-System steckt aber noch viel mehr, das sich überwachen lässt. Check_sap_health ist ein neues Plugin, welches in Perl geschrieben wurde. Es entstand in einem Projekt, bei dem von unterschiedlichen Standorten aus die Laufzeiten von BAPI-Aufrufen gemessen werden sollten. Durch die einfache Erweiterung des Plugins um selbstgeschriebene Perl-Elemente lassen sich beliebige Funktionen per RFC aufrufen und somit firmenspezifische Logik implementieren.

more...

Author:Gerhard Laußer
Tags:bapi, ccms, Icinga, naemon, Nagios, netweaver, rfc, rz20, sap, Shinken
Categories:naemon, nagios, omd, shinken
OMD 1.10 Release

OMD-LOGO_FINAL2 The developer team of OMD (Open Monitoring Distribution) released the version 1.10 today.

This version contains lots of updated packages including Thruk 1.80, Mod-Gearman 1.4.14, NagVis 1.8, check_mk 1.2.2p3 and many more.

Using the OMD Repository installation is as simple as a apt-get install omd. If you have an rpm-based system, it's as simple as yum install omd or zypper install omd.

Author:Sven Nierlein
Categories:mod-gearman, nagios, omd, thruk

Business Prozesse in Nagios zu modellieren gehört zu den beinahe täglich anstehenden Aufgaben beim Thema Monitoring. Die neueste
Thruk Version (v1.78) bringt nun ein Business Prozess Addon mit dem sich Prozesse einfach per Gui modellieren lassen.

more...

Author:Sven Nierlein
Categories:nagios, omd, thruk

Lange hat’s gedauert, aber seit heute kann man sich das Debian-Paket für OMD-1.00 vom ConSol-Labs-Repository herunterladen.

root@raspberrypi:~# apt-get install omd-1.00

Die Maschinen unserer Kunden, auf denen wir uns tagtäglich bewegen und Monitoring-Systeme betreiben, haben üblicherweise CPUs und Gigabytes im zweistelligen Bereich. Da wird es schon zur Geduldsprobe, wenn ein Build auf dem Raspberry Pi den halben Tag braucht. Ein ARM11 ist eben kein Xeon und SD ist nicht SSD.

more...

Author:Gerhard Laußer
Tags:arm, Icinga, Nagios, odroid, omd, omdistro, raspberry, raspberry pi, Shinken
Categories:nagios, omd

Changing major releases on linux is always a risk, but Debian / Ubuntu dist-upgrades really worked fine the last years. If you are using OMD (Open Monitoring Distribution) for Nagios/Icinga/Shinken, then the release-update would disabled 3rd party repositorys and therefore remove your OMD installations during the update. This is usually not what you want, but with a small trick, updates work smoothly.

more...

Author:Sven Nierlein
Categories:nagios, omd
OMD 1.00 just arrived

OMD-LOGO_FINAL2 The developer team of OMD (Open Monitoring Distribution) released the version 1.00 today. Three years after the project started we decided it was time to show that OMD is no longer under development but is a mature, proven product.

This version contains lots of updated packages including Nagios 3.5.0, Shinken 1.4, Multisite 1.2.2p2, Thruk 1.72, PNP4Nagios 0.6.21, NagVis 1.7.1, check_mk 1.2.2p2 and many more.

Using the OMD Repository installation is as simple as a apt-get install omd. If you have an rpm-based system, it's as simple as yum install omd or zypper install omd.

For those who weren't using OMD yet, now there is no more reason to hesitate.

Author:Gerhard Laußer
Tags:Icinga, monitoring, Nagios, omd, Shinken
Categories:nagios, omd

fritzdect200-smallIm Februar bestellt und in der letzten Mai-Woche eingetroffen. Die intelligenten Steckdosen von AVM scheinen heiss begehrt zu sein. Jedenfalls kann ich jetzt über meine FRITZ!BOX aufzeichnen, wieviel Strom gewisse Geräte momentan oder aber über einen langen Zeitraum verbrauchen.
Von Berufs wegen juckt's mich natürlich jedesmal in den Fingern, wenn irgendwo Messwerte anfallen. Mein Plugin check_nwc_health kann ja bereits CPU, Speicher und Interfaces einer FRITZ!BOX 7390 abfragen, also war klar, daß die Überwachung der FRITZ!DECT 200 bzw. des gemessenen Energieverbrauchs unbedingt dazugehört.

Die fünfte Ausgabe der ConSol Monitoring Minutes, die sich mit diesem Thema befasst, ist heute ebenfalls entstanden.

more...

Author:Gerhard Laußer
Tags:avm, dect, fritz!box, Icinga, Nagios, Shinken
Categories:monitoring minutes, nagios, omd, shinken, thruk

mm_mg Wie in der dritten Folge schon angekündigt, habe ich zum Thema HSRP ein eigenes Filmchen erstellt. Hier ist die vierte Folge der ConSol Monitoring Minutes, in der gezeigt wird, wie eine mit dem HSRP-Protokoll redundant gemachte Gruppe von Cisco-Routern mit check_nwc_health überwacht wird.

more...

Author:Gerhard Laußer
Tags:cisco, hsrp, Icinga, Nagios, Shinken, snmp
Categories:monitoring minutes, nagios, omd, shinken, thruk

Monitoring Minutes

Die erste Folge der ConSol "Monitoring Minutes" ist soeben auf YouTube erschienen;
darin geben wir einen Überblick über den Aufbau und die Funktionsweise von OMD und zeigen zuletzt, wie OMD mit wenigen Handgriffen über die Repositories von ConSol installiert und aktualisiert werden kann.

 

 

 

Hier gehts zur ersten Folge: OMD im Überblick - ConSol Monitoring Minutes

more...

Zu Hause habe ich eine Firewall/VPN-Appliance NS5GT stehen, die bisher noch nicht überwacht wurde. Schlag den Raab, Deutschland sucht den Superstar, Navy CIS und Andrea Berg – Die 20 Jahre Show waren der Grund dafür, dass sich das jetzt ändert. Aus Langeweile habe ich CPU- und Memory-Monitoring für die NS5GT implementiert. Das Plugin check_nwc_health ist also wieder um ein Feature reicher.

more...

Author:Gerhard Laußer
Categories:nagios, omd, shinken

We often get asked about nagios server sizing, so we did some benchmarking. Here are the results.

more...

Author:Sven Nierlein
Categories:mod-gearman, nagios, omd

Während der letzten Wochen habe ich viel Geduld aufgebracht, um auf meinem neuen Raspberry Pi die Open Monitoring Distribution zu bauen und zuletzt ein Debian-Install-Paket zu erstellen. Geduld deshalb, weil ein “make” schon mal einen Tag und mehr läuft. Wenn dann immer wieder Anpassungen im Build-Prozess für diese spezielle Hardware nötig sind, zieht sich das ganze Unternehmen ordentlich in die Länge. Aber nun ist es überstanden und die Version 0.56 von OMD kann auf dem Raspberry Pi installiert werden.

more...

Author:Gerhard Laußer
Tags:Nagios, omd, omdistro, raspberry, Shinken
Categories:nagios, omd

Since Version 1.46 of Thruk the number of problems can be dynamically viewed in Thruks favicon. This is quite handy for creating a pinned app tab in Firefox.

more...

Author:Sven Nierlein
Categories:nagios, omd, shinken, thruk

Thruk uses the mod_fcgid apache module which makes Thruk start on the first request. The user then gets a “waiting” page till the fastcgi server has started. When using Thruk all the time, there is no reason to wait till someone makes the first request and you can just fire up the init script after apache starts.

In normal installations there is an rc script in /etc/init.d/thruk which fakes a request and makes the fastcgi server start.

 root@mo:~ #> /etc/init.d/thruk start
 Starting thruk.........(10492) OK

In OMD its even easier, latest snapshots have so called ‘init-hooks’ which are executed after the rc script. You
need to create two files in your site:

  • etc/init-hooks.d/apache-start-post
  • etc/init-hooks.d/apache-reload-post

One of them can be a symlink, because both files will have the same content:

 #!/bin/sh
 # check return code of apache start
 if [ $4 = 0 ]; then
   ./etc/init.d/thruk start
 fi

So when ever your apache starts / reloads, for example after logfile rotation, thruk will immediatly start too.

Author:Sven Nierlein
Categories:nagios, omd, thruk

Monitoring Unix clients is very easy with the check_by_ssh plugin. The only prerequisite is public-key-based access and installation of some plugins on the remote side. Then, running a check is as easy as:

<br />
check_by_ssh –host 10.177.3.39 –logname nagios \<br />
    –command “lib/nagios/plugins/check_swap -w 15% -c 8%”<br />

The drawback of this method is extra load on the nagios server. With every check, a ssh process is forked which has to do a complete handshake with the remote side. With newer ssh implementations it is possible to have a persistent connection which requires only one handshake at startup. All the following ssh connects use the already established connection, which saves a lot of cpu cycles.
Here are the instructions to combine check_by_ssh with such a persistent tunnel.

more...

Author:Gerhard Laußer
Tags:check_by_ssh, controlmaster, Nagios, omd, Shinken, ssh
Categories:nagios, omd

Every now and then some of our 7x24 hosts / services need a daily or weekly maintmode for regular restarts. Normally you would have to create 2 new timeperiods because you don’t want both hosts in a cluster to be restarted at the same time. This is not just way to much work, it also adds unnecessary complexity because
nobody can see the maintmode unless you look into the config files.

Thats where recurring downtimes will become handy and latest Thruk Version includes this new feature.

more...

Author:Sven Nierlein
Tags:Nagios, omd, Thruk
Categories:nagios, omd, thruk

One of my bigger OMD installations consists of 13 sites. The visualization layer uses the Thruk interface. This alternative web ui can read data from multiple livestatus backends and display the host and service objects in one unified view. For this purpose i have one extra site called gui which only starts an apache process. I then point my browser to http://…./gui/thruk

The addresses of the livestatus backends have to be written into a config file, thruk_local.cfg. Now what if my list of 13 sites would be constantly changing? What if new OMD sites would be created, others deleted on a daily basis? I would have to edit the config file every time. With the new init-hook-feature, OMD will do this automatically for me.

more...

Author:Gerhard Laußer
Tags:livestatus, Nagios, Shinken, Thruk
Categories:nagios, omd, shinken, thruk

Keeping an eye on cpu usage of your servers is one of the basic things in system monitoring. For Nagios (and Shinken, of course) you’ll find plenty of plugins for this task. However, i was never happy with the way they work. Most of the plugins you can download work like this: read a counter - sleep - re-read the counter. This technique not only adds an extra delay to the execution time of the plugin, but it only shows the state of things within a small time frame. If you run such a plugin every 5 minutes and it sleeps 5 seconds between the two measurements, you don’t know what happens in the other 295 seconds. This is a very small sample rate.

more...

Author:Gerhard Laußer
Tags:check_logfiles, cpu, Icinga, linux, Nagios, Shinken
Categories:nagios, omd, shinken

You probably have noticed that development of the new Nagios-compatible monitoring system Shinken progresses very fast. Every few hours there is another commit at GitHub, where Shinken’s code repository is hosted. Now if you want to try all these new features immediately, there’s a very easy method which requires a simple update-command instead of a fresh install.

more...

Author:Gerhard Laußer
Tags:monitoring, Nagios, omd, Shinken, Thruk
Categories:nagios, omd, shinken
OMD 0.54 is available

OMD-LOGO_FINAL2 The developer team of OMD (Open Monitoring Distribution) released the version 0.54 today. This version contains bugfixes and lots of updated packages including Shinken 1.0.1, Thruk 1.26, PNP4Nagios 0.6.17, NagVis 1.6.5 and many more.

more...

Author:Gerhard Laußer
Tags:Mod-Gearman, Nagios, omd, Shinken, Thruk
Categories:nagios, omd, shinken, thruk

check_oracle_health, check_mysql_health, check_mssql_health und check_db2_health bringen von Haus aus schon eine Menge Funktionalität mit. Allerdings wurden sie speziell für die Belange von Datenbankadministratoren entwickelt. Um auch den Betreibern von datenbankgestützten Applikationen die Möglichkeit zu geben, bestimmte Werte per SQL abzufragen, gibt es den Parameter "--mode sql". Damit lässt sich das numerische Ergebnis eines SQL-Aufrufs mit Schwellwerten vergleichen und in einen Nagios-Exitcode verwandeln. Üblicherweise sind die Anforderungen der Applikation an das Monitoring jedoch etwas komplexer. Am Beispiel von check_mysql_health und Wordpress wird gezeigt, wie man so etwas einfach umsetzen kann.

more...

Thruk Benchmarks

I often get asked if there are any benchmarks for Thruk so i finally decided to do some tests.

more...

Author:Sven Nierlein
Categories:nagios, omd, thruk
OMD 0.50 is available

The developer team of OMD (Open Monitoring Distribution) released the version 0.50 today. This version contains bugfixes and lots of updated packages including Shinken, Thruk, PNP4Nagios, Mod-Gearman, check_oracle_health and check_mysql_health.

more...

Author:Sven Nierlein
Tags:check_mysql_health, check_oracle_health, Nagios, omd, repository, Thruk
Categories:nagios, omd
Thruk Release 1.0.9

Thruk 1.0.9 has just been released and contains a couple of cool new features. This version will also be in the next OMD release. Besides the release itself, new documentation about plugins and themes has been published.

more...

Author:Sven Nierlein
Tags:Nagios, omd, Thruk
Categories:nagios, omd, thruk
OMD Repository

There is a now an ‘unofficial’ OMD Repository OMD Repository.
This makes new installations and upgrading your OMD sites even more easier.

more...

Author:Sven Nierlein
Tags:Nagios, omd
Categories:nagios, omd
Thruk Release 0.94

Straight on the road to the Thruk 1.0 this will probably the last feature release so far.
The main focus was on usability and accessibility. This version will also be in the next OMD release.

more...

Author:Sven Nierlein
Tags:Nagios, Thruk
Categories:nagios, omd, thruk
OMD 0.46 is there!

The developer team of OMD released the version 0.46 last week. Now you will not only be able to run Nagios out of the box. Shinken has been added as an alternative core. This enables you to create one set of configuration files and switch between two monitoring technologies with only a few commands.

more...

Author:Gerhard Laußer
Tags:Nagios, omd, Shinken
Categories:nagios, omd, shinken

OMD, the new star on the open monitoring scene, has been released in version 0.44 two weeks ago with a lot of enhancements and new addons.

more...

Monitoring-Workshop 2017 12./13.9. Düsseldorf