OMD Labs Edition 2.80 has been released today. The OMD Labs Edition is based on the standard OMD but adds some more useful addons like Grafana and Prometheus or additional cores like Icinga 2 and Naemon. This release updates many of the shiped components and adds some more usefull features.

weiterlesen...

Author:Sven Nierlein
Tags:omd, nagios, naemon, grafana, thruk
Categories:omd, nagios
Sakuli v1.2.0 released!

_nowhere_ It’s about time for a new Sakuli release! Our latest release v1.2.0 is the first version to include a beta of Sakuli-UI, a web UI to help you develop and manage your tests.

The new release also brings a bunch of enhancements and bug-fixes, a detailed changelog is included in this post.

Once again, we want to say THANK YOU for the great support of our contributors, our valued supporting companies and of course ConSol!

weiterlesen...

Sakuli v1.1.0 released!

_nowhere_ Just in time before X-Mas holidays starts, we crate a huge release of our open source end-to-end testing framework Sakuli. The v1.1.0 release brings a bunch of new features and a brand new documentation with. The list of the current changes you will find bellow. Also we created a Short Overview Presentation so that you be able to get quick intro about what purpose of Sakuli is.

Also we wan’t to say a big THANK YOU for the great support of our contributors, our valued supporting companies and at least ConSol for making this possible as open source software. Double Thumbs up!!!

weiterlesen...

NEB Modules with Go

Have you ever written a NEB (Nagios Event Broker) module? This article will explain a tool which makes this a lot easier, especially if the reason was that you are not familiar with C or C++. In this case the “Go NEB Wrapper” could come very handy and if you are new to this topic it is a good point to start with.

weiterlesen...

Author:Philip Griesbacher
Tags:nagios, naemon, go, neb
Categories:development, monitoring, nagios

OMD Labs Edition 2.60 has been released today. The OMD Labs Edition is based on the standard OMD but adds some more useful addons like Grafana and Prometheus or additional cores like Icinga 2 and Naemon. This release updates many of the shiped components and adds some interesting options when resolving update conflicts.

weiterlesen...

Author:Sven Nierlein
Tags:omd, nagios, naemon, grafana, thruk
Categories:omd, nagios

OMD Labs Edition 2.40 for the Raspberry Pi has been released today. A month and a broken SD card (excessive use of /var/swap during the builds) after the release of the x86 version it is now possible to run a full-blown monitoring system on your ARM boards. It was tested on Raspberry 2 and Raspberry 3. If you want to run OMD on one of the older models, you might experience performance problems, especially when you enable InfluxDB and Grafana.

weiterlesen...

Author:Gerhard Laußer
Tags:omd, nagios, grafana, thruk, raspberry
Categories:omd, nagios

OMD Labs Edition 2.40 has been released today. The OMD Labs Edition is based on the standard OMD but adds some more useful addons like Grafana and Influxdb or additional cores like Icinga 2 and Naemon. This releases focus is on security and maintainance and removes some recently discovered CVEs in Nagios, Icinga and Naemon.

weiterlesen...

Author:Sven Nierlein
Tags:omd, nagios, grafana, thruk
Categories:omd, nagios

Version 6.0 von [check_nwc_health] ist erschienen und hat neben Aufräumarbeiten unter der Haube ein paar neue Features zu bieten:

  • interface-etherstats
  • F5 Wide IPs
  • Juniper VSD Memberstatus
  • interface-stack-status

weiterlesen...

Author:Gerhard Laußer
Tags:OMD, Nagios, SNMP
Categories:monitoring

assets/images/switch.pngSNMP-Traps und Nagios ist eins der Themen, um das man bislang gerne einen großen Bogen gemacht hat. Grundsätzlich gibt es seit etlichen Jahren die AddOns SNMPTT und Nagtrap, deren Konfiguration aber ein wenig mühsam ist. In einem Projekt, bei dem es um die Überwachung von mehreren Tausend Storage-Systemen ging, entstand eine Methode, welche ressourcenschonend und einfach automatisierbar ist.
Im ersten Teil dieses Artikels geht es um die entsprechende Vorbereitung eines OMD-Servers. Genauer gesagt darum, wie man dafür sorgt, daß ein eingehender Trap gleichzeitig an mehrere OMD-Sites (Test, Produktion, …) zugestellt wird.

weiterlesen...

Author:Gerhard Laußer
Tags:OMD, Nagios, SNMP
Categories:monitoring
PNP4Nagios and Grafana

Many Nagios folks use PNP4nagios to store performance data and draw graphs.
Nowadays time series databases like Influxdb are quite trendy and have their own pros and cons. But In the end
they visualize the stored metrics with Grafana which comes with a plugable
datasource api, so wouldn’t it be nice to use the already collected RRD data in Grafana as well? This
combines the speed of rrd with the more modern graphs from Grafana.

weiterlesen...

Author:Sven Nierlein
Tags:grafana, pnp, pnp4nagios, nagios, omd
Categories:omd, graphing

Kurz vor Ende des Jahres sind die Vortragsvideos der OSMC 2016 online verfügbar. Auch dieses Jahr war ich wieder Referent, diesmal mit einem Überblick über die letzten Entwicklungen von OMD, einige Umgebungen, in denen es eingesetzt wird und dem Ausblick auf das, was nach 2016 in die Distribution einfließen könnte.
Dauer des Videos: 60min.

OMD, die Open Monitoring Distribution, bildet heute in vielen Unternehmen das Rückgrat bei der Überwachung unterschiedlichster IT-Komponenten und Services. Für Anfänger ist OMD ein umfassendes Starterpaket, für Consultants eine solide Plattform für individuelle Monitoring-Landschaften. Seit dem Gründungsjahr 2010 wurde OMD kontinuierlich verbessert, mit der OMD-Labs-Edition wurden 2015 moderne Elemente wie InfluxDB und Grafana eingeführt. Das Thema Automatisierung wurde mittlerweile mit Ansible und Coshsh ebenso aufgegriffen. Der Wandel der IT-Welt in Richtung cloud-basierter Services und kurzlebigen Containern stellt eine besondere Herausforderung dar. Der Vortrag zeigt, wie OMD sich dieser in Zukunft stellen wird.

Author:Gerhard Laußer
Tags:OMD, Nagios, Icinga, OSMC, Prometheus
Categories:monitoring
_nowhere_

Kürzlich wurden zwei Schwachstellen von Nagios veröffentlicht, u.a. bei heise.de. Wir verwenden Nagios als einen von mehreren möglichen Cores innerhalb des Monitoring-Frameworks OMD. Eine Gefährdung liegt nicht vor. Bei besagten Schwachstellen handelt es sich um:

  • CVE-2016-9565 - Betroffen ist das Web-Frontend von Nagios. Dieses zeigt nach dem Login einen RSS-Feed des Herstellers Nagios Enterprises an, dessen Inhalt so manipuliert werden kann, daß eingeschleuste Befehle im Kontext des www-data/nagios-Benutzers ausgeführt werden können. De Angreifer muss sich dazu jedoch als www.nagios.org ausgeben (durch einen DNS-Angriff) oder den Datenstrom als Man-in-the-Middle manipulieren. Abgesehen davon, daß die original Web-Gui von Nagios seit Erscheinen weitaus modernerer Oberflächen wie Thruk sowieso niemand mehr ernsthaft benutzt - die RSS-Funktionalität wurde bei OMD von Anfang an abgeschaltet bzw. rausgepatcht. Sie existiert schlichtweg nicht mehr und somit auch nicht die Schwachstelle.

  • CVE-2016-9566 - Bei diesem Exploit wird ausgenutzt, daß Nagios, so denn der Prozeß unter dem root-Account gestartet wird, das Logfile /usr/local/nagios/var/nagios.log o.ä. zunächst mit den entsprechenden root-Privilegien öffnet, bevor diese mittels des Systemcalls setgid(pid des nagios-Benutzers) aufgegeben werden. Ein Angreifer mit Zugang zum Monitoring-Server, welcher die Möglichkeit hat, das Logfile durch einen Symlink zu systemkritischen Dateien wie z.b. /etc/ld.so.preload zu ersetzen, kann die Voraussetzungen zur deren Manipulation schaffen. Dazu muss er noch dafür sorgen, daß Nagios schadhaften Inhalt in die Datei schreibt. Eine Möglichkeit wäre, ein externes Kommando (entsprechend präpariert) in die Command-Pipe zu schicken, was einen Eintrag im Logfile (und somit in /etc/ls.so.preload) zur Folge hat. Auch diese Form des Angriffs ist unter OMD ausgeschlossen, da ein Nagios-Prozess zu keinem Zeitpunkt mit root-Privilegien läuft. Monitoring mit OMD spielt sich ausschließlich im Kontext stinknormaler Benutzer ab.

Ergo: alles OK und grün.

Author:Gerhard Laußer
Tags:OMD, Nagios
Categories:monitoring
_nowhere_

Wenn man einen Dienst überwachen möchte und man diesen nicht selbst betreut, fehlt meist die Erfahrung, wie sich dieser verhalten sollte und was als „normal“ gilt. Im Folgenden wird beschrieben, wie man (Un)Regelmäßigkeiten automatisch erkennen lassen kann.

weiterlesen...

Author:Philip Griesbacher
Tags:Anomalieerkennung, Holt-Winters, Nagios, InfluxDB, Grafana, DataScryer
Categories:monitoring, omd, nagios
_nowhere_

Oft kommt die Frage auf ob man mit den Performancedaten, die von Nagios und ähnlichen System erhoben werden, nicht auch Vorhersagen treffen kann, etwa wie sich die Systeme in den nächsten Tagen und Wochen entwickeln. Aus diesem Grund wird im Folgenden vorgestellt, wie man dies erreichen kann.

weiterlesen...

labskaus
Labskaus

Kiel, 24 Grad, 50 Mann an Bord. Bei unerwartet schönstem Sommerwetter wurde in der Kieler Fachhochschule am 7. und 8. September der elfte Workshop der Monitoring-Community veranstaltet. Das ConSol-Monitoringteam trug mit acht Vorträgen zum Gelingen der Veranstaltung bei. Eine kurze Zusammenfassung:

Bereits mit dem erstem Vortrag nach der Begrüßung, “E2E-Monitoring mit Sakuli”, sorgte Simon Meggle für einen würdigen und technisch anspruchsvollen Auftakt der Veranstaltung. Die Möglichkeit, Sakuli in Docker-Containern einzusetzen und End-to-End-Tests somit praktisch beliebig zu parallelisieren, sorgte für viel Gesprächsstoff.

Damit es jeder zu Hause nachmachen kann, führte Simon dann am zweiten Tag die Teilnehmer in einer Live-Demo durch sein Tutorial “Sakuli-Tests im Docker-Container”.

weiterlesen...

Author:Matthias Gallinger
Tags:Sakuli, Thruk, OMD, Nagios, Icinga, coshsh, Ansible, Kubernetes
Categories:monitoring
_nowhere_

Am 27.7. fand bei ConSol das Sommer-Meetup der Gruppe “Münchner Monitoring-Stammtisch” statt. Das Thema war diesmal “Ansible im Monitoring-Umfeld”.
Ansible ist ein Framework, mit dem üblicherweise Server nach der Grundinstallation nachkonfiguriert und mit ausgewählten Softwarepaketen versorgt werden. Oder mit dem im laufenden Betrieb immer wieder Patches und sonstige Updates ausgerollt werden. Dabei wird in einem sogenannten Ansible-Playbook lediglich der Soll-Zustand beschrieben und Ansible kümmert sich im Hintergrund um die dazu nötigen Aktionen. Das hat grundsätzlich noch nichts mit Monitoring zu tun, aber da wir über den Tellerrand hinausschauen und bei allen Kunden keine Insel installieren, sondern Teil einer Unternehmens-IT mit allen möglichen Verflechtungen sind, gehört Ansible seit längerem zum Werkzeugkasten des ConSol-Monitoring-Teams. Es gibt übrigens auch eine eigene Ansible-Meetup-Gruppe, die unsere Veranstaltung freundlicherweise auch auf ihrer Seite ankündigte.
Die Fachsimpelei bei Augustiner und Pizza wurde immer wieder durch einen Vortrag unterbrochen, als da waren:

  • Michael Kraus - Überblick über Ansible, erste Schritte, coole Features
  • Simon Meggle - Rollout und Administration einer verteilten Monitoring-Umgebung mit Ansible
  • Matthias Gallinger - Erstinstallation und kontinuierliche Betankung von Monitoring-Clients mit Plugins

weiterlesen...

Author:Gerhard Laußer
Tags:Meetup, Ansible, Nagios
Categories:monitoring

IDoc ist das Austauschformat von SAP ERP-Systemen, welches benutzt wird, um per Import und Export Daten sowohl untereinander als auch mit Fremdsystemen auszutauschen. Typische Beispiele solcher Daten sind Bestellungen, Lieferscheine, Überweisungen, Stundenbuchungen, etc. Ein IDoc besitzt neben Control- und Data-Records auch Status-Records, in denen jeder einzelne Verarbeitungsschritt protokolliert wird. Diese Status-Records werden in der Tabelle EDIDS gespeichert. Die neue Version 1.9 von check_sap_health kennt den Mode failed-idocs, mit dem in EDIDS nach Fehlermeldungen gesucht wird.

weiterlesen...

Author:Gerhard Laußer
Tags:Nagios, Plugins, SAP, IDOC, Netweaver
Categories:nagios, omd

Seit der Version 2.6.3 von check_mssql_health ist es möglich, den für das Monitoring benötigten Datenbankbenutzer direkt vom Plugin erzeugen zu lassen. Angenommen, der Benutzer soll NAGIOS heißen und das dazugehörige Passwort ES_ku_el. Der Plugin-Aufruf lautet dann:

<br />
$ check_mssql_health –hostname dbsrv1 –port 1433 \<br />
    –username sa –password ‘Str3ng!g3heim’ \<br />
    –mode create-monitoring-user \<br />
    –name NAGIOS –name2 ‘ES_Ku_el’ <br />

Anstelle des Benutzers sa kann man auch jeden beliebigen Administrator-Account nehmen. NAGIOS wird in jeder einzelnen Datenbank angelegt. Kommen neue Datenbanken dazu, so wiederholt man einfach den create-monitoring-user-Befehl.

Author:Gerhard Laußer
Tags:Nagios, Plugins, MS SQL
Categories:nagios, omd
Reguläre Schwellwerte

In der neuesten Version von GLPlugin habe ich die Möglichkeit vorgesehen, Thresholds auch als reguläre Ausdrücke anzugeben. Wie schaut das nun genau aus?

<br />
$ check_wut_health –hostname dcenv2.de.xxxx –community public –mode sensor-status<br />
OK - return air temperature Unit 1.1 is 21.40C, humidity Unit 1.1 is 49.40%, return air temperature Unit 2.1 is 22.40C, humidity Unit 2.1 is 46.80% | ‘temp_Unit 1.1’=21.40;25;28;; ‘hum_Unit 1.1’=49.40%;40:60;35:65;0;100 ‘temp_Unit 2.1’=22.40;25;28;; ‘hum_Unit 2.1’=46.80%;40:60;35:65;0;100<br />

Wir sehen hier die hartcodierten Default-Schwellwerte 25 und 28 für die Temperatur bzw. 40:60 und 35:65 für die Luftfeuchtigkeit.
Bisher gab es zwei Möglichkeiten, diese zu ändern, z.b. in 20 und 30 für die Temperaturen zu ändern.

weiterlesen...

Author:Gerhard Laußer
Tags:Nagios, Plugins
Categories:nagios, omd

_nowhere_ “Sakuli”, das Open-Source-Framework zum automatisierten Testen von Applikationen, ist vor kurzem in Version 1.0 erschienen. Ein kleiner Blick auf die zurückliegenden Änderungen.

weiterlesen...

Author:Simon Meggle
Tags:e2e, end2end, monitoring, nagios, omd, sakuli
Categories:sakuli, omd, nagios, development

The host- and servicecheck scheduling of Nagios has always been some kind of black box. Checks pile up when using timeperiods which often leads to performance issues while the Nagios host idles again just a minute later. Latest Thruk release (2.06) ships a new addon which visualizes and alleviates this issue.

Core Scheduling Plugin

weiterlesen...

Author:Sven Nierlein
Tags:omd, nagios, icinga, thruk
Categories:omd, nagios
Sakuli v0.9.2 Released

Sakuli todays release is a great milestone because it introduces a brand new graphical installer and a bunch of other features!
Sakuli installer

Download and check it out sakuli-v0.9.2-installer.jar!

weiterlesen...

Author:Tobias Schneck
Tags:e2e, end2end, monitoring, nagios, omd, sakuli
Categories:sakuli, omd, nagios, development

OMD Labs Edition 2.10 in has been released today. The OMD Labs Edition is based on the standard OMD but adds some
more useful addons like Grafana and Influxdb or additional cores like Icinga 2 and
Naemon. Todays release is a great milestone because it introduces grafana based graphing out of the box in the usual easy OMD way.

weiterlesen...

Author:Sven Nierlein
Tags:omd, nagios, grafana, thruk
Categories:omd, nagios

In der OMD Labs Edition gibt es seit kurzem die Möglichkeit, die Performance-Daten in einer InfluxDB zu speichern. Die Daten werden dabei von der Komponente Nagflux in die InfluxDB geschrieben, Histou übernimmt das Erzeugen der Graphen auf Basis von Templates und Grafana übernimmt die eigentliche Anzeige.

Einen ausführlichen Vortrag vom Autor von Nagflux und Histou, Philip Griesbacher, wird es auf der diesjährigen OSMC geben.

Das Aktivieren des kompletten Gespanns ist ab der Version omd-2.01.20151021-labs-edition aus unserem Testing-Repository in einer OMD site sehr einfach möglich. Erfahrene OMD-Benutzer verwenden die folgenden Kommandos, für OMD-Einsteiger gibt es die ausführlichere bebilderte Anleitung weiter unten.

<br />
omd config set PNP4NAGIOS off<br />
omd config set GRAFANA on<br />
omd config set INFLUXDB on<br />
omd config set NAGFLUX on<br />

weiterlesen...

Author:Michael Kraus
Tags:Grafana, Nagflux, InfluxDB, Nagios, Icinga
Categories:nagios, omd
Lidl sucht Mitarbeiter

Unser Kunde Lidl setzt beim Monitoring seiner europaweiten IT-Landschaft in großem Umfang Tools und Plugins von ConSol-Labs ein. Neu- und Weiterentwicklungen der check_*_health-Plugins oder Thruk entstehen häufig im Auftrag von Lidl, wobei die Kollegen dort im Gegensatz zu anderen Unternehmen kein Problem damit haben, die Ergebnisse der Öffentlichkeit zur Verfügung zu stellen. Von diesem Engagement für die Open-Source-Community kann sich mancher eine Scheibe abschneiden.

Unter https://www.it-bei-lidl.com/ findet sich eine Stellenausschreibung für den Bereich Geschäftsprozess-Monitoring. Ich habe das technische und menschliche Umfeld von Lidl kennengelernt und kann nur empfehlen, sich dort zu bewerben. Es erwartet einen eine tiptop gemanagte IT-Landschaft, die so ziemlich jede zeitgemäße Technologie umfasst. Und natürlich Monitoring made by ConSol.

Und jetzt kommt Werbung….

Author:Gerhard Laußer
Tags:OMD, Nagios, Thruk, check_nwc_health
Categories:nagios, omd

Beim Monitoring von Netzwerkinterfaces ist es üblich, daß man vier Services konfiguriert. Jeweils einen für Status (up/down), Bandbreite, Errors und Discards. Gelegentlich gab es auch die Anforderung, das alles in einen einzigen Service zu packen, in dem Fall half dann check_multi. Zwar wurde jeweils auch die Konfigurationsdatei für check_multi mit coshsh generiert, aber je simpler, desto besser, daher habe ich einen neuen Modus interface-health eingeführt, so daß check_nwc_health diese vier Checks selber bündelt.

<br />
$ check_nwc_health –hostname 10.37.6.2 –community kaas \<br />
    –mode interface-health –name FastEthernet0/0<br />
OK - FastEthernet0/0 is up/up, interface FastEthernet0/0 usage is in:0.01% (12041.88Bits/s) out:0.00% (1435.76Bits/s), interface FastEthernet0/0 errors in:0.00/s out:0.00/s , interface FastEthernet0/0 discards in:0.00/s out:0.00/s  | ‘FastEthernet0/0_usage_in’=0.01%;80;90;0;100 ‘FastEthernet0/0_usage_out’=0.00%;80;90;0;100 ‘FastEthernet0/0_traffic_in’=12041.88;80000000;90000000;0;100000000 ‘FastEthernet0/0_traffic_out’=1435.76;80000000;90000000;0;100000000 ‘FastEthernet0/0_errors_in’=0;1;10;; ‘FastEthernet0/0_errors_out’=0;1;10;; ‘FastEthernet0/0_discards_in’=0;1;10;; ‘FastEthernet0/0_discards_out’=0;1;10;;<br />

Author:Gerhard Laußer
Tags:plugin, Nagios, Icinga, check_nwc_health, cisco, juniper
Categories:nagios, omd

_nowhere_Das Plugin check_nwc_health erfreut sich größter Beliebtheit beim Monitoring von Komponenten in den Core-, Access- und Distribution-Layern, oder kurz: den Netzwerkkomponenten innerhalb von Gebäuden und Standorten.
Das WAN-Monitoring geht aber weit über die üblichen Hardware/CPU/Memory/Interfaces-Checks hinaus.
Für einen OMD-Kunden wurde das Plugin so erweitert, daß er sein europaumspannendes Netzwerk, bestehend aus mehreren tausend WAN-Knoten, umfassend überwachen kann. Den Vergleich mit schweineteuren proprietären Lösungen braucht das Gespann OMD/check_nwc_health seitdem nicht mehr zu fürchten.

weiterlesen...

Author:Gerhard Laußer
Tags:plugin, Nagios, Icinga, check_nwc_health, ospf, wan, cisco, bgp, mpls, vpn
Categories:nagios, omd

Es gibt wieder mal ein neues Plugin, diesmal geht es um die Überwachung von Postfächern/Mailservern/Mailempfang etc. Mit [check_mailbox_health][1] prüft man,

  • ob ein Mailserver antwortet bzw. ein Login zulässt
  • Mails im Postfach liegen
  • wie alt diese sind
  • ob sie ein bestimmtes Subject haben (oder ein Suchmuster im Text vorkommt)
  • ob sie Attachments (ggf. eines bestimmten Typs) haben

Mit check_mailbox_health lassen sich so auch nicht ganz triviale, auf Mail basierende Geschäftsvorgänge monitoren.

weiterlesen...

Author:Gerhard Laußer
Tags:plugin, Nagios, Icinga, check_mailbox_health, imap
Categories:nagios, omd

_nowhere_ Aller guten Dinge sind drei. Bisher konnte man mit [check_nwc_health][1] die lokalen Interfaces von Linux und Windows-Rechnern überwachen, jetzt geht das auch bei Solaris. Das Betriebsteam eines MySQL-Cluster auf Oracle Solaris wollte die Auslastung der Netzwerk-Interfaces aufzeichen, da die übertragene Datenmenge sich allmählich dem GBit/s-Bereich nähert.

weiterlesen...

Author:Gerhard Laußer
Tags:Nagios, omd
Categories:nagios, omd, solaris, oracle

_nowhere_ Today [Thruk][1] has released version 2.00 wich is a great milestone and a huge step forward. Instead of adding lots of things, we tried to remove unnecessary dependencies. Version 2.00 comes without the Catalyst framework and many performance improvements, especcially on larger setups.

weiterlesen...

Author:Sven Nierlein
Tags:Nagios, Thruk, omd, Icinga, naemon
Categories:nagios, omd, thruk, naemon

Jeder Icinga-Admin kennt das: Ein Gerät, eine Applikation oder eine Datenbank soll überwacht werden, es gibt auch eine extra Monitoring-Kennung dafür, aber das zugehörige Passwort ist einfach nur grauenhaft. Sei es aufgrund einer Vorschrift oder weil der DBA ein Sadist ist, häufig enthält das Passwort Zeichen, welche bei der Ausführung des Plugins durch eine Shell Probleme bereiten können. Dazu zählen alle Arten von Anführungszeichen, Strichpunkt, Kaufmanns-Und oder gar nicht druckbare Zeichen.
So eine Command-Definition

<br />
define command {<br />
  command_name check_mssql_health<br />
  command_line $USER1$/check_mssql_health --hostname $ARG1$ --username ‘$ARG2$’ --password ‘$ARG3$’ …<br />
}<br />

schließt zwar den ganzen Dreck in einfache Hochkommas ein, aber was, wenn das Passwort selber ein Hochkomma enthält?

Current Status:WARNING (for 0d 0h 6m 3s)
Status Information:[sh: -c: line 0: unexpected EOF while looking for matching `''
sh: -c: line 1: syntax error: unexpected end of file]


Damit das nicht passiert und auch die Icinga-Konfigurationsdateien von Sonder- und Schmierzeichen aller Art verschont bleiben, können die Plugins aus der check_*_health-Familie sowie check_hpasm seit den letzten Releases mit encodierten Passwörtern versorgt werden. Man hantiert also nur noch mit [A-Za-z0-9].

weiterlesen...

Author:Gerhard Laußer
Tags:Nagios, check_oracle_health, check_mssql_health, check_hpasm, coshsh
Categories:nagios, omd


Eine neue Ausgabe der ConSol-Monitoring-Minutes ist seit heute bei Youtube online. Matthias Gallinger erklärt, wie man in einer DMZ einen Gearman-Worker einrichtet, ohne daß man sich beim Firewall-Admin unbeliebt macht.

Author:Gerhard Laußer
Tags:Nagios, mod-gearman, dmz
Categories:nagios, omd

Das Tape-Library-Plugin check_tl_health kann mittlerweile die meisten Geräte überwachen, die bei unseren Kunden im Einsatz sind. Kommen neue Modellvarianten hinzu, so werden diese i.d.R. vom Plugin erkannt. Möglich ist dies, weil gängige MIBs wie QUANTUM-SMALL-TAPE-LIBRARY-MIB, SEMI-MIB, SL-HW-LIB-T950-MIB, UCD-SNMP-MIB, ADIC-INTELLIGENT-STORAGE-MIB, ADIC-INTELLIGENT-STORAGE-MIB, BDT-MIB, … bereits enthalten sind. Durch Prüfen charakteristischer OIDs wird ermittelt, welche MIBs die zu überwachende Library implementiert hat, danach wird der entsprechende Zweig mit den spezifischen Abfragen ausgeführt.

weiterlesen...

Author:Gerhard Laußer
Tags:Nagios, HP, Quantum, StorEver, FlexStor, i6000
Categories:nagios, omd

Beim Monitoring von SAP mit check_sap_health wurden bisher die Bereiche CCMS, Verbuchungssystem und Shortdumps abgedeckt. Mit der neuen Version können nun auch Hintergrundjobs überwacht werden. Folgende Anforderungen wurden implementiert:

  • check_sap_health soll Jobs melden, welche einen fehlerhaften Status haben. Würde man in SM37 nachschauen, dann würde man bei diese(n) Job(s) den Status aborted angezeigt bekommen
  • Defaultmäßig interessiert sich das Plugin nur für die vergangenen 60 Minuten, also die Jobs die in der letzten Stunde fertig geworden (oder abgebrochen) sind. Eine andere Zeitspanne ist einstellbar (so gibt es das auch beim Shortdump-Check). Dadurch hat der Service bei einem üblichen 5-Minuten-Check-1-Minute-Retry-Intervall die Gelegenheit, kritisch zu werden und eine Notification zu verschicken und nach kurzer Zeit wieder grün zu werden.
  • Die Sicht des Plugins kann mit Hilfe des Parameters --name auch auf bestimmte Jobs eingegrenzt werden. Es interessiert sich dann ausschließlich für Jobs dieses Namens. Damit lassen sich eigene Services einrichten, die speziell die Jobs bestimmter Applikationen bzw. des Systeme überwachen.
  • Bei allen Jobs, die in den letzten 30 Minuten fertig geworden sind, wird die Laufzeit mit vorgegebenen Schwellwerten verglichen. (--warning/critical). Bei Überschreitung gibt es Alarm. Die Laufzeit wird als <jobname>_runtime=… in den Performancedaten auftauchen.

weiterlesen...

Author:Gerhard Laußer
Tags:Nagios, SAP, omd, Icinga, naemon, Netweaver
Categories:nagios, omd

One of the most often requested features is the possibility to place hosts, services and host/servicegroups on a geomap.
Now with release 1.88 Thruk made a major change in its panorama dashboard to support this kind of map too.

weiterlesen...

Author:Sven Nierlein
Tags:Nagios, Thruk, omd, Icinga, naemon, Dashboard, GeoMap
Categories:nagios, omd, thruk, naemon

Wem meine Folien zum Thema Netzwerkmonitoring mit check_nwc_health zu trocken sind kann sich meinen Vortrag auch als Video anschauen. Film ab!

Author:Gerhard Laußer
Tags:cisco, Icinga, juniper, naemon, Nagios, plugin, Shinken, snmp, conference, talk
Categories:nagios

Vorgestern habe ich auf der diesjährigen Open-Source-Monitoring-Konferenz in Nürnberg einen Vortrag über check_nwc_health gehalten.
Hier sind die Folien für diejenigen, die das Pech hatten, nicht dabei zu sein (damit meine ich die Konferenz an sich, nicht meinen Vortrag)

Author:Gerhard Laußer
Tags:cisco, Icinga, juniper, naemon, Nagios, plugin, Shinken, snmp, conference, talk
Categories:nagios

Ich habe in letzter Zeit viel Aufwand in die Entwicklung bzw. Erweiterung von SNMP-Plugins gesteckt. Die, die ich veröffentliche habe sind: check_nwc_health für Netzwerkkomponenten, check_ups_health für unterbrechungsfreie Stromversorgungen und check_tl_health für Tape Libraries. Allen drei haben gemeinsam, daß sie bei einheitlichem Kommandozeilenformat möglichst viele unterschiedliche Hersteller und Modelle abdecken. Wenn ich nun eine neue Anforderung bekomme und ein Plugin für ein bisher unbekanntes Gerät erweitern muss, dann brauche ich erstmal eine Übersicht über die MIBs und OIDs, welche bei diesem Gerät implementiert wurden. Ich kann natürlich die Dokumentation durchschauen, aber die steht nicht immer zur Verfügung bzw. ist nicht sehr aufschlussreich. Ein Snmpwalk ist auch einer der ersten Schritte, aber der liefert mir einfach nur endlose Zahlenkolonnen, die ich mühsam interpretieren muss. Daher habe ich einen --mode supportedmibs eingeführt, mit dessen Hilfe ich die Namen der unterstützten MIBs angezeigt bekomme.

weiterlesen...

Author:Gerhard Laußer
Tags:check_nwc_health, Nagios, Plugins, snmp
Categories:nagios

Mit Sakuli lassen sich unabhängig vom Betriebssystem User-Aktionen in Anwendungen (Fat-Client, Citrix, Web, …) simulieren; die Stati und dabei gemessenen Laufzeiten werden von Nagios ausgewertet und visualisiert. Unter der Haube stecken die Tools

die wir unter dem Namen “Sakuli” über ihre gemeinsame API zu einem Team zusammenspannt und auf GitHub veröffentlicht haben.

weiterlesen...

Author:Simon Meggle
Tags:e2e, end2end, monitoring, Nagios, omd, sakuli
Categories:nagios, omd, sakuli
Naemon & Thruk

Auf dem diesjährigen Monitoring Workshop in Berlin durfte ich Neuigkeiten aus 2 Projekten vorstellen.

weiterlesen...

Author:Sven Nierlein
Tags:Business Process, Dashboard, Nagios, reporting, Thruk
Categories:naemon, nagios, thruk

Monitoring von SAP mit den bisher vorhandenen Plugins beschränkte sich auf die Abfrage von CCMS-Metriken. In einem SAP-System steckt aber noch viel mehr, das sich überwachen lässt. Check_sap_health ist ein neues Plugin, welches in Perl geschrieben wurde. Es entstand in einem Projekt, bei dem von unterschiedlichen Standorten aus die Laufzeiten von BAPI-Aufrufen gemessen werden sollten. Durch die einfache Erweiterung des Plugins um selbstgeschriebene Perl-Elemente lassen sich beliebige Funktionen per RFC aufrufen und somit firmenspezifische Logik implementieren.

weiterlesen...

Author:Gerhard Laußer
Tags:bapi, ccms, Icinga, naemon, Nagios, netweaver, rfc, rz20, sap, Shinken
Categories:naemon, nagios, omd, shinken
Erstes Naemon Release

Der als Nagios 4 Nachfolger angetretene Fork “Naemon” veröffentlichte heute sein erstes Stable Release mit der Nummer 0.8.0.
Aber was macht Naemon nun besser als Nagios?

weiterlesen...

Author:Sven Nierlein
Tags:monitoring, naemon, Nagios, omd, Thruk
Categories:naemon

 

2296OS

Der Verlag Packt Publishing ist an mich herangetreten und hat mich gebeten, eine Rezension zum soeben erschienenen Buch Icinga Network Monitoring von Viranch Mehta zu schreiben.

Eigentlich hatte ich keine Zeit, aber wenn mir jemand mit „Keeping in mind your knowledge in this subject and having looked at your contributions, I feel you'd make an excellent reviewer of this book.“ kommt, dann werde ich natürlich schwach.

Das Buch richtet sich an eine Leserschaft, die bisher keinen Kontakt zur Icinga (bzw. Nagios, Naemon oder Shinken) hatte. Linux-Kenntnisse werden aber dennoch vorausgesetzt. Ziel des Autors war es, eine nachvollziehbare (im Sinne von: sofort am Rechner umsetzbar) und möglichst vollständige Anleitung zu erstellen, anhand derer ein Icinga-Neuling (mit ein bisschen Hirnschmalz sind die Schritte aber auch auf die o.g. Geschwister von Icinga anwendbar) in kurzer Zeit ein Basis-Monitoring für seine IT-Landschaft aufsetzen kann.

weiterlesen...

Author:Gerhard Laußer
Tags:Icinga, linux, Nagios, Shinken
Categories:nagios

Lange hat’s gedauert, aber seit heute kann man sich das Debian-Paket für OMD-1.00 vom ConSol-Labs-Repository herunterladen.

root@raspberrypi:~# apt-get install omd-1.00

Die Maschinen unserer Kunden, auf denen wir uns tagtäglich bewegen und Monitoring-Systeme betreiben, haben üblicherweise CPUs und Gigabytes im zweistelligen Bereich. Da wird es schon zur Geduldsprobe, wenn ein Build auf dem Raspberry Pi den halben Tag braucht. Ein ARM11 ist eben kein Xeon und SD ist nicht SSD.

weiterlesen...

Author:Gerhard Laußer
Tags:arm, Icinga, Nagios, odroid, omd, omdistro, raspberry, raspberry pi, Shinken
Categories:nagios, omd
OMD 1.00 just arrived

OMD-LOGO_FINAL2 The developer team of OMD (Open Monitoring Distribution) released the version 1.00 today. Three years after the project started we decided it was time to show that OMD is no longer under development but is a mature, proven product.

This version contains lots of updated packages including Nagios 3.5.0, Shinken 1.4, Multisite 1.2.2p2, Thruk 1.72, PNP4Nagios 0.6.21, NagVis 1.7.1, check_mk 1.2.2p2 and many more.

Using the OMD Repository installation is as simple as a apt-get install omd. If you have an rpm-based system, it's as simple as yum install omd or zypper install omd.

For those who weren't using OMD yet, now there is no more reason to hesitate.

Author:Gerhard Laußer
Tags:Icinga, monitoring, Nagios, omd, Shinken
Categories:nagios, omd

fritzdect200-smallIm Februar bestellt und in der letzten Mai-Woche eingetroffen. Die intelligenten Steckdosen von AVM scheinen heiss begehrt zu sein. Jedenfalls kann ich jetzt über meine FRITZ!BOX aufzeichnen, wieviel Strom gewisse Geräte momentan oder aber über einen langen Zeitraum verbrauchen.
Von Berufs wegen juckt's mich natürlich jedesmal in den Fingern, wenn irgendwo Messwerte anfallen. Mein Plugin check_nwc_health kann ja bereits CPU, Speicher und Interfaces einer FRITZ!BOX 7390 abfragen, also war klar, daß die Überwachung der FRITZ!DECT 200 bzw. des gemessenen Energieverbrauchs unbedingt dazugehört.

Die fünfte Ausgabe der ConSol Monitoring Minutes, die sich mit diesem Thema befasst, ist heute ebenfalls entstanden.

weiterlesen...

Author:Gerhard Laußer
Tags:avm, dect, fritz!box, Icinga, Nagios, Shinken
Categories:monitoring minutes, nagios, omd, shinken, thruk

mm_mg Wie in der dritten Folge schon angekündigt, habe ich zum Thema HSRP ein eigenes Filmchen erstellt. Hier ist die vierte Folge der ConSol Monitoring Minutes, in der gezeigt wird, wie eine mit dem HSRP-Protokoll redundant gemachte Gruppe von Cisco-Routern mit check_nwc_health überwacht wird.

weiterlesen...

Author:Gerhard Laußer
Tags:cisco, hsrp, Icinga, Nagios, Shinken, snmp
Categories:monitoring minutes, nagios, omd, shinken, thruk

mm_mg

Soeben erschienen: die zweite Folge der ConSol Monitoring Minutes. Getreu unserem Motto “aus der Praxis für die Praxis” zeigen wir darin live, wie die Checks einer großen Nagios-Installation (hier: einer OMD-Site) mit Mod-Gearman an Worker delegiert werden können.

Beim “Schweizer Taschenmesser” OMD (erhältlich über das ConSol-Repository) ist Mod-Gearman bereits integriert.

weiterlesen...

There won’t be general multi-language support in Thruk, but you may now choose different languages for your reports. The brand new release v1.64 comes with 5 built-in languages and it’s
super easy to add a new one.

weiterlesen...

Author:Sven Nierlein
Tags:Nagios, omd, reporting, Thruk
Categories:nagios

Cisco WLC dienen dazu, Access Points zu verwalten und an ein Backbone-Netz anzubinden. Es gibt zwar schon ein paar Plugins, um diese Geräte mit Nagios zu überwachen, aber ich mag es nicht, für jeden Service ein eigenes Plugin installieren zu müssen. Daher hat das Schweizer Taschenmesser check_nwc_health jetzt eine weitere Klinge bekommen.

weiterlesen...

Author:Gerhard Laußer
Tags:check_nwc_health, cisco, Icinga, Nagios, Shinken, wlan, wlc
Categories:nagios, shinken

Consulting im Bereich Monitoring wird nie langweilig. Ständig wird man mit neuen Anforderungen konfrontiert, so wie vergangene Woche:

Blue Coat ProxyNG Appliances sollten überwacht werden, genauer gesagt das Modell SG600. Diese Appliances finden Verwendung in Application Delivery Networks (ADN), wo sie für die performante Auslieferung von Geschäftsanwendungen und Schutz vor web-basierten Bedrohungen sorgen.
Und jetzt zum Monitoring…

weiterlesen...

Author:Gerhard Laußer
Tags:blue coat, check_nwc_health, Icinga, Nagios, plugin, proxyng, Shinken
Categories:nagios

Anlässlich der neuen Videoserie "ConSol Monitoring Minutes" habe ich mir überlegt, wie man die Zahl der Zugriffe auf ein YouTube-Video mit einem Nagios-Plugin auslesen und mit PNP4Nagios aufzeichnen kann. Ein eigenes Plugin müsste dazu die Informationen herunterladen, Kennzahlen aus dem Resultat herausparsen, ausgeben und nicht zuletzt irgendwie auf Download-Fehler reagieren. Mit check_logfiles, einer kleinen Konfigurationsdatei und der YouTube-API ist das aber kein Problem.

weiterlesen...

Author:Gerhard Laußer
Tags:check_logfiles, heino, Icinga, Nagios, Shinken, youtube
Categories:monitoring minutes, nagios, shinken

Monitoring Minutes

Die erste Folge der ConSol "Monitoring Minutes" ist soeben auf YouTube erschienen;
darin geben wir einen Überblick über den Aufbau und die Funktionsweise von OMD und zeigen zuletzt, wie OMD mit wenigen Handgriffen über die Repositories von ConSol installiert und aktualisiert werden kann.

 

 

 

Hier gehts zur ersten Folge: OMD im Überblick - ConSol Monitoring Minutes

weiterlesen...

Während der letzten Wochen habe ich viel Geduld aufgebracht, um auf meinem neuen Raspberry Pi die Open Monitoring Distribution zu bauen und zuletzt ein Debian-Install-Paket zu erstellen. Geduld deshalb, weil ein “make” schon mal einen Tag und mehr läuft. Wenn dann immer wieder Anpassungen im Build-Prozess für diese spezielle Hardware nötig sind, zieht sich das ganze Unternehmen ordentlich in die Länge. Aber nun ist es überstanden und die Version 0.56 von OMD kann auf dem Raspberry Pi installiert werden.

weiterlesen...

Author:Gerhard Laußer
Tags:Nagios, omd, omdistro, raspberry, Shinken
Categories:nagios, omd
Thruk 1.36 Released

Version 1.36 of the Thruk monitoring gui has just been released. The changelog is quite huge this time. There is a new dashboard plugin called the ‘Panorama View’ Addon. There are a lot more reports included now. And finally there is a plugin manager included in the config tool which lets you easily manage your plugins and addons.

weiterlesen...

Author:Sven Nierlein
Tags:Nagios, omd, Shinken, Thruk
Categories:nagios, thruk

Monitoring Unix clients is very easy with the check_by_ssh plugin. The only prerequisite is public-key-based access and installation of some plugins on the remote side. Then, running a check is as easy as:

<br />
check_by_ssh –host 10.177.3.39 –logname nagios \<br />
    –command “lib/nagios/plugins/check_swap -w 15% -c 8%”<br />

The drawback of this method is extra load on the nagios server. With every check, a ssh process is forked which has to do a complete handshake with the remote side. With newer ssh implementations it is possible to have a persistent connection which requires only one handshake at startup. All the following ssh connects use the already established connection, which saves a lot of cpu cycles.
Here are the instructions to combine check_by_ssh with such a persistent tunnel.

weiterlesen...

Author:Gerhard Laußer
Tags:check_by_ssh, controlmaster, Nagios, omd, Shinken, ssh
Categories:nagios, omd

The well-known plugin check_by_ssh is a wrapper around the ssh client program. Unfortunately the path to ssh is defined at compile-time and remains hard-coded in the check_by_ssh binary. Usually this is /usr/bin/ssh. If you want to use features which are not implemented in your distribution’s ssh, but in an alternative ssh binary, you have to recompile check_by_ssh. Here is a patch which makes it easy to switch between multiple ssh binaries using a command line parameter.

weiterlesen...

Author:Gerhard Laußer
Tags:check_by_ssh, controlmaster, Nagios, plugin, Shinken, ssh
Categories:nagios

Every now and then some of our 7x24 hosts / services need a daily or weekly maintmode for regular restarts. Normally you would have to create 2 new timeperiods because you don’t want both hosts in a cluster to be restarted at the same time. This is not just way to much work, it also adds unnecessary complexity because
nobody can see the maintmode unless you look into the config files.

Thats where recurring downtimes will become handy and latest Thruk Version includes this new feature.

weiterlesen...

Author:Sven Nierlein
Tags:Nagios, omd, Thruk
Categories:nagios, omd, thruk

One of my bigger OMD installations consists of 13 sites. The visualization layer uses the Thruk interface. This alternative web ui can read data from multiple livestatus backends and display the host and service objects in one unified view. For this purpose i have one extra site called gui which only starts an apache process. I then point my browser to http://…./gui/thruk

The addresses of the livestatus backends have to be written into a config file, thruk_local.cfg. Now what if my list of 13 sites would be constantly changing? What if new OMD sites would be created, others deleted on a daily basis? I would have to edit the config file every time. With the new init-hook-feature, OMD will do this automatically for me.

weiterlesen...

Author:Gerhard Laußer
Tags:livestatus, Nagios, Shinken, Thruk
Categories:nagios, omd, shinken, thruk

Keeping an eye on cpu usage of your servers is one of the basic things in system monitoring. For Nagios (and Shinken, of course) you’ll find plenty of plugins for this task. However, i was never happy with the way they work. Most of the plugins you can download work like this: read a counter - sleep - re-read the counter. This technique not only adds an extra delay to the execution time of the plugin, but it only shows the state of things within a small time frame. If you run such a plugin every 5 minutes and it sleeps 5 seconds between the two measurements, you don’t know what happens in the other 295 seconds. This is a very small sample rate.

weiterlesen...

Author:Gerhard Laußer
Tags:check_logfiles, cpu, Icinga, linux, Nagios, Shinken
Categories:nagios, omd, shinken

You probably have noticed that development of the new Nagios-compatible monitoring system Shinken progresses very fast. Every few hours there is another commit at GitHub, where Shinken’s code repository is hosted. Now if you want to try all these new features immediately, there’s a very easy method which requires a simple update-command instead of a fresh install.

weiterlesen...

Author:Gerhard Laußer
Tags:monitoring, Nagios, omd, Shinken, Thruk
Categories:nagios, omd, shinken
OMD 0.54 is available

OMD-LOGO_FINAL2 The developer team of OMD (Open Monitoring Distribution) released the version 0.54 today. This version contains bugfixes and lots of updated packages including Shinken 1.0.1, Thruk 1.26, PNP4Nagios 0.6.17, NagVis 1.6.5 and many more.

weiterlesen...

Author:Gerhard Laußer
Tags:Mod-Gearman, Nagios, omd, Shinken, Thruk
Categories:nagios, omd, shinken, thruk

Virtualisierung spart Kosten und Ressourcen, stellt aber hohe Ansprüche an Verwaltung und Monitoring. Die schwedische Firma op5 entwickelte für ihr gleichnamiges Nagios-basierendes Produkt das Plugin check_esx3, welches ein umfassendes Monitoring von VMWare ESX-Umgebungen ermöglicht.

weiterlesen...

Author:Simon Meggle
Tags:esx, esxi, Nagios, omd, Plugins, vmware
Categories:nagios

Version 1.2.6 of Mod-Gearman has just been released. You may now configure the worker queues by custom variables instead of host/servicegroups.

weiterlesen...

Author:Sven Nierlein
Tags:Mod-Gearman, Nagios
Categories:mod-gearman, nagios

check_oracle_health, check_mysql_health, check_mssql_health und check_db2_health bringen von Haus aus schon eine Menge Funktionalität mit. Allerdings wurden sie speziell für die Belange von Datenbankadministratoren entwickelt. Um auch den Betreibern von datenbankgestützten Applikationen die Möglichkeit zu geben, bestimmte Werte per SQL abzufragen, gibt es den Parameter "--mode sql". Damit lässt sich das numerische Ergebnis eines SQL-Aufrufs mit Schwellwerten vergleichen und in einen Nagios-Exitcode verwandeln. Üblicherweise sind die Anforderungen der Applikation an das Monitoring jedoch etwas komplexer. Am Beispiel von check_mysql_health und Wordpress wird gezeigt, wie man so etwas einfach umsetzen kann.

weiterlesen...

Version 1.2.2 of Mod-Gearman has just been released. It now comes with better orphaned check detection and easier installation for rpm based linux systems.

weiterlesen...

Author:Sven Nierlein
Tags:Mod-Gearman, Nagios
Categories:mod-gearman, nagios

In my last post i was explaining why it became necessary to have an alternative to the sqlite-based storing of log data. One of the many new features of the upcoming release 1.0 “Heroic Hedgehog” of the Shinken monitoring software will be a MongoDB backend used by the livestatus module.

In this post i will show how to configure the livestatus module with a MongoDB cluster.

weiterlesen...

Author:Gerhard Laußer
Tags:livestatus, mongodb, monitoring, Nagios, Shinken
Categories:nagios, shinken
Pimp my Livestatus

In the early days of the Shinken monitoring system you were quite limited in how many web user interfaces you could use. There was the old CGI-based Nagios-Webinterface or (thanks to the merlin-mysql broker module) the Ninja GUI from OP5.
At the same time, two Projects, Thruk and Multisite, became very popular. The success of these two web guis was mainly based on the way they communicated with the Nagios core.

weiterlesen...

Author:Gerhard Laußer
Tags:livestatus, mongodb, Nagios, Shinken
Categories:nagios, shinken

The upcoming version 1.1.2 of Mod-Gearman will have embedded Perl support which greatly improves performance when you have lots of Perl checks.

weiterlesen...

Author:Sven Nierlein
Tags:Mod-Gearman, Nagios
Categories:mod-gearman, nagios
OMD 0.50 is available

The developer team of OMD (Open Monitoring Distribution) released the version 0.50 today. This version contains bugfixes and lots of updated packages including Shinken, Thruk, PNP4Nagios, Mod-Gearman, check_oracle_health and check_mysql_health.

weiterlesen...

Author:Sven Nierlein
Tags:check_mysql_health, check_oracle_health, Nagios, omd, repository, Thruk
Categories:nagios, omd

Jolokia and Jmx4Perl will go on tour this autumn. Roland Huss will talk about both projects in November at Devoxx, Antwerp, which is the biggest independent Java community conference in the world and at the Open Source Monitoring Conference, Nuremberg.

weiterlesen...

Author:Roland Huß
Tags:jmx, Jmx4Perl, Jolokia, Nagios
Categories:jolokia
Thruk Release 1.0.9

Thruk 1.0.9 has just been released and contains a couple of cool new features. This version will also be in the next OMD release. Besides the release itself, new documentation about plugins and themes has been published.

weiterlesen...

Author:Sven Nierlein
Tags:Nagios, omd, Thruk
Categories:nagios, omd, thruk
OMD Repository

There is a now an ‘unofficial’ OMD Repository OMD Repository.
This makes new installations and upgrading your OMD sites even more easier.

weiterlesen...

Author:Sven Nierlein
Tags:Nagios, omd
Categories:nagios, omd

Mod-Gearman 1.0.8 has been released (download).
This release mostly contains bugfixes only and a minor change to use the identifier more often.

weiterlesen...

Author:Sven Nierlein
Tags:Mod-Gearman, Nagios
Categories:mod-gearman, nagios

Seit heute gibt es die Version 1.6.9 von check_oracle_health. Hauptzweck ist die Beseitigung eines Problems, das auftaucht, wenn man das Plugin unter OMD einsetzt. Daneben ist aber auch die Liste der Modi erweitert worden, um noch mehr Fehlersituationen in großen Oracle-Installationen rechtzeitig erkennen zu können.

weiterlesen...

Author:Gerhard Laußer
Tags:check_oracle_health, datafiles, Nagios, ora-00059, oracle, rman
Categories:nagios, shinken
Thruk Release 0.94

Straight on the road to the Thruk 1.0 this will probably the last feature release so far.
The main focus was on usability and accessibility. This version will also be in the next OMD release.

weiterlesen...

Author:Sven Nierlein
Tags:Nagios, Thruk
Categories:nagios, omd, thruk
OMD 0.46 is there!

The developer team of OMD released the version 0.46 last week. Now you will not only be able to run Nagios out of the box. Shinken has been added as an alternative core. This enables you to create one set of configuration files and switch between two monitoring technologies with only a few commands.

weiterlesen...

Author:Gerhard Laußer
Tags:Nagios, omd, Shinken
Categories:nagios, omd, shinken

Wer sich die neueste Version von Icinga zum Ausprobieren herunterladen will, greift aus Bequemlichkeit sicher auf die virtuelle Maschine zurück, die bereits eine vorgefertigte, vollständige Installation enthält. Das dabei verwendete ova-Format kann allerdings nicht ohne weiteres in einer VMware-Umgebung verwendet werden. Zwar taucht auch ova in den von VMware unterstützten Virtualisierungsformaten auf, in diesem speziellen Fall trifft das jedoch nicht zu. Der VMware vCenter Converter zumindest weigert sich, die Icinga-Datei anzunehmen. Was man tun muss, um Icinga.ova in einen ESX-Server hochzuladen, wird hier beschrieben.

weiterlesen...

Author:Gerhard Laußer
Tags:Icinga, Nagios, OVF, ovftool, vmware
Categories:nagios

Seit einigen Versionen ist check_oracle_health auch unter Windows lauffähig, was anscheinend nur wenig bekannt ist. In vielen Firmen ist auf den Arbeitsplatz-PCs ein Oracle-Client installiert, mit dem Applikationen auf die Unternehmensdatenbanken zugreifen. Es ist daher nur logisch, wenn beim Monitoring die Verfügbarkeit einer Datenbank aus der Sicht so eines PCs geprüft wird.

weiterlesen...

Author:Gerhard Laußer
Tags:check_oracle_health, Nagios, oracle, windows
Categories:nagios
Mod-Gearman 1.0 released

Mod-Gearman 1.0 has been released (download).
About half a year after starting development of Mod-Gearman it’s time to finish main development and release the stable 1.0.

  • use gearman to spread the load of your nagios box onto several worker
  • avoid core blocking events like eventhandler
  • distribute writing performance data

weiterlesen...

Author:Sven Nierlein
Tags:Distribution, Gearman, Nagios
Categories:nagios

OMD, the new star on the open monitoring scene, has been released in version 0.44 two weeks ago with a lot of enhancements and new addons.

weiterlesen...

A small Nagios plugin for monitoring search hit counts. Don’t take it too seriously.

weiterlesen...

Author:Roland Huß
Tags:Nagios
Categories:nagios

Die Datenbank-Plugins check_oracle_health, check_mysql_health, check_mssql_health und check_db2_health unterstützen auf vielfachen Wunsch auch den Parameter --extra-opts. Damit ist es jetzt möglich, z.B. Login-Daten von den Kommandozeilenparametern in Konfigurationsdateien zu verlagern. Neben Environmentvariablen gibt es somit eine weitere Alternative, Passwörter aus der Prozessliste zu entfernen und dadurch vor neugierigen Blicken zu schützen.

weiterlesen...

Author:Gerhard Laußer
Tags:check_mysql_health, extra-opts, Nagios, Plugins
Categories:nagios
Thruk 0.70

Thruk 0.70 has been released at (download). The three major changes from user perspective are

  • side menu is completly adjustable by config file
  • excel export for hosts and services
  • search includes comments and downtimes

weiterlesen...

Author:Sven Nierlein
Tags:Nagios, Thruk
Categories:nagios

Since version 0.70, check_jmx4perl has support for configuration files. JMX Nagios checks are now considerably simpler to configure and multi checks add even more performance and flexibility.

weiterlesen...

Author:Roland Huß
Tags:check_jmx4perl, jmx4perl, Nagios
Categories:jmx4perl, nagios

If you have defined services using the nrpe mechanism, you might know the following scenario:
The NRPE daemon fails and all services using it go critical. One first step to avoid these false alarms is to create an additional service which monitors the NRPE daemon itself (called check_nrpe_daemon in this example) and install a dependency between your services and check_nrpe_daemon.

weiterlesen...

Author:Gerhard Laußer
Tags:Nagios, nrpe
Categories:nagios

Es gibt mal wieder ein Update für check_hpasm, diesmal mit dem Schwerpunkt auf HP Bladesystems. Neu hinzugekommen ist die Überwachung von Sicherungen (Fuses) und Enclosure Managern. Ausserdem werden jetzt bei fehlerhaften Komponenten auch gleich die Spare-Part-Nummern angezeigt.

weiterlesen...

Author:Gerhard Laußer
Tags:BladeCenter, check_hpasm, Nagios, Plugins, snmp
Categories:nagios

Folgende Anfrage wurde von einem Kunden an mich gerichtet:

Jetzt kam von den Admin die Anfrage ob es nicht möglich ist alle Meldungen (winwarncrit) erstmal als Warning an Nagios zu melden, um dann bestimmte Meldungen nach und nach als Critical einzustufen, oder komplett zu verwerfen (exclude).
Geht das?

weiterlesen...

Author:Gerhard Laußer
Tags:check_logfiles, Eventlog, Nagios
Categories:nagios
Jmx4perl Mule Agent

In its standalone mode, Mule provides a simple to use interface for custom agents to plug in. This blog post is about the new jmx4perl mule agent which can be used with jmx4perl and the Nagios check check_jmx4perl.

weiterlesen...

Author:Roland Huß
Tags:check_jmx4perl, jmx, Jmx4Perl, Mule, Nagios
Categories:jmx4perl

Das neueste Release von check_hpasm ermittelt jetzt nicht mehr nur den globalen Status der cpqRack-MIB eines BladeCenters, sondern liest die wichtigsten Tabellen detailliert aus. Aufgerufen mit -v liefert check_hpasm eine Übersicht der verbauten Komponenten samt deren Status. Und so sieht das dann aus:

weiterlesen...

Author:Gerhard Laußer
Tags:Blade, BladeCenter, check_hpasm, cpqRack, hp, Nagios, Plugins
Categories:nagios

In our series of articles about configuring remote JMX access for the jmx4perl proxy mode, this article tackles how to enable JMX remoting for Weblogic Server 9 and 10. It is not specific to jmx4perl and explains several different setups and possible problems.

weiterlesen...

Author:Roland Huß
Tags:J2EE, jmx, Jmx4Perl, jsr-160, Nagios
Categories:jmx4perl

Statt zwei Wochen hat das Redesign von check_hpasm nun doch zwei Monate gedauert, aber dafür ist das Plugin für künftige Erweiterungen bestens gerüstet. Hinzugekommen ist die Unterstützung der neuen G6-Proliants und die Fähigkeit, auch HP BladeCenter (wenn auch nicht so detailliert) und HP Storage-Systeme überwachen zu können. Es wurden auch ein paar Verbesserungen an der (nicht ganz einfachen) Erkennung der Speichermodule vorgenommen. Bei einigen Anwendern dürften jetzt defekte Riegel ans Tageslicht kommen, deren Zustand sich mit der 3.x-Version nicht feststellen liess.

weiterlesen...

Author:Gerhard Laußer
Tags:check_hpasm, hp, Nagios, proliant
Categories:nagios

Nagios-Installationen, die über die Command Pipe Checkergebnisse von externen Kommandos entgegennehmen, sollten überprüfen, ob diese auch tatsächlich eintreffen und verarbeitet werden. Dieses Plugin schickt ein Testergebnis in die Pipe und sieht nach, ob im Logfile eine Bestätigung aufgetaucht ist.

<br />
$ check_nagios_external_commands -t 120 -p /usr/local/nagios/var/rw/nagios.cmd \<br />
    -l /usr/local/nagios/var/nagios.log<br />
WARNING - command took 23s|command_write=0.85s command_read=22s<br />

check_nagios_external_commands_0.1.tar

Author:Sven Nierlein
Tags:check_nagios_external_commands, Nagios
Categories:nagios

jmx4perl knows since some time how to restrict access to the agent (and soon proxy) servlet based on various criteria. However, this feature is unfortunately not yet well documented and a little bit hidden. This blog describes the nifty details and future roadmap.

weiterlesen...

Author:Roland Huß
Tags:jmx, Jmx4Perl, Nagios
Categories:jmx4perl

As described in the last post jmx4perl can be operated in a so called agentless mode. For this to work, the target java server must be prepared for accepting remote JMX connections as described in JSR-160.

Unfortunately, this setup is not really standardized and specific to the Java JDK in use and the application server itself. In this post we concentrate on how to setup JMX remoting for JBoss.

weiterlesen...

Author:Roland Huß
Tags:jboss, jmx, Jmx4Perl, jsr-160, Nagios
Categories:jmx4perl

Big news around: jmx4perl supports now an agentless mode in which the target platform can be monitored without installing the j4p agent servlet. This works by using j4p.war as a JMX Proxy, which translates our JSON/HTTP protocol on the frontside to JSR-160 JMX remote requests on the backend and vice versa.

weiterlesen...

Author:Roland Huß
Tags:jmx, Jmx4Perl, Nagios, proxy
Categories:jmx4perl

Das neue Release 4.0 von check_hpasm ist prinzipiell fertig und mit den Daten von über 500 Proliants getestet. Vorsichtshalber möchte ich aber noch eine letzte Testversion veröffentlichen. Hauptsächlich wurde die Erkennung von Speicherbausteinen verbessert. Vielen Maschinen, die bisher  “status of all * dimms is n/a (please upgrade firmware)” meldeten, werden nun durch ein paar Tricks doch noch die fehlenden Informationen entlockt bzw. mit Hilfe bisher unbeachteter OIDs rekonstruiert.

check_hpasm-4pre3.tar.gz

Author:Gerhard Laußer
Tags:check_hpasm, hpasm, Nagios, Plugins, proliant
Categories:nagios

Betreibt man eine hochverfügbare Nagios-Installation mit dem Heartbeat-Cluster, so benötigt man für die einzelnen Softwarekomponenten (Resourcen genannt) Agenten, die sich um Start, Stop und Überwachung derselben kümmern. Folgendes Script ermöglicht die Einbindung des NDO2DB-Daemons in so einen Cluster. Dazu muss man es nur nach /usr/lib/ocf/resource.d/<heartbeat oder ein eigener Provider>/ndo2db kopieren.

Download: ndo2db

Author:Gerhard Laußer
Tags:cluster, heartbeat, Nagios, ndo, ndo2db, ocf
Categories:nagios
check_mssql_health 1.5.3

Eine neue Version von check_mssql_health ist soeben erschienen. In erster Linie wurde ein Bug im Mode database-free beseitigt, der zu ungenauen bzw. falschen Ergebnissen führte, wenn der freie Plattenplatz knapp wurde.
Daneben wurde der neue Mode database-backup-age eingeführt, mit dem sich überwachen lässt, wie lange der Zeitpunkt des letzten Backups zurückliegt.

weiterlesen...

Author:Gerhard Laußer
Tags:check_mssql_health, Nagios, Plugins
Categories:nagios

Das Redesign von check_hpasm (Hauptgrund war die Unterstützung der neuen Proliant *G6) ist nun doch umfangreicher geworden, als ich dachte. Dafür ist der Code jetzt um einiges wartbarer und ermöglicht es, neue Features schneller und ohne Gefrickel einzubauen. Geplant ist ausserdem die Unterstützung von HP BladeCenter und Storagesystemen (Proliant 4LEE). Ein erstes Testrelease ist nun fertig.

weiterlesen...

Author:Gerhard Laußer
Tags:check_hpasm, Nagios, Plugins, proliant
Categories:nagios

Die check_[datenbank]_health-Plugins lassen sich leicht in ihrem Funktionsumfang erweitern, indem sie zur Laufzeit Zusatzmodule einlesen. Dieses Feature wurde eingebaut, damit für vorhandenen, u.U. firmenspezifischen Code kein eigenes Plugin geschrieben werden muss. Man steckt ihn einfach in Dateien, die einer bestimmten Namenskonvention folgen.
Als Beispiel soll hier gezeigt werden, wie man das Alter des letzten Backups einer Datenbank überwacht.

weiterlesen...

Author:Gerhard Laußer
Tags:Backup, check_mssql_health, Nagios, SQL Server
Categories:nagios

Im Rahmen des Münchner Nagios-Stammtisches hielt Roland Huß gestern einen Vortrag über sein Framework Jmx4Perl. Mittlerweile haben sich mehrere Leute erkundigt, wie die Service- und Commanddefinitionen für das dazugehörige Plugin check_jmx4perl aussehen könnten. Deshalb soll hier erläutert werden, wie man ein paar grundlegende Messwerte aus einem Applicationserver ausliest und mit Nagios überwacht.

weiterlesen...

Author:Gerhard Laußer
Tags:check_jmx4perl, Jmx4Perl, Nagios
Categories:jmx4perl

Es gibt ein neues Mitglied in der check_<datenbank>_health-Familie. Nach Oracle, MS SQL und MySQL habe ich mir DB2 vorgenommen und ein Plugin geschrieben, das leicht erweiterbar ist und grundlegende Anforderungen out of the box abdeckt.

weiterlesen...

Author:Gerhard Laußer
Tags:DB2, Nagios, Plugins
Categories:nagios

Ein unangenehmes Phänomen bei NFS-gemounteten Filesysteme tritt auf, wenn der Fileserver abstürzt oder ein Netzwerkproblem zwischen NFS-Server und -Client besteht. Sämtliche Prozesse, die auf Dateien auf so einem Filesystem zugreifen wollen, bleiben einfach hängen. Das gilt auch für Nagios-Plugins. Nach Ablauf des Timeouts wird der Nagios-Kernel den Plugin-Prozess zwar abschiessen, jedoch bleibt dieser in der Prozessliste und zwar so lange, bis der NFS-Server wieder antwortet.

weiterlesen...

Author:Admin
Tags:Nagios, nfs
Categories:nagios