Beschreibung

Das Plugin check_tl_health wurde mit dem Ziel entwickelt, ein einziges Werkzeug für sämtliche Belange des Monitorings von Tape Libraries zur Verfügung zu haben.

Motivation

Anstatt eine Vielzahl von Plugins für das Monitoring von Interfaces, Hardware, Slots etc. zu installieren und das für jedes Fabrikat, soll mit check_tl_health nur noch ein einziges Plugin ausreichen.

Dokumentation

Kommandozeilenparameter

Modi

    hardware-health cpu-load memory-usage uptime
HP StorEver 1×8 X     X
HP StorEver MSL4048 X     X
Quantum i40 X     X
Quantum i80 X     X
Quantum T950 X     X
Quantum i6000 X     X
BDT FlexStorII X     X

Die Liste ist ungenau. Manche Laufwerke, die hier nicht aufgeführt sind, werden evt. anhand der implementierten MIBs erkannt. Einfach ausprobieren…. (Wenn ein Gerät nicht erkannt wird, kann ich das Plugin erweitern. Hier gilt allerdings: betteln hilft nicht, bezahlen dagegen sehr).

Installation

Beispiele

# a HP Library

$ check_tl_health --hostname 10.18.12.130 \
    --community secret \
    --mode hardware-health
CRITICAL - device 1 (HP MSL 4048, sn:DEC12701BS) status is critical

$ check_tl_health --hostname 10.18.12.130 \
    --community secret \
    --mode hardware-health --verbose
I am a HP MSL G3 Series
CRITICAL - device 1 (HP MSL 4048, sn:DEC12701BS) status is critical
checking overall system
device 1 (HP MSL 4048, sn:DEC12701BS) status is critical

# a Quantum T950

$ check_tl_health --hostname 10.18.11.10 \
    --community secret \
    --mode hardware-health
OK - hardware working fine
$ check_tl_health --hostname 10.18.11.10 \
    --community secret \
    --mode hardware-health --verbose
I am a Linux MUC-TLIB-A 3.10.26 #1 SMP Wed May 21 15:50:38 MDT 2014 ppc
OK - hardware working fine
checking rassystems
connectivity has status good
control has status good
media has status good
drives has status good
powerAndCooling has status good
robotics has status good

# a Quantum i80

$ check_tl_health --hostname 10.18.1.28 \
    --community secret \
    --mode hardware-health
CRITICAL - operator action requested, overall states: media=degraded aggrega
tedIEDoor=closedAndUnLocked power=good cooling=good control=good connectivity=go
od robotics=good drive=good
$ check_tl_health --hostname 10.18.1.28 \
    --community secret \
    --mode hardware-health --verbose
I am a Linux hr-lib01 2.6.27.46 #1 PREEMPT Fri Apr 22 14:37:45 MDT 2011 ppc
CRITICAL - operator action requested, overall states: media=degraded aggrega
tedIEDoor=closedAndUnLocked power=good cooling=good control=good connectivity=go
od robotics=good drive=good
checking overall system
overall states: media=degraded aggregatedIEDoor=closedAndUnLocked power=good
 cooling=good control=good connectivity=good robotics=good drive=good
checking physical drives
overall drive status online=online readyness=ready
drive 1 states: online=online readyness=ready ras=good cleaning=notNeeded
drive 2 states: online=online readyness=ready ras=good cleaning=notNeeded
checking logical libraries
logical lib 1 states: online=online readyness=ready

Download

check_tl_health-1.4.1.tar.gz

Changelog

  • 2017-12-06 2.8.2.2
    update glplugin
  • 2017-08-02 2.8.2.1
    fix liebert temperature label
  • 2017-07-11 2.8.2
    xppc standby mode is ok
    update GLPlugin
  • 2017-05-12 2.8.1.1
    update GLPlugin
  • 2017-03-25 2.8.1
    finish liebert/ups mixed emerson in dubai
  • 2017-03-09 2.8.0.4
    fix variable in non-standalone
    filter ups-mib alarms
  • 2017-03-09 2.8.0.3
    remove unnecessary alarm info
  • 2017-03-08 2.8.0.2
    fix xups selftest alarm
  • 2017-02-02 2.8.0.1
    fix cs-121 output when on battery (Thanks k0ste)
  • 2016-11-11 2.8
    add Emerson Liebert
  • 2016-09-27 2.7.1.2
    fix generex trimod without mib-2
  • 2016-08-12 2.7.1.1
    update GLPlugin/Extraopts
  • 2016-06-21 2.7.1
    fix UPS for Generex cs141
  • 2016-06-03 2.7.0.2
    update GLPlugin
  • 2016-03-30 2.7.0.1
    bugfix in ups-mib batterytemperature
  • 2016-02-08 2.7
    add glplugin submodule
  • 2016-01-29 2.6.0.1
    minor bugfixes
  • 2016-01-29 2.6
    supports dynamic mib loading
  • 2016-01-20 2.5.2.7
    bugfix for apc powernet. no battery status means ok
  • 2015-07-13 2.5.2.6
    bugfix for apc powernet. noTransfer input ok, if battery 100% full
  • 2015-07-08 2.5.2.5
    bugfix in Socomec Netvision detection
  • 2015-05-20 2.5.2.4
    bugfix in V4 battery runtime (undef if not on batt.)
  • 2015-04-23 2.5.2.3
    update GLPlugin[SNMP]
  • 2015-04-23 2.5.2.2
    update GLPlugin[SNMP]
  • 2015-01-26 2.5.2.1
    update GLPlugin[SNMP]
  • 2014-12-22 2.5.2
    remove Raritan PX2 (was moved to the new plugin check_pdu_health)
  • 2014-12-16 2.5.1
    update GLPlugin
  • 2014-12-02 2.5
    implement Raritan PX2
  • 2014-10-01 2.4.0.13
    update GLPlugin
  • 2014-08-22 2.4.0.12
    bugfix in glplugin/uptime because of buggy snmpengineuptime
  • 2014-08-21 2.4.0.11
    GLPluginSNMP update/uptime thresholds
  • 2014-08-21 2.4.0.10
    GLPluginSNMP update
  • 2014-08-20 2.4.0.9
    GLPluginSNMP update
  • 2014-08-19 2.4.0.8
    GLPlugin/SNMP update
  • 2014-08-14 2.4.0.7
    GLPluginSNMP update
  • 2014-08-01 2.4.0.6
    GLPluginSNMP update
    MerlinGerin also asks XUPS alarm table
  • 2014-07-28 2.4.0.5
    GLPlugin update
  • 2014-07-28 2.4.0.4
    added more xups alarm descriptions
  • 2014-07-03 2.4.0.3
    update GLPlugin
  • 2014-06-06 2.4.0.2
    remove deprecated threshold code in add_perfdata
  • 2014-06-04 2.4.0.1
    bugfix in xups alert age
    detect merlingerin before xups
  • 2014-05-22 2.4
    finished GLPlugin migration
    rearranged the classification checks
    GLPlugin update
  • 2014-03-03 2.3.1
    bugfix in XUPS input current
    bugfix in Merlin Gerin input/output numbers
  • 2014-02-21 2.3
    add a check for input voltage = 0
  • 2014-02-21 2.2
    code cleanup
  • 2014-02-19 2.1
    add UPS-MIB
    add XPCC-MIB
  • 2014-02-18 2.0.1
    some bugfixes (unimplemented oids and perl undefs)
  • 2014-02-14 2.0
    rewrite using GLPlugin
    raise apc battery temperature threshold
  • 2014-01-15 1.2.1
    bugfix for apc powernet outputload undef values
    add XUPS MIB for Eaton
  • 2013-12-24 1.2
    add socomec netys and netvision
  • 2013-12-16 1.1
    add apc mge galaxy
  • 2013-12-11 1.0
    initial release (can Socomec RT 3000VA and generic UPS V4 devices)

Gerhard Laußer.

Check_tl_health wird unter der GNU General Public License zur Verfügung gestellt. GPL

Autor

Gerhard Laußer (gerhard.lausser@consol.de) beantwortet gerne Fragen zu diesem Plugin. Er ignoriert aber Fragen wie “Wann implementieren sie Library XY?”, “Wann haben sie mal Zeit, meine Probleme zu lösen?”, “Hatten sie schon Zeit, meine Probleme zu lösen?”, “Wann gibt’s die nächste Version?”, “Blablablubb funktioniert nicht, können sie dieses Problem lösen?”, “Hilfääää, mein Chef möchte, dass ich unseren Dong-Sing-Hao-Tapeloader von Ebay ins Icinga einbinde, kannst du das für mich machen?”.

Monitoring-Workshop 2017 12./13.9. Düsseldorf