Hardware-Monitoring von HP Proliant Servern

Übersicht über die Möglichkeiten der Hardware-Überwachung von HP Proliant Servern und Blades. Alle Informationen beziehen sich, soweit nicht anders angegeben, auf Debian GNU/Linux 6.0 (Squeeze) amd64.

Tools aus den Debian Repositories

In Debian GNU/Linux 6.0 sind zahlreiche Tools zum Hardware-Monitoring bereits enthalten. Mit Ausnahme von cciss-vol-status sind sie nicht HP-spezifisch, sondern unterstützen eine Reihe von Herstellern.

Paket Tool Beschreibung
array-info array-info Überwachung von RAID Arrays (für Controller von verschiedenen Herstellern)
cciss-vol-status cciss_vol_status Überwachung eines HP SmartArray RAID, kann direkt in Nagios eingebunden werden
ipmitool ipmitool Überwachung von Serverhardware nach dem IPMI (Intelligent Platform Management Interface) Standard
openipmi ipmicmd etc. Überwachung von Serverhardware nach dem IPMI (Intelligent Platform Management Interface) Standard
openhpi hpi_shell etc. Interface zum Hardware-Management gemäß HPI (Hardware Platform Interface) Standard des SAF (Service Availability Forum)
lm-sensors sensors Auslesen der Temperatursensoren
lshw lshw Auflistung der Hardware-Komponenten eines Servers
dmidecode dmidecode Auflistung der Hardware-Informationen aus dem DMI (Desktop Management Interface)
pciutils lspci Informationen über PCI (Peripheral Component Interconnect) Devices
usbutils lsusb Informationen über USB (Universal Serial Bus) Devices
hwloc lstopo Anzeige der System-Topologie (CPU-Cores, Caches, NUMA nodes etc.)
numactl numastat Anzeige der Speicherzugriffe der NUMA Nodes
edac-utils edac-util Status des EDAC (Error Detection And Correction) Fehlerkorrektur anzeigen

Tools von Hewlett Packard

Management Component Pack

Die Monitoring- und System Management Tools von Hewlett Packard für die Proliant Server Serie sind als Debian Repository verfügbar. Dazu muss folgendes in die Datei /etc/apt/sources.list.d/proliant.list eingetragen werden.
Bemerkung: Die Tools wurden vor kurzem von PSP (Proliant Support Pack) nach MCP (Management Component Pack) umbenannt. Dementsprechend hat sich die URL der Paketquellen geändert!

# HP Management Software
deb http://downloads.linux.hp.com/SDR/repo/mcp  wheezy/current  non-free 

Für Debian 8 (jessie) gibt es noch keine passenden Paketquellen. Man kann aber die von wheezy oder Ubuntu trusty verwenden.

Die für Debian wheezy angebotene Softwareversion 9.40 ist schon etwas älter und eignet sich nur für Server bis Gen8. Für Gen9 Server wird mindestens 9.50 benötigt. Hier hilft es, die Paketquellen für Ubuntu trusty einzubinden, wo 9.50 bereits angeboten wird.

Der passende Signing Key kann hier herunter geladen und mit apt-key add <Filename> importiert werden. Anschließend können die Tools installiert werden, z.B.

# aptitude update
# aptitude install hp-health hpacucli

Es stehen folgende Pakete zur Verfügung (siehe auch die Packages Datei des Repositories):

Paket Beschreibung
hp-ams HP Agentless Management Service, ein SNMP Helper nur für Maschinen mit ILO4
hponcfg Konfiguration des ILO (Integrated Lights Out) Moduls
hpacucli CLI (Command Line Utility) zur Konfiguration des SmartArray RAID Controllers (Cheat-Sheet dazu)
cpqacuxe Webbasiertes Konfigurationstool für RAID Arrays (Modul für die SMH (Systems Management Homepage))
hpsmh HP Systems Management Homepage, eine webbasierte Konfigurations- und Monitoring-Oberfläche für einen einzelnen Server
hp-smh-templates Templates für die SMH (Systems Management Homepage)
hp-health Hardware Monitoring Daemons und CLI (Command Line Utility) hpasmcli
hp-snmp-agents SNMP (Simple Network Management Protocol) Agents für die Daemons aus dem HP-Health Paket

Zu dem Tool hpacucli gibt es in dem Blog The Geek Stuff einen Artikel 17 hpacucli Command Examples for Linux on HP Servers.

HP Scripting Tools

In einem weiteren Repository stellt HP die Toolsammlung “hp-scripting-tools” bereit. Der Eintrag in der sources.list herzu lautet:

deb http://downloads.linux.hp.com/SDR/downloads/Extras/Debian   squeeze/current  non-free

Um die Toolsammlung zu installieren, werden die ia32-libs benötigt. Für Debian 7.0 (wheezy) amd64 Anwender bedeutet das, dass sie den Multiarch Support für i386 aktivieren müssen:

# dpkg --add-architecture i386
# aptitude update

Anschließend kann die Toolsammlung mit aptitude install hp-scripting-tools installiert werden. Sie enthält folgende Tools:

Tool Beschreibung
hp-conrep Hardware-Beschreibungsskript erstellen oder einspielen
hp-discovery Hardware-Übersicht als XML Datei ausgeben
hp-ev Hardware-Eigenschaften in Variablen übernehmen
hp-hwquery Einzelne Hardware-Eigenschaften abfragen
hp-ifhw Hardware-Informationen aus XML Datei extrahieren
hp-lo100cfg Lights Out Konfiurationstool
hp-rbsureset BIOS auf Factory Default zurücksetzen
hp-rcu Hardware Konfigurationsskript erstellen
hp-reboot Hardrare-Reboot durchführen, kann auch das Bootdevice festlegen
hp-setbootorder Bootreihenfolge festlegen
hp-statemgr Hardware-Zustandsinformation persistent speichern

Für Debian 7 (wheezy) steht derzeit kein Repository zur Verfügung. Es kann aber das Repository von squeeze eingebunden werden. Einige der Tools laufen nicht unter Debian 7. Der Grund ist, dass sie eine Abfrage der Kernelversion machen und nicht damit zurecht kommen, dass die Version 3.x lautet. Mit Hilfe eines vorangestellten linux32 --uname-2.6 funktionieren die Tools.

Tools aus weiteren Quellen

check_hpasm ist ein zu Nagios kompatibles Skript zur Überwachung eines HP Proliant Servers. Es wird zusammen mit dem Paket hp-health aus den HP Repositories eingesetzt und überwacht die CPUs, RAM Module, Netzteile und Lüfter. check_hpasm ist ab Debian GNU/Linux 7.0 (Wheezy) im Paket nagios-plugins-contrib verfügbar. Bei früheren Debian-Versionen muss es noch von Hand heruntergeladen und installiert werden.

ADU Report erstellen

Bei Hardwareproblemen von Festplatten oder RAID Controllern in HP Servern kann es sein, dass der HP Support einen ADU (Array Diagnostic Utility)-Report anfordert. Daraus gehen Statusinformationen des I/O Subsystems hervor, z.B. frühere Fehler oder Firmware-Versionsinformationen. Der Report wird mit folgendem Kommando erstellt:

# Debian 6
hpacucli controller slot=0 diag file=hpacucli_diag.txt

# Debian 7 (mit gefakter Kernelversion)
linux32 --uname-2.6 hpacucli controller slot=0 diag file=hpacucli_diag.txt