Teil 2: Einrichtung SNMP Monitoring auf grafandb LXC Container

Installiere Telegraf

Über SSH oder auf der Console folgenden Befehl ausführen.

Code
  1. apt-get install telegraf


telegraf.conf anpassen


section → [[outputs.influxdb]]

Code
  1. urls = ["http://127.0.0.1:8086"] # required
  2. database = "snmpdb" # required
  3. username = "admin"
  4. password = "admin"

section [[inputs.snmp]] (Vorsicht ist mit '#' standardmäßig auskommentiert '#' an Anfang der Sectionszeile entfernen. Diese wird somit aktiviert.

Die folgenden Zeilen sind teilweise vorhanden und müssen ggf. ebenfalls “enthashed” werden.


für Messungen im Kurzintervall von 60 Sekunden.


Code
  1. [[inputs.snmp]] agents = ["<hostname oder IP-Adresse zur QNAP>:161","<weitere SNMP fähige Geräte>:161" ] timeout = "30s" interval = "60s" retries = 3 version = 2 community = "public" max_repetitions = 10

nach diesem Block können unterhalb dieser Änderungen die folgenden Sections hinzugefügt werden. Am einfachsten Copy&Paste


für Messungen im Langintervall von 15 Minuten.


Es gibt bei QNAP offenbar einige SNMP Objects deren Abfrage im Hintergrund relativ aufwändig ist. Hier macht es keinen Sinn diese minütlich abzufragen, da dass nur unnötig viel Last am System verursacht.

Hier wird einfach in der Telegraf ein weiterer Block angelegt (inputs.snmp). Hier jedoch mit leicht abgeänderter Konfiguration des Intervalls. Alle weiteren inputs.snmp… nach diesem Konfigblock laufen nun mit dieser Konfiguration nur noch alle zB.: 15 Minuten.

Code
  1. [[inputs.snmp]] agents = ["<hostname oder IP-Adresse zur QNAP>:161","<weitere SNMP fähige Geräte>:161"]
  2. # ## Timeout for each SNMP query. timeout = "30s" interval = "15m"
  3. # ## Number of retries to attempt within timeout. retries = 3
  4. # ## SNMP version, values can be 1, 2, or 3 version = 2
  5. #
  6. # ## SNMP community string. community = "public"
  7. #
  8. # ## The GETBULK max-repetitions parameter max_repetitions = 10

Hier fügen wir nun die aufwändigen Tables ein. Die Abfrage dieser Daten kann schon mal gerne 10-20 Sekunden dauern.



Testen der Telegraf Config.



Nach Speicherung der telegraf.conf kommt es beim Service Restart gerne vor, dass sich irgendwo ein Tippfehler eingeschlichen hat und man wundert sich darüber, dass gar keine Metriken mehr in der DB ankommen.

Mit dem Befehl

Code
  1. telegraf --test

auf der bash des LXC Containers wo der Telegraf läuft kann man den Output direkt im Terminal ausgeben lassen und man sieht auch eventuelle Syntax Fehler.

Im optimal Fall sieht es aber wie folgt aus.