homelab

Stack de supervision complète : Zabbix, Prometheus, Grafana et Loki

Stack de supervision en LXC : Zabbix 7.0.26 (SNMP), Prometheus 3.5.3, Grafana 13.0.1, Loki 3.6.7 et Grafana Alloy 1.16.1 pour la collecte des logs.

Contexte

Pour exploiter et maintenir le homelab de manière professionnelle, j’ai déployé une stack de supervision complète en LXC Debian 12 sur Proxmox. L’objectif : visibilité totale sur les équipements réseau, les hyperviseurs et les applications, avec centralisation des logs — comparable à un environnement de production.

Architecture de supervision

Équipements réseau (SNMP) ──→ Zabbix 7.0.26 (LXC 105) ──→ Dashboards / alertes
MariaDB (LXC 104) ──────────→ Backend DB Zabbix
Hyperviseurs PVE-01/02 ──────→ node_exporter :9100   ──→ Prometheus 3.5.3 (LXC 106)
                         └───→ pve_exporter :9221    ──→        ↓
Endpoints HTTP/TCP/ICMP ─────→ blackbox_exporter :9115 ─→  Grafana 13.0.1 (LXC 108)
Logs journald PVE-01/02 ─────→ Grafana Alloy 1.16.1  ──→ Loki 3.6.7 (LXC 107) ──→ Grafana
Baie VEVOR 12U — Dell PowerEdge R720 (PVE-01) et HP ProDesk 600 G2 (PVE-02)
PVE-01 (Dell PowerEdge R720, 386 GB RAM) et PVE-02 (HP ProDesk 600 G2, 32 GB RAM) — les LXC Zabbix, Prometheus, Grafana, Loki et Alloy tournent sur ces deux hyperviseurs.

LXC dédiés (VLAN 10 MGMT)

LXCCTIDVLANServiceVersion
lxc-mariadb-01104VLAN 10 MGMTBase de données ZabbixMariaDB
lxc-zabbix-01105VLAN 10 MGMTZabbix Server + Frontend7.0.26
lxc-prometheus-01106VLAN 10 MGMTPrometheus3.5.3 LTS
lxc-loki-01107VLAN 10 MGMTLoki3.6.7
lxc-grafana-01108VLAN 10 MGMTGrafana13.0.1

Ce que j’ai fait

Zabbix 7.0.26 — supervision réseau SNMP

Zabbix Global View — 31 hosts, problems by severity, top CPU hosts
Zabbix 7.0.26 — Global View : 31 hôtes supervisés, 355 templates, 2752 items actifs. Section « Problems by severity » et top hosts CPU en temps réel.

Prometheus 3.5.3 — métriques hyperviseurs et services

Grafana 13.0.1 — visualisation unifiée

Dashboard Grafana SNMP — Cisco 3560-CX, D-Link DGS et pfSense : CPU, mémoire, trafic interfaces
Grafana — Dashboard Réseau SNMP : CPU 22%, mémoire 40%, trafic interfaces (WAN, MGMT, SERVERS) sur le Cisco 3560-CX, D-Link DGS-1210-08P et pfSense.
Dashboard Grafana Proxmox — Resource allocation : 12 LXC running, CPU 0.32%, RAM 13.2/31.2 GiB
Grafana — Dashboard Proxmox PVE-02 : 12 LXC actifs (npm, adguard, unifi, zabbix, prometheus, loki, grafana…), CPU global 0.32%, mémoire 13.2 GiB / 31.2 GiB.

Loki 3.6.7 + Grafana Alloy 1.16.1 — centralisation des logs

Compétences mobilisées

Ce projet couvre l’exploitation et la supervision d’infrastructure (B2.4), la gestion du patrimoine informatique via l’inventaire automatisé Zabbix (B1.1), la garantie de disponibilité et d’intégrité via les logs centralisés (B3.4) et la détection d’anomalies réseau via les blackbox probes Prometheus (B3.5).