Proxmox VE Avancé : Clustering, Haute Disponibilité & Reprise d'Activité
Formation présentielle
4 jours (28 heures)

Proxmox VE Avancé : Clustering, Haute Disponibilité & Reprise d'Activité

Maîtrisez le clustering avancé Proxmox VE avec la haute disponibilité, le stockage hyperconvergé Ceph, le SDN avec VLAN/VXLAN, et les stratégies de reprise d'activité d'entreprise. Formation pratique de 4 jours pour des déploiements de production.

Objectifs de la formation

À l'issue de cette formation, vous serez capable de :

  • Concevoir et déployer des clusters Proxmox VE de production avec 3 nœuds ou plus
  • Implémenter la haute disponibilité (HA) pour le basculement automatique et les opérations sans interruption
  • Configurer le stockage Ceph pour une infrastructure hyperconvergée avec RBD et CephFS
  • Maîtriser le Software-Defined Networking avec les configurations VLAN, VXLAN et EVPN
  • Construire des stratégies de reprise d'activité avec Proxmox Backup Server et la restauration à chaud
  • Automatiser les opérations du cluster en utilisant l'API REST et les outils en ligne de commande
  • Dépanner des scénarios complexes incluant split-brain, défaillances de stockage et problèmes réseau
  • Optimiser les performances pour les charges de travail de production et l'allocation des ressources
  • Implémenter les bonnes pratiques de sécurité pour les environnements en cluster
  • Planifier la capacité et l'évolutivité pour les besoins croissants d'infrastructure

Public concerné

Cette formation s'adresse aux :

Administrateurs Système Senior

Professionnels expérimentés gérant des environnements de virtualisation de production nécessitant d'implémenter des solutions de haute disponibilité et de reprise d'activité

Architectes Infrastructure

Responsables de la conception de solutions d'infrastructure résilientes et évolutives utilisant des technologies open source comme alternatives à VMware ou Hyper-V

Ingénieurs DevOps

Cherchant à automatiser le déploiement et la gestion de l'infrastructure avec des approches pilotées par API et l'Infrastructure as Code

Ingénieurs Cloud

Construisant des solutions cloud privées ou hybrides avec des exigences de disponibilité et de performance de niveau entreprise

Responsables IT

Décideurs techniques évaluant Proxmox VE pour des charges de travail critiques et des stratégies d'optimisation des coûts

Professionnels MSP

Fournisseurs de services managés implémentant une infrastructure multi-tenant avec des exigences avancées de réseau et d'isolation

Cette formation avancée est particulièrement pertinente pour les organisations en Afrique francophone recherchant des alternatives souveraines et économiques aux solutions de virtualisation propriétaires.

Prérequis

Prérequis techniques

Obligatoires

  • Expérience Proxmox VE : Minimum 6 mois de gestion de Proxmox VE en production ou suivi de la formation "Fondamentaux Proxmox VE"
  • Administration Linux : Compétences avancées en ligne de commande, systemd, réseau et gestion du stockage
  • Expertise réseau : Compréhension approfondie des VLANs, routage, commutation et pile TCP/IP
  • Connaissances en virtualisation : Expérience avec KVM, concepts de stockage et gestion des ressources
  • Scripting de base : Capacités en scripting Bash pour les tâches d'automatisation

Exigences de l'environnement de laboratoire

Chaque participant doit avoir accès à un environnement de laboratoire avec :

  • Minimum 3 serveurs physiques ou capacité de virtualisation imbriquée
  • 64 Go de RAM au total sur tous les nœuds (minimum 16 Go par nœud)
  • 500 Go d'espace de stockage pour les OSD Ceph et le stockage VM
  • Réseau dédié pour la communication du cluster (10 Gbps recommandé)
  • Accès Internet pour les mises à jour de paquets et la documentation

Programme détaillé

Programme détaillé de la formation

Jour 1 : Architecture de clustering avancée

Module 1 : Approfondissement du cluster Proxmox VE (4h)

  • Revue de l'architecture du cluster et composants
    • Moteur de cluster Corosync et communication
    • Fonctionnement interne du Proxmox Cluster File System (pmxcfs)
    • Concepts de quorum et prévention du split-brain
  • Réseau de cluster avancé
    • Liens de communication de cluster redondants
    • Exigences de latence réseau et optimisation
    • Configuration Multicast vs Unicast
  • Évolutivité et limites du cluster
    • Considérations sur le nombre de nœuds (testé jusqu'à 50 nœuds)
    • Implications de performance de la taille du cluster
    • Possibilités de clustering géographique
  • Gestion avancée du cluster
    • Procédures d'ajout et de suppression de nœuds
    • Récupération du cluster après divers scénarios de défaillance
    • Sauvegarde et restauration de la configuration du cluster
Travaux pratiques :

Construire un cluster à 3 nœuds avec des liens corosync redondants, simuler des défaillances réseau et pratiquer les procédures de récupération du cluster

Module 2 : Implémentation de la haute disponibilité (HA) (3h)

  • Architecture et composants HA
    • Fonctionnement interne du HA Manager (ha-manager)
    • Local Resource Manager (LRM) et Cluster Resource Manager (CRM)
    • Mécanismes de fencing et timers watchdog
  • Configuration et politiques HA
    • États des ressources et machines à états
    • Groupes HA et priorités de migration
    • Politiques HA personnalisées et contraintes
  • Détection et récupération des défaillances
    • Scénarios de défaillance de nœud et récupération automatique
    • Gestion des partitions réseau
    • Impact des défaillances de stockage sur la HA
  • Bonnes pratiques HA
    • Exigences matérielles pour une HA fiable
    • Test des scénarios de basculement HA
    • Mode maintenance et migrations planifiées
Travaux pratiques :

Configurer la HA pour les VMs critiques, tester divers scénarios de défaillance, implémenter des politiques HA personnalisées

Jour 2 : Stockage hyperconvergé Ceph

Module 3 : Architecture de stockage Ceph (4h)

  • Fondamentaux Ceph pour Proxmox VE
    • Architecture RADOS et stockage objet
    • Moniteurs, gestionnaires et OSD Ceph
    • CRUSH map et placement des données
  • Déploiement de Ceph sur Proxmox VE
    • Exigences et recommandations matérielles
    • Conception réseau pour Ceph (réseaux public/cluster)
    • Stratégies de déploiement OSD (BlueStore)
  • Pools Ceph et optimisation des performances
    • Création de pools et facteurs de réplication
    • Codage par effacement pour l'efficacité spatiale
    • Techniques d'optimisation des performances
    • QoS et limitations de bande passante
  • Ceph RBD pour le stockage VM
    • Fonctionnalités d'image RBD et snapshots
    • Migration à chaud avec stockage Ceph
    • Provisionnement fin et récupération d'espace
Travaux pratiques :

Déployer un cluster Ceph à 3 nœuds, créer des pools avec différentes stratégies de réplication, évaluer les performances

Module 4 : Fonctionnalités avancées de Ceph (3h)

  • CephFS pour le stockage partagé
    • Déploiement MDS et haute disponibilité
    • Volumes et sous-volumes CephFS
    • Contrôle d'accès et quotas
  • Maintenance et opérations Ceph
    • Ajout et suppression sécurisés d'OSD
    • Mise à niveau de Ceph tout en maintenant le service
    • Gestion des états dégradés et récupération
  • Surveillance et dépannage
    • Surveillance de la santé Ceph et alertes
    • Métriques de performance et identification des goulots d'étranglement
    • Problèmes courants et stratégies de résolution
  • Reprise d'activité avec Ceph
    • Mise en miroir RBD pour la réplication de site
    • Stratégies de gestion des snapshots
    • Récupération après des défaillances catastrophiques
Travaux pratiques :

Configurer CephFS, simuler des défaillances OSD, pratiquer les procédures de récupération, implémenter la surveillance

Jour 3 : Software-Defined Networking et fonctionnalités avancées

Module 5 : Implémentation SDN (4h)

  • Architecture SDN dans Proxmox VE
    • Zones SDN : Simple, VLAN, QinQ, VXLAN, EVPN
    • Contrôleurs et réseaux de transport
    • Gestion des VNets et sous-réseaux
  • Implémentation VLAN et QinQ
    • Ponts VLAN-aware et étiquetage
    • QinQ pour les scénarios de fournisseur de services
    • Stratégies de routage inter-VLAN
  • Réseaux overlay VXLAN
    • Concepts VXLAN et encapsulation
    • VXLAN Multicast vs Unicast
    • Considérations MTU et optimisation
    • Impact sur les performances et décharge matérielle
  • Réseau avancé EVPN-BGP
    • Configuration BGP pour EVPN
    • Connectivité multi-sites
    • Passerelles anycast et routage distribué
    • Nœuds de sortie et configuration SNAT
Travaux pratiques :

Implémenter l'isolation multi-tenant avec VXLAN, configurer EVPN pour le réseau distribué, tester la connectivité inter-sites

Module 6 : Réplication de stockage et migration (3h)

  • Framework de réplication ZFS
    • Tâches de réplication planifiées
    • Limitations de bande passante et planification
    • Procédures de basculement et retour
  • Stratégies de migration inter-clusters
    • Techniques de migration en ligne
    • Migration de stockage entre différents backends
    • Minimiser les temps d'arrêt pendant les migrations
  • Intégration de la sauvegarde
    • Options avancées vzdump
    • Optimisation des performances de sauvegarde
    • Coordination des snapshots avec les applications
Travaux pratiques :

Configurer la réplication ZFS, effectuer des migrations à chaud entre types de stockage, optimiser les fenêtres de sauvegarde

Jour 4 : Reprise d'activité et automatisation

Module 7 : Implémentation de la reprise d'activité (4h)

  • Intégration Proxmox Backup Server
    • Architecture PBS et déduplication
    • Stratégies de sauvegarde incrémentale
    • Chiffrement et considérations de sécurité
  • Planification de la reprise d'activité
    • Définitions RTO et RPO
    • Stratégies de sauvegarde multi-sites
    • Procédures de basculement automatisées
  • Capacités de restauration à chaud
    • Récupération instantanée de VM depuis la sauvegarde
    • Options de récupération au niveau fichier
    • Test des procédures de DR sans impact
  • Reprise d'activité du cluster
    • Stratégies de sauvegarde complète du cluster
    • Récupération après perte totale du cluster
    • Sauvegarde et restauration de configuration
    • Procédures de reprise d'activité Ceph
Travaux pratiques :

Déployer PBS, implémenter des workflows DR automatisés, simuler des scénarios de catastrophe et récupération

Module 8 : Automatisation et surveillance (3h)

  • Automatisation par API REST
    • Authentification API et jetons
    • Scénarios d'automatisation courants
    • Scripts Python et pvesh
  • Intégration Ansible
    • Modules Ansible Proxmox
    • Workflows de déploiement automatisés
    • Gestion de configuration
  • Surveillance et alertes
    • Collecte de métriques avec InfluxDB
    • Tableaux de bord Grafana pour Proxmox
    • Configuration des alertes et escalade
  • Méthodologie de dépannage
    • Analyse et corrélation des logs
    • Identification des goulots d'étranglement de performance
    • Problèmes courants et solutions
Projet final :

Construire un pipeline de déploiement automatisé, implémenter une surveillance complète, créer des runbooks pour les scénarios courants

Certification et évaluation

  • Évaluation pratique : Déployer et dépanner une application multi-tiers complexe
  • Examen écrit couvrant tous les sujets avancés
  • Certificat ECINTELLIGENCE Clustering Avancé après réussite
  • Guides de laboratoire complets et scripts d'automatisation à emporter
  • Accès de 90 jours à l'environnement de laboratoire cloud pour la pratique
  • Guide de préparation pour les parcours de certification professionnelle Proxmox VE

Certification

À l'issue de cette formation, vous recevrez une attestation de participation délivrée par ECINTELLIGENCE.

1850 EUR

par participant

Durée

4 jours (28 heures)

Modalité

Formation présentielle

Prochaine session

Sur demande

Demander un devis

Autres formations qui pourraient vous intéresser

Prêt à développer vos compétences ?

Rejoignez des centaines de professionnels qui ont fait confiance à ECINTELLIGENCE pour leur montée en compétences.

Voir toutes nos formations

Nathan

Assistant virtuel ECINTELLIGENCE