Le Human Brain Project avait besoin d’une plateforme cloud multi-datacenter pour faire collaborer des neuro-scientifiques à travers l’Europe. 20+ applications, 400+ VMs, 4 datacenters.
J’ai mis en place et maintenu l’ensemble de l’infrastructure durant toute la durée du projet. OpenStack pour le cloud, OpenShift pour les containers Kubernetes, Ansible/AWX pour l’automatisation, GitLab pour le CI/CD, Keycloak pour l’authentification fédérée, Zabbix pour le monitoring, Harbor pour le registry Docker.
La plateforme a globalement très bien fonctionné. Nous avons initialement eu quelques petits soucis de stockage des volumes sur certaines VM (due à une configuration initiale de OpenStack à CSCS avec un backend NFS vers GPFS). Un upgrade de OpenStack avec CEPH a réglé les problèmes.
Un incident de sécurité à CSCS (coupure Internet suite à un problème de sécurité sur les supercalculateurs) nous a obligés à basculer une partie des services chez Exoscale en urgence. Ce qui nous a permis de valider notre architecture de reprise d’activité.