*/ Contexte ----------- - Institut Jacques Monod laboratoire public de recherche fondamentale en biologie 250 personnes - 450 ordinateurs individuels de toutes marques et tous systèmes Windows/MacOS/Linux une dizaine de serveurs de virtualisation et de calcul (principalement Linux) l'Institut dépend du CNRS et de l'Université Paris-Cité et est basé dans PARIS 13ème - Après 7 ans, mi-juillet, ce sera la fin de vie d'un stockage de stockage constitué de 2 baies SAN Dell Compellent 4020 + 2 tetes NAS Dell FluidFS8600 ainsi organisé 1 système de production + 1 système de réplication (1 fois par jour) avec snapshots activés utilisés - sous forme d'une bonne cinquantaine de shares SMBv2 - environ 300 To de données - 30 millions de fichiers - accès régis par un Active-Directory dédié - Les données sont des données purement scientifiques (pas de bureautique) et clairement peu tièdes, voire froides : - les 250 scientifiques écrivent dessus - mais relisent peu - modifient sans doute presque jamais - Les accès sont surtout faits par des humains depuis Windows/MacOS/Linux via Explorateur/Finder/Gestionnaire de fichiers, et un peu par des programmes de traitement, visiblement pas du tout "I/O bound" - Choix du matériel pour remplacer cela déjà effectué : 4 HPE Apollo 4200 composés ainsi 2 processeurs de 20 coeurs 16 x 32 Go = 384 Go de mémoire 6 SSD RI de 1 To - 1 carte RAID pour ces 6 SSD 24 HDD SATA 7.2 k de 16 To (14.6 To réel) - 1 carte RAID pour ces 24 HDD 4 x 1 Gb/s + 2 x 10 Gb/s garantie 7 ans NB : les 2 cartes RAID présentent bien les 6 + 24 disques en mode JBOD -> ces 4 serveurs sont reçus depuis un mois et fonctionnels - premiers essais avec ZFS et Samba en cours - Architecture retenue - 2 HPE Apollo 4200 en production, avec chacun portant - la moitié en volume des shares - soit 15 millions de fichiers / 150 To sur chaque machine - 2 HPE Apollo 4200 en réplication, au moins journalière, hébergés à 300 mètres de ceux de production - Le plus gros partage fait 60 To aujourd'hui, mais demain on peut avoir besoin d'un partage de plus de 100 To - Informations sur la taille de mes fichiers Nombre total de fichiers : 24627118 fichiers - 24.6 millions Volume total des fichiers : 273342118409150 octets - 248 To Taille moyenne des fichiers : 11099232 octets - 10 Mo Répartition sur la taille des fichiers : Légende : x == 1 digit à la taille 1 xxxxxxxxxxxxx 34 xxxxxxxxxxxx 3120 xxxxxxxxxxx 34673 xxxxxxxxxx 178077 xxxxxxxxx 1443341 xxxxxxxx 5611261 xxxxxxx 2316837 xxxxxx 4717434 xxxxx 7528598 xxxx 1769732 xxx 800710 xx 223275 x -> 1 fichier de 1029 Go 34 fichiers de 100 à 999 Go .... */ Ma vision des choses ----------------------- - Pas de demande de haute disponibilité et encore moins de H-A, et donc pas d'actif/actif ou des choses dans ce genre -> j'assume la piste de - une moitié des shares sur une seule machine de production - autre moitié des shares sur l'autre machine de production en cas de gros pépin sur une machine de production, une bascule simple via une modification sur le DNS (voir sur les IP utilisées) me suffit. - Je vise une reproduction de l'existant en termes de sécurité des données - snapshot réalisé sur les machines de production et recopiés vers les machines de secours (motivation principale de mon intéret pour zfs, versus xfs qui impliquerait rsync) - ex de fréquencess 1 fois par jour sur 2 semaines 1 fois par semaine sur 3 mois - l'accès direct à ces snapshots depuis l'explorateur Windows n'est pas explicitement recherché (personne en gros ne saurait s'en servir) en plus, j'ai et je vais conserver un rsync hebdomadaire vers des bandes jamais effacées à l'Observatoire de Paris sur le site de Meudon donc je suis bien en "3/2/1", avec - capacité rapide de basculer la production en cas de sinistre majeur (2 prod + 2 replication) - capacité rapide de revenir en arrière (snapshots) - capacité de repartir de 0 en cas de rancongiciels & cie je n'ai donc pas besoin d'un très haut niveau de protection sur chaque machine . */ Ma demande ------------- - 1/ conseil, mise en oeuvre et intégration de TrueNAS dans cet environnement : - gestion du stockage - gestion des shares - couplage avec un OpenLDAP avec schéma Samba (de préférence à Active-Directory) - 2/ contrat de support pour - conseils - accompagnement sur les évolutions - support en cas de difficulté d'exploitation