Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

Modèle de données b291

FastCDC découpe, BLAKE3 nomme, un Merkle DAG relie. La déduplication structurelle en tombe gratuitement.

FastCDC découpe chaque fichier en chunks de taille variable, déterminés par le contenu — robuste aux insertions, là où des blocs de taille fixe décaleraient tout après le moindre octet ajouté. BLAKE3 donne à chaque chunk son adresse de contenu.

À partir de là, tout se compose :

  • un fichier devient un manifeste — la liste des hashes de ses chunks ;
  • un gros fichier devient un arbre de manifestes, pour éviter des listes à un million d'entrées ;
  • un répertoire est une liste nom → hash ;
  • un snapshot est une racine qui pointe vers le répertoire de tête, plus des métadonnées.

L’ensemble forme un Merkle DAG. La dédup structurelle est automatique pour tout ce qui est pur contenu : deux snapshots qui partagent des fichiers partagent leurs chunks et leurs manifestes — comme Git. Les répertoires et racines, qui portent noms et dates, sont partagés par référence plutôt que par convergence — le pourquoi et le comment sont détaillés à la page Construction des manifestes & Merkle DAG.