Le stockage était autrefois un exercice assez linéaire. Plus de données signifiait plus de stockage. Cette logique ne fonctionne plus. Non pas parce que les données croissent moins vite — bien au contraire — mais parce que le goulot d’étranglement s’est déplacé.
Aujourd’hui, lorsqu’on examine un environnement de stockage, ce n’est que rarement la capacité qui pose problème en premier lieu. Ce sont les performances, la disponibilité et surtout la flexibilité qui font la différence. Les données ne doivent pas seulement être stockées, mais aussi immédiatement immédiatement disponibles, facilement déplaçables et analysables.
Parallèlement, la pression sur l’efficacité augmente. Les volumes de données croissent de manière exponentielle, tandis que les budgets ne suivent pas. La réduction des données n’est donc plus une optimisation, mais une nécessité. La compression et la déduplication sont désormais des standards. C’est dans leur mise en œuvre que les entreprises peuvent faire la différence.
Dans de nombreux systèmes classiques, ce traitement s’effectue encore via le contrôleur. Cela fonctionne… jusqu’à ce que cela devienne problématique. Car plus on cherche à optimiser, plus on surcharge ce même contrôleur. Et cela se traduit inévitablement par une perte de performances.
IBM réinvente la réduction des données
On constate donc que les fournisseurs adaptent leur architecture, et IBM en est un bon exemple. En rapprochant la réduction des données au plus près des données elles-mêmes — directement dans les disques — ce goulot d’étranglement central disparaît en grande partie.
La différence aujourd’hui réside dans le fait que non seulement la compression, mais aussi la déduplication sont intégrées dans leurs modules FlashCore. La réduction des données ne passe donc plus principalement par le contrôleur, mais directement par le matériel. La compression est réalisée à la volée, sans impact perceptible sur les performances, et la déduplication fonctionne largement en arrière-plan. Elle utilise très peu de ressources du contrôleur, contrairement à ce que l’on observe souvent dans les architectures classiques. Le traitement est désormais réparti sur les disques, au lieu d’être centralisé dans un seul composant.
Un taux de réduction de 6 pour 1
Ce qui est remarquable, c’est que cette combinaison atteint aujourd’hui un niveau difficile à atteindre auparavant. La compression se situe généralement autour d’un facteur trois, et la déduplication peut apporter un gain équivalent. En pratique, on obtient ainsi une réduction de données d’environ six pour un. Sur un IBM FlashSystem moyen, équipé de modules FlashCore de cinquième génération d’environ six téraoctets, cette approche combinée permet d’atteindre effectivement près de 30 téraoctets de données exploitables.
Une telle densité n’était auparavant possible qu’au prix de compromis clairs en matière de performances ou de complexité. Aujourd’hui, elle est atteinte sans impact perceptible sur la vitesse, précisément parce que le traitement est intégré directement dans le matériel. Les systèmes restent stables, même lorsqu’ils sont utilisés de manière plus efficace.
La haute disponibilité redéfinit l’architecture
Ce même changement se retrouve dans la manière dont le stockage est conçu. Là où un seul système entièrement répliqué était la norme, l’approche évolue vers plusieurs systèmes plus petits qui collaborent entre eux. Finis les monolithes : place à une architecture distribuée.
Des concepts tels que l’architecture FlashSystem Grid d’IBM concrétisent cette approche. On ajoute de la capacité en intégrant des nœuds de stockage supplémentaires (par exemple des systèmes IBM FlashSystem additionnels), ce qui apporte automatiquement plus de performances. La croissance ne se fait donc pas uniquement en volume, mais aussi en capacité de traitement. Cela permet plus de répartition, plus de flexibilité, mais aussi une meilleure capacité à absorber les pics de charge — avec un effet positif sur la disponibilité.
Le stockage ne concerne plus (seulement) les données
Aujourd’hui, le stockage est fondamentalement différent de ce qu’il était il y a quelques années. Pas nécessairement plus grand, mais plus intelligent. Pas plus centralisé, mais plus distribué.
Cela change aussi les questions à se poser. Ce n’est plus : de combien de stockage ai-je besoin ? Mais : que dois-je attendre de mes données ? Peuvent-elles absorber des pics sans ralentissement ? Peuvent-elles être déplacées sans interruption ? Peuvent-elles être analysées sans copies supplémentaires ni processus complexes ?
Ce ne sont plus uniquement des questions pour les applications. Les réponses se trouvent de plus en plus dans le stockage lui-même. Et c’est précisément pour cette raison que le stockage n’est plus un simple investissement technique, mais un choix stratégique. La manière dont vous construisez votre stockage détermine non seulement où se trouvent vos données, mais aussi la rapidité avec laquelle vous pouvez les exploiter, la flexibilité de votre organisation et votre capacité à faire face au changement.