Par Laurent Dedenis, Executive Vice President EMEA, Acronis
… C’est ainsi qu’un grand nombre de PME dépensent aujourd’hui encore beaucoup trop d’argent pour le stockage de leurs données, alors qu’il existe un nombre considérable de manières d’éviter cela. Une des méthodes les plus efficaces pour réduire les coûts de stockage est la déduplication de données, une technique de consolidation des données qui identifie les grands blocs de données superflues (4KB et plus) afin de faire en sorte qu’il n’y ait pas d’espace de stockage précieux occupé par des copies inutiles. Cette technologie a mûri à la vitesse de l’éclair au cours de ces dernières années et n’est donc plus, en raison d’un prix qui serait trop élevé, l’apanage des grandes sociétés. Aujourd’hui, elle est aussi accessible pour les petites et moyennes entreprises ! En effet, alors que la déduplication avait, auparavant, traditionnellement lieu au niveau du hardware, ce qui la rendait inaccessible pour les PME, cette précieuse technologie est désormais disponible aussi sous forme d’un logiciel avantageux, intégré dans les solutions de sauvegarde et de restauration.
L’avantage de cette application au retour sur investissement rapide, d’ores et déjà devenue très populaire, est qu’elle permet aux entreprises d’économiser de l’espace disque – et par conséquent aussi la gestion qui l’accompagne – mais aussi d’améliorer les performances des systèmes de stockage et de réduire les temps de sauvegarde. Si l’on tient compte du fait que – selon une étude d’IDC – la quantité de données digitales créées et stockées par les entreprises à travers le monde a connu une croissance de 3000 % durant ces trois dernières années et que la technique de déduplication des données peut potentiellement réduire de 90% le stockage des données, on ne peut qu’en conclure que les conséquences sont énormes. Un point positif supplémentaire est que, dans le même temps, les entreprises consomment moins de courant, doivent moins refroidir et ont besoin de moins d’appareils, ce qui réduit sensiblement leurs émissions de CO2 et leur empreinte écologique.
L’important dans la recherche d’une solution efficace de déduplication est de s’assurer que la déduplication peut s’effectuer aussi bien à la source qu’à l’emplacement cible. Tous les logiciels ne permettent visiblement pas de le faire et chacune de ces deux alternatives a ses avantages et ses inconvénients. La déduplication à la source est indiquée dans des situations où la limite de stockage du réseau est quasiment atteinte ou lorsque des sauvegardes sont effectuées par des filiales avec un réseau dont la bande passante est limitée. Dans ce cas, les sauvegardes peuvent prendre plus de temps et mobiliser un grand nombre de cycles CPU, avec à la clé d’éventuels problèmes de performances sur des ordinateurs de production. La déduplication à l’emplacement cible permet, quant à elle, d’effectuer plus rapidement la sauvegarde initiale, en évitant des tâches de dédoublement qui demandent beaucoup de CPU sur le CPU-source. Mais étant donné que toutes les copies qui se retrouvent en circulation dans le cadre du processus de déduplication sont transportées via le réseau, ce processus peut parfois aboutir à un “bottleneck”, dans la mesure où les données non-dédoublées peuvent potentiellement ralentir le transfert.
Aujourd’hui, il est certainement crucial pour les PME d’investir dans les TIC pour optimaliser leurs processus afin qu’elles puissent continuer à renforcer leur position sur le marché. Une bonne gestion doit être vue comme une chaîne dont chaque maillon occupe une place essentielle: celui qui parvient à faire des économies sur ses processus opérationnels grâce à la technologie sans pour autant perdre en efficacité, bénéficie de plus de marge de manœuvre pour se concentrer pleinement sur la stratégie d’entreprise. Pour les grandes entreprises, ceci est connu depuis longtemps. Mais les PME aussi sont de plus en plus nombreuses à le comprendre.
Comment fonctionne la déduplication de données ?
La déduplication de données utilise un ‘pointeur’ pour désigner les blocs de données originels afin que les données ne doivent pas, à chaque utilisation, être stockées à nouveau. En bref, la déduplication de données met un terme à l’existence de plusieurs copies des mêmes données en recherchant les fichiers ou les blocs de données identiques et en faisant en sorte que seul un exemplaire soit stocké.
Lorsque la déduplication a lieu à la source, les données répliquées sont éliminées lors du processus de sauvegarde avant même d’être envoyées vers l’emplacement de stockage. Lorsque la déduplication s’effectue à l’emplacement cible, les données répliquées sont éliminées lors du processus de sauvegarde au moment où elles atteignent l’emplacement de stockage.