Les dark data représentent l’ensemble des informations collectées, traitées et stockées par les entreprises. Ces données proviennent de sources qui génèrent des données de manière automatique, sans toutefois être réutilisées. Elles sont pour la plupart incomplètes et sont alors oubliées par les entreprises (mais stockées)
Il peut s’agir notamment de documents papiers scannés, des photos, des vidéos ou encore des informations négligées car elles ne semblent pas être importantes à première vue.
Qu’est-ce que le dark data ?
Le dark data est l’ensemble des données inutilisées, inconnues et inexploitées d’une entreprise, générées par les interactions quotidiennes des utilisateurs. Générées également à cause d’innombrables machines et systèmes de données en passant par les données non structurées dérivées des réseaux sociaux.
Ces données peuvent être considérées comme trop vieilles pour avoir de la valeur, partielles, répétitives ou être sous un format inaccessible avec les outils à disposition. Bien souvent, leur existence n’est même pas connue. Néanmoins, le dark data peut être aussi une ressource inexploitée importante d’une entreprise.
En outre, ces données ne peuvent être protégées. Elles sont non classées dans le système d’informations et peuvent être victime de cyber attaques. D’ailleurs, la loi impose aux entreprises de supprimer certaines données. Ce principe de conservation limitée des données est prévu par la RGPD et la loi Informatique et Libertés.
Dans l’ensemble, le dark data représente environ 55% des données stockées dans le monde. Pour une entreprise, cela peut représenter des millions voir des milliards de fichiers. Dans le monde, les entreprises travaillent pour réduire les émissions carbone du numérique, mais souvent, elles ne prennent pas en compte celle de la dark data.
Quel est l’impact carbone du dark data ?
Les données du dark data ont un poids écologique très important, qui inclut non seulement des couches énormes de data mais aussi une grande consommation énergétique.
En effet, même les données non utilisées nécessitent également d’être stockées. Les données du dark data occupent de l’espace sur des serveurs et l’impact environnemental des data centers est important car ils consomment beaucoup d’électricité et ont besoin d’être refroidis 24h/24 et 7j/7.
Selon une étude de Veritas, les données stockées et jamais utilisées sont responsables de l’émission de 6,4 millions de tonnes de CO2 en 2020. C’est l’équivalent de l’empreinte carbone d’une voiture parcourant 575 000 fois le tour de la Terre, chaque année !!
Comment réduire l’impact du dark data ?
Au sein d’une entreprise, on peut réduire voire supprimer les dark data. On peut commencer par la formation des équipes à cette problématique en instaurant une politique de gestion des données.
Afin de réduire plus efficacement l’impact du dark data, vous pouvez également suivre les conseils suivant de Veritas :
Identifier tous les lieux de stockage :
Découvrir et cartographier les données. Ce sont les premières étapes pour comprendre l’acheminement des données au sein d’une entreprise. Gagner en visibilité sur les centres de stockages des données, leur accès et sur leur durée de stockage est une première base clé pour gérer les dark data.
Mettre en lumière le dark data :
Adopter une démarche proactive de Data Management. Elle permet aux entreprises de gagner en visibilité sur les données, leur stockage et leur infrastructure de sauvegarde. Leur permettant ainsi d’apprécier les risques liés aux données et de prendre des décisions éclairées quant à la suppression de certaines données.
Automatiser le processus de découverte et d’analyse des données :
Les entreprises devraient automatiser les analyses, le suivi et le reporting de leurs données. Par conséquent, leur approche relative à la visibilité des données doit donc intégrer des solutions d’archivage, de sauvegarde et de sécurité. Afin de prévenir la perte de données et garantir que leur stockage soit en adéquation avec les politiques en place.
Minimiser et contrôler les données :
Minimiser la data et la limitation de leur utilisation. Cela permet aux entreprises de réduire la quantité de données stockées et de s’assurer que celle-ci sont conservées pour répondre à l’objectif initial de collecte. Cette démarche permet en outre de réduire l’utilisation du stockage de données et donc de réduire l’empreinte carbone du numérique.
S’assurer du respect continu des normes de conformité :
Les règles de conformité comme celles de la RGPD imposent à toutes les entreprises de reporter certains types de violation des données à l’autorité de contrôle et dans certains cas, aux personnes concernées. Les entreprises doivent évaluer leur capacité à repérer les éventuelles brèches et déclencher rapidement des procédures de signalement pour garantir leur conformité.
Conclusion
Selon une étude de Veritas, le dark data représenterait 52% des données stockées par les entreprise et les organisations. Le volume de données mondiales stockées atteignait 33 zettaoctet en 2018, et atteindra 175 zettaoctet en 2025, dont 91 zettaoctet de dark datas.
Les 6,4 millions de tonnes de CO2 générées par le stockage de ces données correspondent aux émissions d’un pays tel que la Côte D’Ivoire.
Les entreprises doivent alors comprendre les données de la dark data, ainsi que les politiques de stockage qui les entourent afin d’éviter de générer davantage d’émissions de carbone. On se pose alors encore la question de l’utilité de certains traitements de données. Les démarches de la sobriété numérique et du numérique responsable nous poussent à nous poser la question de l’utilité des services de l’IT. Est-ce que le développement de l’IA pourrait aider le secteur de la donnée et ainsi réduire drastiquement ses émissions carbone ?
Même si Greenoco n’intervient pas sur le dark data, notre solution de réduction d’empreinte carbone des sites web permet de réduire l’espace disque utilisé par un site web, et également de ses sauvegardes. En ce sens, Greenoco permet de réduire le stockage de données inutiles et contribue à réduire la pollution numérique.