Quel est l’impact carbone du BIG Data ?

3 avril 2023 | Pollution numérique

Le Big Data a bouleversé tous les secteurs de notre économie. Le regroupement d’un volume important de données et la venue d’algorithmes sophistiqués pour les analyser et orienter les prises de décisions, a en effet la capacité de rationaliser presque toutes les industries.

Qu’est-ce que le BIG DATA ?

Le Big Data est composé de données complexes, provenant principalement de nouvelles sources. Ces données sont si volumineuses, que les logiciels de traitement de données traditionnel ne peuvent simplement pas les gérer. Néanmoins ces grands volumes de données peuvent être utilisés pour résoudre des problèmes auxquels vous n’auriez pas su répondre auparavant.

Le Big Data est composé de trois grands “V” : 

Le volume des données 

Une quantité de données astronomiques est générée par les entreprises mais aussi par les particuliers est en constante augmentation. Pour une partie des entreprises, cela peut correspondre à des dizaines de téraoctets de données. Mais pour d’autres, cela peut correspondre à des centaines de pétaoctets. L’unité pour la mesurer est progressivement passée du pétaoctet (10 puissance 15 octets) à l’exaoctet (10puissance18 octets) puis au zettaoctet (10puissance21 octets). Seul le Big Data est capable de traiter un nombre important de données et d’informations.

La vitesse des données

Plus nombreuses, les données sont aussi créées selon des fréquences de plus en plus réduite. Pour ne pas perdre de valeur, elles doivent être collectées et partagées rapidement. Afin de répondre à ces exigences, la puissance de calcul et les outils d’analyse du Big Data permettent d’aboutir vers la notion de temps réel. 

La variété des données 

La variété des données fait référence aux nombreux types de données disponibles. Textes, photos, vidéos, données IOT, fichiers logs, de positionnement GPS, ou encore les réseaux sociaux, les données collectées sont de natures très variées.

Elles nécessitent un pré-traitement complémentaire pour en déduire le sens et prendre en charge les métadonnées. Les outils d’indexation et de traitement du Big Data doivent prendre en compte cette diversité de données structurées et non structurées.

Mais alors qu’en est-il de son empreinte carbone et de son impact environnemental ? Quand on sait que le stockage des données est responsable de 2% de la consommation de l’électricité mondiale, et qu’il est susceptible de générer des émissions à hauteur de 14 % d’ici 2040.

Quelles sont les utilisations du Big Data ?

Le Big Data est utilisé pour de nombreuses raisons. La plus courante est d’extraire des informations et des connaissances à partir de vastes quantités d’informations générées et stockées chaque jour. En appliquant des outils et des techniques d’analyse avancés aux Big Data, nous pouvons découvrir des modèles, des tendances ou encore des corrélations, pouvant informer les décisions commerciales, les recherches scientifiques et les politiques sociales.

Par exemple, dans le monde des affaires, une entreprise peut utiliser le Big Data. Afin analyser le comportement et les préférences de ses clients, optimiser les stratégies marketing et améliorer l’efficacité opérationnelle. 

Dans le domaine de la santé, les analyses du Big Data, peuvent aider à identifier les modèles de maladies, de suivre la propagation des épidémies et de développer des traitements personnalisés.

Utilisation du Big Data dans le domaine scientifique :

Pour le domaine de la recherche scientifique, les données du Big Data sont utilisées pour modéliser des phénomènes complexes, tester des hypothèses et découvrir de nouvelles connaissances.

Le Big Data peut aider à prévoir l’évolution du climat et de la météo en fournissant des données plus précises en temps réel. Les prévisions météorologiques et climatiques sont basées sur des modèles mathématiques complexes. Elles prennent en compte de nombreuses variables telles que la pression atmosphérique, la température, la vitesse et la direction du vent, l’humidité, les précipitations, etc. Plus les données entrantes sont nombreuses et précises, meilleures seront les prévisions. Ce n’est pas forcément bon en termes de sobriété numérique, mais cela permet de faire avancer l’état de la connaissance.

En outre, le big data peut également aider à prédire les effets du changement climatique. En fournissant des données sur les températures, les précipitations et les niveaux de la mer, qui sont utilisés pour développer des modèles de changement climatique à long terme. Cependant, il est important de noter que les prévisions météorologiques et climatiques ne sont pas toujours précises à 100%.

L’utilisation du Big Data par les gouvernements et les organisations :

Il est utilisé pour informer les décisions politiques, surveiller les tendances sociales et soutenir les interventions en cas de catastrophe.

Toutefois, le big data peut être aussi malheureusement utilisé de façon négative. Notamment avec le scandale de Facebook. Le scandale de la fuite de données Facebook-Cambridge Analytica, renvoie aux données personnelles de 87 millions d’utilisateurs de Facebook, que la société Cambridge Analytica (CA) à commencé à exploiter.

Ces informations ont servi à influencer les intentions de vote politiques de certains partis, que la société CA a retenu lors de l’exploitation des données.

Dans l’ensemble, les big data ont le potentiel de transformer de nombreux aspects de notre vie. Mais ils présentent également de nouveaux défis liés à la protection des données, à la sécurité et à l’éthique, et à la pollution numérique. Il est donc important d’utiliser les big data de manière responsable et éthique. Dans le but de garantir que les avantages des informations basées sur les données sont équilibrés par rapport aux risques et aux défis potentiels.

Quel est l’impact carbone du BIG DATA ?

Chaque jour, l’activité du Big data évolue. Derrière ces données, se trouvent, en effet, des infrastructures bien réelles qui ont une consommation énergétique et un impact carbone importants. Le Big Data, c’est environ 2,5 trillions d’octets de données chaque jour. Ces données stockées augmentent 4 fois plus rapidement que l’économie mondiale !

Des infrastructures pharaoniques pour traiter et stocker les données du Big Data.

L’analyse des données émanant des observations de l’environnement (telles que les données météorologiques par exemple), des expériences scientifiques ou encore les données marketing, nécessite également des moyens de calcul très importants. Elles sont cependant concentrés dans des grands centres et des super calculateurs.

En phase d’utilisation, les éléments essentiels du Big Data sont répartis en trois catégories :  les équipements terminaux, les réseaux et les centres de données. Ces éléments consomment chacun une puissance électrique comparable à 40 gigawatts en 2013. Soit une quarantaine de tranches de centrales nucléaires au niveau mondial. (Une centrale nucléaire inclut généralement 2 à 4 réacteurs répartis en tranches nucléaires d’une puissance unitaire moyenne de 1 000 MW).

Un chiffre qui a inévitablement des répercussions sur le climat. Même si cet impact dépend du mix énergétique du pays. En effet, en France, les émissions de consommation électrique sont de 80 grammes de CO2 par kwh. Néanmoins, elles sont de 460 g en moyenne en Allemagne, et de 800 g en Pologne.

Le Big Data : des perspectives remarquables et des inconvénients.

En effet le Big Data est très volumineux, même si les nouvelles technologies sont au point sur le stockage des données. Leurs volumes doublent environ tous les deux ans. Mais ces données, ne sont pas seulement stockées, elles sont aussi exploitées et organisées en amont.

De manière à permettre une analyse significative et organisée pour le client. Des spécialistes de la donnée passent environ 50 à 80% de leur temps à organiser et à préparer les données avant leur utilisation. 

Pour terminer, la technologie du Big Data évolue constamment et rapidement. Des logiciels open source comme Hadoop et Apache Spark ont vu le jour, ils sont dédiés au stockage et au traitement de larges volumes de données.

D’autre part, toutes ces données sont stockées dans des data centers. Ce sont des grandes infrastructures composées d’un grand réseau et d’espaces de stockage. Ces infrastructures consomment beaucoup d’énergie et ont besoin d’être refroidies 24h/24 et 7j/7. Aujourd’hui les data centers représentent plus de 4% de la consommation énergétique mondiale. 

Quelles solutions pour réduire l’impact carbone du big data ?

Afin de réduire l’impact carbone du big data, il est possible d’agir sur plusieurs leviers : 

Conclusion

L’avantage concurrentiel apporté par ces technologies, la baisse de leurs coûts et leur accessibilité renforcée, et l’enrichissement des jeux de données. Fait alors, que les données collectées et traitées ne vont certainement pas décroître dans les années à venir.

D’autant plus avec l’arrivée et la diffusion des intelligences artificielles,. Qui elles, ont besoin de grands jeux de données pour être performantes, et qui réduisent également les coûts d’utilisation de ce Big Data.

Se pose alors encore une fois la question de l’utilité de certains traitements. Les démarches de sobriété numérique et de numérique responsable nous poussent à nous poser la question de l’utilité de ce que nous faisons au quotidien dans les métiers de l’IT.

Quelle utilité finale à ces traitements (l’utilité économique n’étant pas toujours en lien avec l’utilité sociétal), quelles données est-il nécessaire de collecter ? et combien de temps les conserver ? Si les données (anonymisées) en lien avec la médecine et l’identification de facteurs de déclenchement de maladies semblent positifs sociétalement parlant, la collecte de données sur les orientations politiques des individus porte certainement à davantage de réflexions. 

Développer des solutions numériques

engagées pour le climat

Qu’est-ce que l’inclusion numérique ?

Qu’est-ce que l’inclusion numérique ?

Définition  L’inclusion numérique est un processus qui vise à rendre le numérique accessible à chaque personne et à lui transmettre des compétences numériques qui pourraient être un levier de leur insertion sociale et économique. Enjeux de l’inclusion numérique  Les...

lire plus
Quel est l’impact carbone de ChatGPT et de l’IA ?

Quel est l’impact carbone de ChatGPT et de l’IA ?

Qu’est-ce que l’intelligence artificielle ? L'intelligence artificielle (ou IA) repose sur des algorithmes très consommateurs de données, souvent personnelles, et son utilisation nécessite le respect de certaines précautions.  L'intelligence artificielle est devenue...

lire plus