L'IA et la Crise Climatique — Amplificateur du Problème
3.1 Les coûts énergétiques exponentiels
Nous avons exploré dans la Partie 2 comment l’émergence de l’IA nécessite une triple convergence : information, calcul, et énergie. Concentrons-nous maintenant sur cette troisième composante du point de vue climatique.
L’entraînement d’un grand modèle de langage consomme des quantités stupéfiantes d’énergie. Les estimations varient (les entreprises sont opaques sur ces chiffres), mais on peut tracer un ordre de grandeur.
GPT-3 (2020, 175 milliards de paramètres) : environ 1 300 mégawattheures (MWh) pour l’entraînement complet. C’est l’équivalent de la consommation annuelle de 130 foyers américains moyens. Ou, pour mettre en perspective, environ 550 tonnes de CO2 équivalent si l’électricité vient de sources fossiles (mix américain moyen).
GPT-4 (2023, nombre de paramètres non divulgué mais probablement >1 trillion) : les estimations suggèrent 10 à 100 fois plus d’énergie que GPT-3. Disons conservativement 50 fois : ~65 000 MWh, soit la consommation de ~6 500 foyers américains pour une seule session d’entraînement.
Et il faut souvent plusieurs tentatives, avec différents hyperparamètres, pour obtenir les meilleurs résultats. Multipliez par 5-10 ces chiffres pour avoir le coût total de développement.
Inference (utilisation du modèle une fois entraîné) : coûte moins que l’entraînement par requête, mais à l’échelle de centaines de millions de requêtes par jour (ChatGPT), les coûts s’accumulent. On estime qu’une requête ChatGPT consomme environ 10 fois plus d’énergie qu’une recherche Google classique (qui elle-même consomme ~0,3 Wh).
Si 500 millions de personnes font 10 requêtes ChatGPT par jour, c’est ~15 GWh par jour, soit ~5 500 GWh par an. C’est la production annuelle d’environ une centrale nucléaire moyenne.
Datacenters : Les géants tech construisent des datacenters massifs pour héberger leurs modèles. Un datacenter moderne consomme 100-200 MW en continu. Microsoft, Google, Amazon, Meta en ont des dizaines chacun, et en construisent de nouveaux constamment. La consommation totale des datacenters mondiaux est estimée à environ 200-250 TWh par an (2020), soit ~1% de la consommation électrique mondiale. Ce chiffre augmente rapidement.
Projections : Si la tendance continue (doublement de la puissance des modèles tous les 6-12 mois), les besoins énergétiques de l’IA vont exploser. Certains estiment que d’ici 2030, l’IA pourrait consommer 10-20% de l’électricité mondiale. C’est peut-être exagéré, mais même 3-5% serait énorme.
3.2 L’extraction matérielle : Terres rares et eau
L’IA ne consiste pas seulement en électrons. Elle nécessite une infrastructure matérielle massive.
Semi-conducteurs : Chaque puce contient des dizaines de matériaux, dont beaucoup sont des terres rares : lithium, cobalt, tantale, néodyme, europium. L’extraction de ces matériaux est extrêmement destructrice écologiquement :
- Mines à ciel ouvert détruisant des écosystèmes entiers
- Pollution des eaux souterraines par produits chimiques toxiques
- Exploitation dans des conditions souvent inhumaines (RDC pour le cobalt)
- Concentration géopolitique (Chine domine la production de terres rares)
Eau : Les datacenters nécessitent des quantités massives d’eau pour le refroidissement. Un datacenter de 15 MW peut consommer 300 000 gallons (plus d’un million de litres) d’eau par jour. Dans des régions déjà en stress hydrique (Arizona, Nevada aux USA, où beaucoup de datacenters sont construits car électricité pas chère), c’est problématique. Google a dû abandonner des projets de datacenters en raison de l’opposition locale sur la question de l’eau.
Infrastructure physique : Bâtiments, serveurs, câbles, systèmes de refroidissement. Tout cela nécessite béton, acier, cuivre, aluminium. Industries très émettrices. Un datacenter de taille moyenne (10 000 m²) nécessite environ 50 000 tonnes de matériaux pour sa construction.
Obsolescence : Les serveurs sont remplacés tous les 3-5 ans. Les processeurs évoluent rapidement. Les anciennes générations deviennent obsolètes. Des quantités massives de déchets électroniques (e-waste), souvent exportés vers des pays pauvres où ils sont “recyclés” dans des conditions toxiques.
3.3 Le paradoxe de Jevons numérique : L’efficience augmente la consommation totale
William Stanley Jevons, économiste du XIXe siècle, a observé un paradoxe : l’amélioration de l’efficience des machines à vapeur (moins de charbon pour produire la même énergie) n’a pas réduit la consommation totale de charbon. Au contraire, elle l’a augmentée. Pourquoi ? Parce que l’efficience rend l’usage moins coûteux, donc stimule l’expansion des usages, et l’effet volume dépasse l’effet efficience.
Ce paradoxe se reproduit avec l’IA. Chaque génération d’algorithmes est plus efficiente : GPT-4 est plus “efficient” que GPT-3 en coût par token généré. Les nouvelles architectures (transformers optimisés, distillation de modèles) permettent de faire plus avec moins de calcul.
Mais qu’est-ce que ça change au niveau macroscopique ? Rien, ou plutôt, l’inverse. L’efficience rend l’IA accessible à plus d’applications, plus d’entreprises, plus d’utilisateurs. Au lieu d’avoir un GPT-3 utilisé par quelques millions de personnes, on a GPT-4 utilisé par des centaines de millions. Au lieu d’avoir des modèles IA dans quelques domaines (recherche, traduction), on les a partout (santé, éducation, droit, art, code, service client).
L’effet d’échelle dépasse systématiquement l’effet d’efficience. Résultat : la consommation totale d’énergie pour l’IA augmente exponentiellement, malgré les gains d’efficience.
C’est exactement comme pour l’automobile. Les voitures modernes sont beaucoup plus efficientes que celles des années 1970 (consommation par km divisée par 2-3). Résultat : réduction de la consommation totale d’essence ? Non. Augmentation, parce qu’il y a maintenant 1,4 milliard de voitures dans le monde au lieu de 200 millions.
3.4 La course géopolitique : Compétition climat VS compétition IA
Nous avons mentionné la compétition géopolitique autour de l’IA. Les États-Unis, la Chine, l’Europe se livrent une course pour la suprématie technologique. Cette course intensifie massivement les investissements, les infrastructures, la consommation de ressources.
Mais cette course est fondamentalement incompatible avec les objectifs climatiques. Voici pourquoi :
1. Pression à l’accélération : Chaque acteur veut avancer le plus vite possible, avant les autres. Prendre du retard = risque stratégique majeur. Cette pression balaye toute considération d’efficience énergétique ou de soutenabilité. “Nous construirons des modèles plus propres plus tard, mais d’abord, il faut gagner la course.”
2. Duplication des efforts : Au lieu de coopérer et partager les ressources computationnelles, chaque acteur développe ses propres infrastructures, ses propres modèles. OpenAI entraîne GPT-4, Google entraîne Gemini, Anthropic entraîne Claude, Meta entraîne Llama, la Chine entraîne Ernie et d’autres. Chacun ré-entraîne essentiellement des capacités similaires. C’est du gaspillage massif du point de vue énergétique global.
3. Militarisation : Une partie significative des investissements IA est militaire. Drones autonomes, cyberguerre, surveillance de masse. Ces applications n’ont aucun bénéfice sociétal positif et consomment d’immenses ressources. Mais aucun acteur géopolitique n’acceptera de renoncer unilatéralement à l’IA militaire.
4. Incitation à l’extraction : Pour alimenter cette course, chaque puissance cherche à sécuriser l’accès aux ressources critiques (terres rares, cobalt, lithium pour batteries). D’où des nouvelles formes de néo-colonialisme extractiviste, particulièrement en Afrique. La compétition IA renforce la logique extractive, exactement à l’opposé de ce qu’exigerait la transition écologique.
5. Impossibilité de coordination internationale : On pourrait imaginer un traité international limitant les investissements en IA, comme il existe des traités sur les armes nucléaires. Mais c’est politiquement impossible dans le contexte de compétition actuel. Aucun acteur ne fait confiance aux autres pour respecter les limites. Retour au dilemme du prisonnier.
3.5 L’IA comme multiplicateur d’impact : Pour le bien et le mal
Il serait malhonnête de ne pas mentionner que l’IA pourrait aussi avoir des impacts positifs sur le climat. Les défenseurs de l’IA (souvent les mêmes qui la développent) avancent plusieurs arguments :
Optimisation énergétique : L’IA peut optimiser la consommation d’énergie dans les bâtiments, les industries, les réseaux électriques. DeepMind a réduit de 40% la consommation énergétique des systèmes de refroidissement des datacenters de Google en utilisant ses propres algorithmes. Extrapolé à l’échelle mondiale, ce serait significatif.
Gestion des renouvelables : Le solaire et l’éolien sont intermittents. L’IA peut prédire la production (météo) et optimiser le stockage et la distribution. Elle facilite ainsi l’intégration massive de renouvelables dans le réseau.
Recherche de matériaux : L’IA accélère la découverte de nouveaux matériaux (batteries plus efficaces, catalyseurs pour hydrogène vert, matériaux de construction bas-carbone). AlphaFold a révolutionné la prédiction de structures de protéines ; des approches similaires sont appliquées aux matériaux.
Modélisation climatique : Les modèles climatiques bénéficient de l’IA pour affiner les prédictions, identifier les points de bascule, simuler les impacts de différentes politiques.
Optimisation logistique : Transport, supply chains - l’IA peut réduire les distances parcourues, les stocks inutiles, donc les émissions.
Tout cela est vrai, potentiellement. Mais il y a un problème fondamental : l’optimisation ne remet jamais en cause la croissance elle-même.
L’IA optimise l’existant. Elle le rend plus efficient. Mais elle ne questionne pas les objectifs. Si l’objectif systémique reste “croissance du PIB”, “augmentation de la consommation”, “expansion de la production”, alors l’IA, aussi efficiente soit-elle, servira cet objectif. Elle permettra de croître plus, d’extraire plus, de produire plus, de consommer plus - juste de manière plus optimisée.
Le problème climatique fondamental n’est pas l’inefficience. C’est l’échelle. C’est la croissance matérielle infinie dans un monde fini. L’efficience permet de repousser les limites un peu plus loin, mais ne change pas la trajectoire d’effondrement.
C’est comme optimiser l’arrangement des chaises longues sur le Titanic. Oui, techniquement, elles sont mieux arrangées. Non, ça ne change rien au naufrage.