Edición n° 2915 . 14/11/2024

El costo ambiental de entrenar Inteligencia Artificial Generativa

( por Alfredo Moreno*/Especial para Motor Económico) La producción de resultados de la Inteligencia Artificial (IA)depende de la energía eléctrica. Esta tecnología necesita de una arquitectura de supercomputación que necesita ser enfriada constantemente para satisfacer las demandas de los usuarios. A saber, la industria de la producción de electricidad y calor ha propiciado un aumento significativo del 46 % en las emisiones globales. La IA será el motor principal de la duplicación prevista de la demanda mundial de electricidad y gran aumento en el consumo de aguapara los centros de datos en el período 2026.

Contexto de la tecnología digital

La infraestructura digital es el conjunto de tecnologías de base electrónica y sistemas basados en software que permiten la creación, el procesamiento, el almacenamiento y la transmisión de datos.

Se puede dividir en dos categorías principales: Infraestructura de Conectividad e Infraestructura de Cómputo.

La Infraestructura de Conectividad, también llamada de ‘telecomunicaciones’, incluye todos los elementos que permiten la transmisión de datos a través de largas distancias y el acceso a internet. Los componentes claves de esta infraestructura son:

  • Cables de fibra óptica: Estos cables submarinos o terrestres permiten la transmisión de datos a alta velocidad y larga distancia con baja latencia; transportan más del 95% del tráfico global de internet (Izaguirre, 2023).
  • Satélites: Proveen conectividad en áreas remotas donde no es factible instalar cables de fibra óptica.
  • Antenas móviles: Facilitan la comunicación inalámbrica al permitir que celulares y otros dispositivos accedan a internet, tanto en redes 3G como en 4G, 5G…
  • Puntos de intercambio de internet (IXPs): Son lugares físicos donde diferentes empresas y organizaciones se conectan e intercambian tráfico de datos para mejorar la eficiencia y reducir los costos de transmisión.

La Infraestructura de Cómputo incluye todos los recursos y sistemas necesarios para el procesamiento, almacenamiento y gestión de datos digitales. Sus componentes principales son:

Semiconductores: Conocidos como Chips o Circuitos Integrados, son pequeñas piezas de material semiconductor, generalmente silicio, con millones o miles de millones de transistores microscópicos integrados en su estructura.

Centros de datos o Data Centers (DCs): Instalaciones físicas que alojan servidores (computadoras especializadas de alta potencia), sistemas de almacenamiento (discos duros de alta capacidad), redes (permiten la conectividad y comunicación), sistemas de refrigeración (para mantener la temperatura adecuada y evitar que los equipos se sobrecalienten) y seguridad (contra personas no autorizadas o por desastres naturales).

Supercomputadoras: También llamadas Computadoras de Alto Desempeño o Rendimiento (HPC), son máquinas potentes diseñadas para realizar cálculos complejos y procesar grandes volúmenes de datos a alta velocidad.

Computación en la Nube: Modelo de entrega de servicios de cómputo a través de internet. Permite acceder a recursos de cómputo y almacenamiento bajo demanda, sin necesidad de una infraestructura física propia.

Procesar datos, entrenar las IA Generativas y mantener los servidores activos son algunas de las actividades de alto consumo de agua dulce y energía de esta industria.

Por un lado, los centros de procesamiento de datos usan electricidad de plantas de energía que requieren grandes torres de refrigeración que convierten el agua en vapor emitido a la atmósfera. Por el otro, los cientos de miles de servidores de estos centros deben mantenerse fríos, pues la electricidad que se mueve a través de semiconductores genera calor continuo.

Crisis climática global

El estudio de la Universidad de California, Riverside en 2023, mostró que el uso de agua potable para entrenar los algoritmos de IA de ChatGPT en Estados Unidos fue de 700.000 litros en un año; equivalente a fabricar unos 370 BMW o 320 autos Tesla.

Las estimados a futuro son más preocupantes. El mismo estudio indica que la demanda mundial de IA puede llegar a ser responsable de 4.2 a 6.6 mil millones de metros cúbicos de agua para 2027, lo que sería aproximadamente la extracción anual total de agua de Dinamarca o la mitad del Reino Unido.

Por ahora no hay suficiente información para calcular con exactitud la cantidad de dióxido de carbono (CO2) que producen IA como ChatGPT, pero algunos cálculos la ubican como responsable de emitir 8,4 toneladas por año.

Esta cifra se compara con otros cálculos de lo producido por un humano promedio que equivaldría a 4 toneladas al añoubicando a las IA como unos de motores que acelera la crisis climática global.

Las alertas, que presentan estudios como el de la Universidad de California también se traduce en una medida más cercana al uso personal de ChatGPT. Por ejemplo, por cada diez consultas que se le hagan a este modelo de inteligencia artificial, se consume una botella de agua de medio litro. Si tenemos que a finales de 2023 se calculaba que esta IA recibía más de 10 millones de consultas por día, esto quiere decir que por lo menos se consumen un millón de botellas de agua cada día al usar ChatGPT.

El consumo energético de los supercomputadores que hacen posible el entrenamiento y mejora de la IA Generativa y el flujo de datos en Internet, es el principal factor que influye en su huella de carbono.

Cambiar la imagen que tenemos de cómo funciona internet es importante para tomar consciencia de su impacto ambiental.

La última década ha estado marcada por la idea de “la nube o el cloudcomputing”, un lugar etéreo que se corresponde con la realidad física del uso de tierra, espacio y recursos alojados en centros de datos ,indispensables para que podamos hacer consultas en Google desde la comodidad de nuestro teléfono.

El especialista en mitigación del cambio climático y huella del carbono, Sebastián Galbusera, en una entrevista realizada por NationalGeographic, la huella de carbono se refiere a “la cantidad de emisiones de gases de efecto invernadero que se emitieron a la atmósfera por medio de alguna actividad humana”.

La huella de carbono personal es aquella que la produce un solo individuo al realizar sus actividades cotidianas, tales como usar recursos energéticos, conectarse a internet y utilizar una IA Generativa entre otras. Actualmente, la huella de carbono promedio de cada individuo es de 4 toneladas de CO2  al año. Lo ideal es que esta se encuentre entre 2 a 2.5 T.

En medio de una crisis climática que se siente cada vez más cerca en sus efectos, el primer paso es el cambio de consciencia individual para luego actuar de manera colectiva a fin deque las corporaciones digitales responsables rindan cuentas de manera transparente sobre su uso de recursos e implementen medidas que mitiguen el consumo eléctrico yimpacto ambiental.

Los costos energéticosde la IA Generativas

Una de las razones del aumento en las demandan energéticas se debe a un aumento en la escala de los parámetros de los modelos de la IA Generativa. Es decir, las configuraciones que aprenden los algoritmos durante su entrenamiento, los cuales se ajustan para modificar la forma de procesa información y generar respuestas, así como para adecuar el comportamiento de los modelos de lenguaje grande (LLM) o los modelos multimodales (LMM). Ejemplos de este incremento en la escala de los parámetros de modelo son: Google BERT-large (350 millones de parámetros), Open AI GPT2-XL (1.5 mil millones), NVIDIA Megatron-LM (8 mil millones), Google T5-11B (11 mil millones) y Open AI GPT-3 (175 mil millones).

Del mismo modo, se han amplificado las horas de entrenamiento de los modelos con datos, lo cual se traduce a un mayor gasto eléctrico y económico. OpenGPT-2-XL entrenó con 40 mil millones de palabras, RoBERTa (IA de Meta/Facebook) se entrenó con 160 GB de texto (la misma cantidad que OpenGPT-2XL). Por tanto, ambas requirieron aproximadamente 25,000 horas de GPUpara entrenarse.[i]

Producir un chip de IA requiere entre diez y quince veces más energía que fabricar un chip estándar. Esto se debe a que el aprendizaje automático de la IA precisa procesadorescomputacionales del tipo GPU para realizar su entrenamiento. Las GPU devoran enormes cantidades de energía. Mientras que en 2020 se necesitaban unos 27 kilovatios-hora de energía para entrenar un modelo de IA, en 2022 esta cifra se elevó a un millón de kWh, un impresionante aumento de 37 000 veces. Toda esta potencia de cálculo requiere enormes cantidades de electricidad y agua para refrigeración.

Una disputa política por la transformación global de la sostenibilidad ambiental

El uso de la Inteligencia Artificial (IA) crece aceleradamente en todo el mundo, lo que requiere una enorme cantidad de energía para fabricar semiconductores y provoca una explosión en la construcción de centros de datos para entrenamiento de los algoritmos de IA. Tan grande y rápida es esta expansión que se advierte una crisis energética catastrófica para la humanidad.

Los centros de datos están proliferando en todo el mundo para satisfacer la demanda de IA, pero sobre todo en América Latina, región considerada como una ubicación estratégica por los gigantes tecnológicos.

La crisis hídrica que vive la comunidad rural indígena de Maconí, en el estado de Querétaro, México. Esta crisis, causada por el cambio climático, se le suma la enorme demanda de agua exigida por la instalación de nuevos centros de datos de internet, cuyo elevado consumo debilita aún más los recursos limitados de agua y electricidad de la comunidad.

Querétaro alberga ya diez data centers en funcionamiento y se proponen instalar dieciocho más, algunos de ellos para atender la creciente demanda de ChatGPT.

La demanda de IA está creciendo aceleradamente, con ChatGPT que consiguió un millón de usuarios en los primeros cinco días de su lanzamiento en noviembre de 2023. Se espera que esta IA crezca un 37 % de 2023 a 2030, según Grand View Research, empresa de inteligencia de mercado.

Las empresas de alta tecnología buscan fábricas de chips y ubicaciones de centros de datos fuera de Estados Unidos, sobre todo en Latinoamérica. “Los países latinoamericanos suelen tener menos regulaciones ambientales que Estados Unidos y Europa;la energía y el agua son más baratas”, le comentó a Mongabay Sebastián Lehuedé, profesor de ética, IA y sociedad del Departamento de Humanidades Digitales del King’sCollege de Londres.

En 2023, Costa Rica y Panamá anunciaron su intención  de crear el primer centro de fabricación de chips de América Central.

En 2024, la República Dominicana dejó en claro anuncio que quiere desempeñar un papel clave en la fabricación de chips.

Las autoridades brasileñas y taiwanesas han mantenido conversaciones para “liberar el ‘potencial’ del mercado de semiconductores de Brasil”.

En octubre de 2023, el periódico estadounidense DallasNews    informó que, mientras “Estados Unidos y China compiten por el dominio de la industria mundial de semiconductores, Latinoamérica se ha convertido en un campo de batalla clave”.

El volumen de datos procesados en los centros latinoamericanos se ha duplicado desde 2020.

Se espera que el volumen de procesamiento crezca más del 9 % anual entre 2024 y 2029, según Mordor Intelligence, e incluso se espera que el volumen de datos procesados en México supere el 11 % de crecimiento anual entre 2021 y 2026.

Los graves problemas socioambientales que causan estos centros de datos derivan de una evaluación inadecuada durante la planificación, ya que las autoridades, cuando dan el visto bueno a un centro de datos, no tienen en cuenta el ciclo de vida completo de la instalación.

La cadena de suministro comienza con la extracción de recursos naturales, sigue con la fabricación de chips, continúa con los datos operativos de los centros de datos y la IA, la explotación del mineral Litio para la fabricación de baterías de los dispositivos digitales y concluye con los residuos electrónicos.

En el  estudio realizado en febrero de 2024 por Josh Lepawsky, profesor de geografía de la Universidad Memorial de Terranova y Labrador (Canadá), se reveló que el 40 % de las instalaciones de semiconductores existentes ya se encuentran en cuencas fluviales con riesgo alto o extremadamente alto de estrés hídrico entre 2030 y 2040.

La necesidad de muchos gobiernos de países en desarrollo de atraer inversiones extranjeras causa otros problemas, dado que los funcionarios dan prioridad a las exigencias de las corporaciones tecnológicas sobre las continuas y cotidianas necesidades de la población.

Tal es el caso del presidente Javier Milei que en junio de 2024 realizó una visita histórica al Silicon Valley que incluyó encuentros con los máximos popes de la industria tecnológica. 

Junto a Sam Altman (OpenAI), Mark Zuckerberg (Meta), Sundar Pichai (Google) y Tim Cooke (Apple) Milei se tomó fotos con los pulgares hacia arriba comunicando por sus rede sociales que «, lo primero y fundamental es señalar que las ideas de libre mercado y libre empresa son un substrato ideológico en el cual las conversaciones han encontrado un entendimiento inmediato.La idea de transformar a la Argentina en un hub de Inteligencia Artificial fue muy bien recibida por los “dueños de los datos”.

En febrero de 2024, un tribunal chileno revocó de manera parcial un permiso que permitía a Google construir un centro de datos bajo el argumento de que la empresa debe presentar una nueva solicitud que tenga debidamente en cuenta el cambio climático. Google recibió, a principios de 2020, la autorización inicial para el centro de datos de Cerrillos, en Santiago, con un valor de 200 millones de dólares, pero el proyecto suscitó las protestas de residentes y funcionarios locales por el posible impacto en el acuífero reseco de la capital.

Los Estados deben ser responsables en dar el visto bueno a la aprobación de nuevos centros de datos, esta planificación debe requerir que se realice un estudio, evaluación y publicación completa de los impactos del ciclo de vida de la IA. Los gobiernos son responsables de que establezcan normativas para frenar el creciente daño social causado por la IA.

Los centros de datos ya consumen más electricidad que países enteros. El uso de la IA Generativa intensificará enormemente el uso de energía.

«Cuando van construyendo poder son anónimos, pero cuando pasan al plano de la disputa política, se hacen públicos porque necesitan la adhesión de la gente y hoy los rostros y los nombres de los grandes magnates tecnológicos son más conocidos que los líderes políticos. Han conseguido una tremenda dependencia de parte nuestra, que se potenciaron con la pandemia. Hoy es casi imposible vivir sin plataformas y redes sociales.Puede existir la Inteligencia Artificial, la nanotecnología, pero el latido del corazón humano es siempre el mismo y la necesidad de apoyar la cabeza en el hombro de alguien alguna vez en la vida, no le puede faltar a ningún ser humano. Por eso la política tiene que recuperar esta dimensión para, desde ahí, empezar a construir un camino esencialmente distinto». [ii]

Necesitamos construir un acuerdo democrático a escala mundial sobre la distribución de los centros de datos, un acuerdo que dé voz y derechos a la gran comunidad de la humanidad y a la enorme diversidad de la naturaleza.

Debemos modificar el peso de la configuración actual. El núcleo del problema es la imposición de una visión ecológica tecnológica por parte del norte global al sur global.

Alfredo Moreno/Computador Científico/Director de TIC en UNDAV, Profesor TIC en UNM


[i]La GPU es una unidad de procesamiento gráfico. Indica la velocidad de las tarjetas gráficas. Una hora de GPU equivale a 20 horas de CPUcomputadora. La arquitectura de los Supercomputadoras se basa en GPU.

[ii]Carlos Reimundi ex embajador en OEA.