EL IMPACTO AMBIENTAL DE LOS LLM
EL IMPACTO AMBIENTAL DE
LOS LLM
Es noticia de actualidad
el impacto ambiental que el uso de los LLM está teniendo, sobre todo en lo que
respecta a la huella hídrica. Este entre muchos otros factores permite la proliferación de
una nueva cuestión que poner encima de la mesa: ¿Cuál es el impacto ambiental
real del uso de la Inteligencia Artificial? ¿Qué se puede hacer para reducirlo?
Si bien a estos problemas no se les puede dar aun una respuesta concisa, en
esta entrada se tratará de sacar a relucir datos relativos a este tema
provenientes de trabajos académicos que probablemente desconocíamos y que no
dejarán a nadie indiferente.
La Inteligencia
Artificial generativa no consume agua directamente, sin embargo, su existencia
depende y está directamente relacionada con este recurso ya que se necesita del
mismo para diversas objetivos: enfriar los sistemas en los centros de datos,
generar electricidad para los mismos y fabricar los chips o GPU de los que
hacen uso los LLM. En ese caso, digamos que es la infraestructura que sostiene
a la IA la que necesita recursos hídricos.
Un estudio (basado en simulaciones) de 2025
realizado por los investigadores Jacob Morrison, Clara Na, Jared Fernandez, Tim
Dettmers, Emma Strubell y Jesse Dodge para la Carnegie Mellon University demostró
que los LLM tienen distinto impacto hídrico dependiendo de la ubicación, así
como del sistema de refrigeración que se utilice para sostenerlos. No obstante,
esta investigación aporta datos estimados acerca de cuánta agua se necesita para
recabar la energía necesaria en este proceso de ejecución de los modelos de
lenguaje y señala, mediante el uso de modelos propios, que la huella hídrica es
monumental y bastante superior de lo que se reporta en la industria.
En cuanto a números, la
investigación ejemplifica estimando que entrenar y desarrollar los modelos de
lenguaje que utilizaron equivaldrían a 493 toneladas de CO2, lo mismo que consumen
98 casas estadounidenses a lo largo de un año. Si hablamos de la huella hídrica,
los autores de esta investigación tenían a su disposición un centro de datos
sin refrigeración evaporativa, es decir, que enfría sin utilizar agua, por lo
que el consumo es supuestamente menor, aunque esta afirmación tiene truco, ya que,
aunque el edificio no consuma agua, si lo hacen las centrales en las que se
generó la electricidad de la que hacen uso. Esta investigación tiene mérito, ya
que no se limita a contar el agua que se consumió directamente, sino que reporta
también el agua de esas centrales, que se utiliza de manera indirecta. A pesar
de hacer uso de este tipo de centro, se estimó que se necesitarían 2 769 000
litros de agua para entrenar y ejecutar a su modelo de lenguaje, lo que
equivale a el consumo promedio de agua de una persona estadounidense en 24 años
y medio.
Otra de las conclusiones extraídas
del estudio que es necesaria destacar tiene que ver con lo poco que se reporta
sobre el consumo de energía eléctrica e hídrica en contraposición con lo que
realmente se consume. Esto se debe a que la etapa de desarrollo de los modelos
de lenguaje no se tiene en cuenta a pesar de constituir aproximadamente el 50%
del impacto total, reportándose así únicamente la huella ambiental que deja el
entrenamiento final. De la misma forma, tal y como comentábamos anteriormente, el
impacto indirecto se deja de lado a la hora de reportar, no se cuenta con la
energía que se consume fuera de los centros de datos, a pesar de que esta sea
también relevante y forme parte de la huella total.
Estudios como estos no
hacen más que demostrar que el problema es incluso mayor de lo que podemos
llegar a concebirlo de primeras. Asimismo, se demuestra que no existe una base
legislativa sólida aun que sea capaz de abordar el problema de la mejor manera
posible. El primer paso que debería darse en este asunto está claro, se
necesita una transparencia que no parece llegar nunca. Se necesitan datos
reales y comprobables, datos que finalmente consigan que nos llevemos las manos
a la cabeza y que se comience a intervenir legislativamente, poniendo un límite
en el impacto ambiental irreversible que están dejando las empresas encargadas
de crear LLM.
Raquel Fernández Muñoz
BIBLIOGRAFÍA
Morrison, J., Na, C., Fernandez, J., Dettmers, T.,
Strubell, E., & Dodge, J. (2025). Holistically evaluating the
environmental impact of creating language models. Recuperado de: https://arxiv.org/abs/2503.05804
Comentarios
Publicar un comentario