jueves, junio 13

Los centros de datos aquí quieren tener sus propios reactores nucleares

Sam Altman, alto directivo de OpenAI, la empresa que creó ChatGPT, hizo un negro anuncio en el Foro de Davos: la industria de la inteligencia artificial (IA) está a punto de provocar una crisis energética. La nueva generación de IA generativa consumirá mucha más energía de la esperada, dijeron ante los principales líderes y empresarios del mundo, hasta el punto de incorporarla a todas las redes energéticas globales. “No hay manera de hacer cambios drásticos”, esperó.

Este “cambio dramático” al que se refiere es la energía nuclear avanzada, que incluye reactores de cartucho y fusión nuclear, los cuales aún son experimentales. En esta alternativa se han instalado diversas empresas, lo que brindará autonomía energética y mayor control de costos. La administración Biden no lo ama con malos ojos. La Secretaria de Energía, Jennifer Granholm, se reunió en marzo con varias empresas tecnológicas, entre ellas Amazon, Google y Microsoft, para explorar fórmulas imaginativas para abandonarlas. Uno de los temas tratados fue la integración de pequeños reactores nucleares en centros de datos, esas enormes naves llenas de procesadores que funcionan día y noche.

Las últimas estimaciones dicen que el 8% de la energía mundial se dedica a la IA, que se consume alimentando los procesadores que alimentan los modelos y mantienen los sistemas. Esta cifra, al igual que la profecía de Altman, se reducirá en poco tiempo, tras lo cual habrá que sumar los usuarios y sugerir nuevas versiones de ChatGPT, Gemini o Copilot, que requerirán cada vez más potencia informática. “Me alegra decirlo en Davos. Ha visto una constante minimización y negación de los costos ambientales de la industria de la IA desde que comenzó a publicarse en 2018”, escribió Kate Crawford, una destacada investigadora sobre la sombra de la IA.

S gran tecnología Ya se han dado los primeros pasos hacia la era nuclear, una fuente de energía en retrospectiva en Occidente (la mayoría de los reactores que se construyeron fueron desmantelados) con algunas grandes excepciones: EE UU, Francia, Reino Unido y varios países de Europa del Este. Las empresas, por su parte, los consideran una forma de asegurar un proveedor de energía estable y duradero en un contexto donde la oferta ya no es sí. Los altos mandos de Google dicen El periodico de Wall Street que considero la posibilidad de firmar acuerdos de compra con desarrolladores de pequeños reactores nucleares. «Creo que la energía nuclear, especialmente la más avanzada, está logrando muchos avances», dijo la rotativa estatal Maud Texier, directora global de energía limpia de Google. Fuentes de la empresa no confirman en el PAÍS que la ruta nuclear sea una opción de futuro, aun así. Google ha hecho poco con Microsoft y Nucor para agradecerles por “acelerar las tecnologías avanzadas de limpieza energética”, incluida la “nuclear avanzada”.

En octubre del año pasado, Microsoft cerró acuerdos de compra (PPA, de sus siglas en inglés) con la estatal Helion Energy por lo que recibirá a partir de 2028 la energía obtenida de la fusión nuclear, una técnica aún más teórica que práctica y que, a diferencia de la fisión, , no produce residuos radiactivos. Solicitada por este periódico sobre su estrategia en el sector nuclear, la compañía envió un documento de diciembre del año pasado titulado Acelerando un futuro libre de carbonode momento en el que ya he aclarado que las «energías nucleares en avance», además de los reactores tradicionales, son uno de los pilares de los que serán el eje de la gira verde de Microsoft, si no hablamos de plazos ni fechas.

Imagen del interior del Laboratorio Nacional Lawrence Livermore de EE UU, ubicado donde se registró la fusión nuclear.DISPOSICIÓN (AFP)

AWS, la división de informática en la nube de Amazon, compró recientemente un gran centro de datos en EE UU ubicado junto a la sexta planta de energía nuclear más grande del país, que proporciona el 100% de su energía a un precio fijo. “Para complementar nuestros proyectos eólicos y solares, que dependen de las condiciones climáticas para generar energía, también estamos explorando innovaciones y tecnologías y empleando otras fuentes de energía limpias y libres de carbono. Respeto por Talen Energy [la empresa dueña de la citada central nuclear estadounidense] «La energía libre de carbono es un proyecto que va en esa dirección», señalan a EL PAÍS fuentes de la empresa.

El búho nuclear de Silicon Valley

La idea de que la energía nuclear es la salvación de la IA se está extendiendo entre la jet set de Silicon Valley. Sam Altman es uno de sus grandes valedores. El propietario de Helion Energy, pionera en la fusión nuclear, está tan convencido del futuro que ha invertido 375 millones de dólares. También presido una startup, Oklo, que pretende diseñar y fabricar reactores de fisión nuclear como los que se utilizan hoy en día, pero mucho más pequeños (llamados SMR, acrónimo en inglés de pequeño reactor modular).

Bill Gates es otro de los magnates tecnológicos interesados ​​en SMR. Su empresa TerraPower trabaja en un reactor nuclear de sodio, una variante experimental que, de tener éxito, promete ser 25 veces más barata que la fisión nuclear.

El ingeniero jefe de IA generativa de Meta, Sergey Edunov, dijo hace unos meses que sólo tendría que prescindir de grandes reactores nucleares para satisfacer toda la demanda mundial de energía de IA proyectada para 2024, incluida la potencia de los modelos y las operaciones y el entrenamiento de nuevos. unos.

¿Has vuelto a hacer la ruta nuclear? “No hay ningún progreso en el horizonte que permita el lanzamiento inmediato de los SMR, que actualmente se encuentran en la etapa inicial de creación de prototipos en numerosos países. Esta opción sólo sería viable durante una década”, afirma la ingeniera Heidy Khlaaf, especialista en evaluación, especificación y verificación de aplicaciones informáticas complejas en sistemas críticos para la seguridad. Algunos países, como Reino Unido, Francia, Canadá o EE UU, cuentan con aviones para desarrollar este tipo de instalaciones, pero no antes de 20 años.

A Khlaaf le preocupa especialmente que Microsoft ya tenga IA generativa trabajando en papel para adquirir licencias nucleares, un proceso que puede llevar años y costar millones de dólares. “Este no es un ejercicio de marcar casos, sino un proceso de seguridad en sí mismo. Ver estos procesos regulatorios como meros documentos desordenados dice mucho sobre su comprensión, o la falta de ella, de la seguridad nuclear”, afirma.

¿Es realista creer en el futuro de la IA en la fusión nuclear? Las estimaciones más optimistas de Helion Energy dicen que en 2029 será capaz de producir suficiente energía para abastecer 40.000 horas de media de EE UU. Se estima que ChatGPT consume el equivalente a 33.000 horas al día.

¿Por qué tanto consumo de energía?

La irrupción de la IA ha sacudido el panorama energético mundial. La mayor parte del consumo asociado a los modelos de IA generativa se produce antes de su uso, durante el capacitación. Este es un proceso clave en el desarrollo de modelos de aprendizaje profundo que implica mostrar al algoritmo millones de ejemplos que ayudan a los usuarios a determinar qué situaciones predicen. En el caso de modelos de lenguaje grandes, como ChatGPT, si intenta que el sistema concluya que la serie de palabras “El mar tiene color” es muy probable que vaya seguida de la palabra “azul”.

La mayoría de los centros de datos utilizan procesadores avanzados llamados GPU para lograr el aprendizaje de modelos de IA. La GPU requiere mucha energía para funcionar, una vez más que la CPU (procesadores convencionales). Entrenar grandes modelos de lenguaje requiere decenas de kilómetros de GPU, lo que requiere operaciones día y noche durante semanas o meses.

“Los modelos de lenguajes grandes tienen una arquitectura muy grande. Un algoritmo de aprendizaje automático que te ayuda a elegir dónde contratar los cuestionarios necesarios 50 variables: dónde trabaja el candidato, qué salario tiene ahora, experiencia previa, etc. La primera versión de GhatGPT tiene más de 175.000 millones de parámetros”, explica Ana Valdivia, profesora de IA, Gobierno y Política en el Oxford Internet Institute.

Una vez que entrenaste el modelo, no había forma de acercarte y explorar los datos sobre en qué estás trabajando. Esto también se logra en los centros de datos que deben operar día y noche.

¿Cuál es el consumo total de IA? ¿Cuánta energía se dedica a entrenar y alimentar los modelos más utilizados? Las empresas no publican esta información, todo lo que tenemos son estimaciones. Por ejemplo, el modelo Gemini Ultra de Google, uno de los más avanzados en la actualidad, requirió 50.000 millones de petaflops para entrenarse, según un denunciante de la Universidad de Stanford. Para obtener esta potencia de cálculo con ordenadores comerciales (incluso si en estos casos se utilizan sistemas de orden superior) se necesitarán 10.000 billones (10 elevado a 16) de ordenadores. El costo asociado a esta capacitación fue de 191 millones de dólares, atribuible en gran medida a la energía consumida.

Un solo modelo de IA puede consumir decenas de millas por hora. Los modelos de IA generativa, como ChatGPT, pueden consumir 100 veces más energía, según estimaciones de la consultora tecnológica IDC.

Además del correcto suministro eléctrico de los sistemas, también se produce un consumo en los sistemas de refrigeración de los procesadores. Las técnicas más habituales incluyen la ventilación eléctrica y el uso de agua para enfriar el ambiente y las máquinas. Este último sistema está intentando causar problemas en lugares con descarga de agua, ya que las técnicas más modernas implican el uso de circuitos cerrados que minimizan las pérdidas de recursos hídricos.

Deja una respuesta