La refrigeración líquida de ciclo cerrado de Nvidia: eficiencia, densidad y sostenibilidad en centros de datos


En el dinámico mundo de los centros de datos, la demanda de potencia de cómputo va en aumento junto con la necesidad de gestionar calor de manera eficiente. Nvidia ha puesto sobre la mesa una visión que promete cambiar las reglas del juego: una solución de refrigeración líquida de ciclo cerrado que reduce drásticamente el desperdicio de agua y eleva la eficiencia energética, al tiempo que permite mayores densidades de rack y mejor rendimiento por vatio.

Tradicionalmente, la refrigeración de centros de datos ha dependido de sistemas que consumen agua o aire para disipar el calor generado por GPUs y CPUs de alto rendimiento. A medida que la inteligencia artificial se densifica, las soluciones basadas en aire han alcanzado sus límites. Nvidia propone un enfoque que concentra la gestión térmica allí donde se genera el calor: directamente en las fichas y componentes de cómputo.

Refrigeración de ciclo cerrado que reduce prácticamente todo el consumo de agua

La idea central es operar con un refrigerante a temperaturas más altas (aproximadamente 45°C o 113°F), lo que simplifica los sistemas de enfriamiento y reduce el consumo eléctrico. El diseño utiliza una mezcla de 75% agua y 25% glycol como refrigerante y funciona a temperaturas que pueden exceder ligeramente las que toleran algunas bañeras de hidromasaje, manteniendo la estructura de un ciclo cerrado donde el refrigerante circula continuamente a través de los servidores para extraer el calor.

En comparación con torres de enfriamiento evaporativas, este enfoque cerrado minimiza la evaporación y el consumo de agua. El refrigerante caliente circula por intercambiadores externos de enfriamiento seco, dejando prácticamente sin evaporación de agua. Nvidia afirma que, en climas apropiados, la necesidad de agua para refrigeración puede reducirse en un 100%, eliminando por completo las torres de enfriamiento. Como ejemplo, Ali Heydari, Director de Data Center Cooling and Infrastructure, señaló que el diseño de referencia DSX para fábricas de IA puede tener cero consumo de agua, eliminando gran parte del consumo de energía asociado.

La eficiencia proviene, además, de la refrigeración directa al chip: el líquido pasa por placas frías conectadas a CPUs y GPUs, capturando y expulsando el calor exactamente donde se genera. Este enfoque supera a la refrigeración por aire en rendimiento y, a nivel de transferencia de calor, el líquido puede mover el calor miles de veces más eficientemente que el aire.

Mayor densidad de rack y mejor rendimiento

Nvidia reconoce que el consumo de potencia por chip y la densidad de racks siguen aumentando. Con refrigeración líquida, las empresas pueden añadir más GPUs por rack, permitir potencias más altas por rack y, en consecuencia, desplegar clústeres de IA más grandes dentro del mismo mínimo de infraestructura. En concreto, la empresa indica que sus sistemas Rubin pueden caber ya dentro de dos racks, frente a seis, lo que representa un ahorro significativo de espacio.

Además, la refrigeración por aire se encuentra con límites claros en tecnologías de alto rendimiento; cuando las vatios por chip superan cierto umbral, la refrigeración líquida se vuelve no solo ventajosa sino necesaria. Datos independientes, ajenos a Nvidia, también sostienen mejoras: pruebas indican un rendimiento aproximadamente 17% superior con enfriamiento por agua frente a aire en sistemas H100 bajo cargas de IA sostenidas, con temperaturas de GPU que oscilan entre 41–50°C en agua frente a 54–72°C en refrigeración por aire.

Esta mayor eficiencia térmica no solo mejora el rendimiento inmediato y sostenido, sino que también puede aumentar la longevidad de las placas y sistemas. Con la anticipación de utilizar esta modalidad de refrigeración de ciclo cerrado a temperaturas más altas en las próximas implementaciones de Rubin este año, el enfoque parece estar preparado para impulsar cambios estructurales en el diseño de centros de datos de IA.

En resumen, la propuesta de Nvidia no se trata simplemente de una mejora incremental en la gestión del calor. Se trata de una estrategia integrada que reduce significativamente el consumo de agua, mejora la eficiencia energética y de rendimiento, y habilita densidades de rack superiores. En un entorno donde la sostenibilidad y la optimización de costes son factores críticos, estas soluciones podrían marcar una transición importante en la construcción y operación de infraestructuras de IA a gran escala.

from Latest from TechRadar https://ift.tt/xkEwNjn
via IFTTT IA