Компании Microsoft, OpenAI и NVIDIA опубликовали исследование, в котором предупредили о новой угрозе для энергетической инфраструктуры, связанной с работой мощных ИИ-систем. Согласно отчету «Стабилизация энергоснабжения для обучающих ИИ ЦОД», искусственный интеллект может наносить физический вред электросетям.
Проблема заключается в особенностях работы современных ИИ-ускорителей. Их деятельность делится на два основных этапа: вычислительный, когда устройства потребляют много энергии, и коммуникационный, когда они обмениваются данными. При переходе между этими этапами происходят резкие колебания энергопотребления.
В случае крупных дата-центров (гиперскейлеров) эти скачки могут достигать десятков или сотен мегаватт. Такие колебания способны совпасть с резонансными частотами ключевых элементов энергосистемы, включая генераторы и оборудование линий электропередач.
Это совпадение может привести к дестабилизации сети, повреждению оборудования и масштабным авариям. Таким образом, деятельность ИИ представляет прямую физическую угрозу для аналоговой инфраструктуры электросетей.
Для решения этой проблемы предлагается три основных подхода.
Первый — загружать ускорители второстепенными задачами во время простоя, чтобы избежать полной остановки вычислений. Однако этот метод снижает общую энергоэффективность и может замедлить выполнение основных задач.
Второй способ — устанавливать минимальный порог энергопотребления на уровне самих ИИ-ускорителей, что также не способствует энергоэффективности.
Третий и наиболее перспективный подход — использование систем накопления энергии. В моменты низкого потребления они заряжаются, а при скачке нагрузки отдают накопленную энергию, сглаживая колебания.
Google уже давно размещает литий-ионные батареи непосредственно в серверных стойках. NVIDIA для своих стоек GB300 NVL72 разработала специальный буфер, снижающий пиковую нагрузку на сеть до 30%.