Mistral публикует углеродный след своей ИИ-модели

Компания Mistral AI опубликовала первую в индустрии комплексную оценку жизненного цикла большой языковой модели, устанавливая новые стандарты прозрачности для всей ИИ-отрасли.

Исследователи компании впервые определили экологический след единичного запроса к ИИ-системе. Один ответ от сервиса Le Chat (около 400 токенов) приводит к выбросу 1,14 грамма CO₂, расходу 45 миллилитров воды и 0,16 миллиграмма сурьмы. Наиболее ресурсозатратным этапом оказалось первичное обучение модели, на которое приходится 85,5% общих выбросов парниковых газов и 91% потребления воды.

Исследование детально раскрывает экологические издержки, связанные с разработкой и эксплуатацией флагманской модели Mistral Large 2.

По данным отчета, к январю языковая модель произвела 20,4 килотонны CO₂ в эквиваленте, потребила 281 000 кубометров воды и использовала ресурсы, эквивалентные 660 килограммам сурьмы. Этот редкий металл служит эталоном для измерения расхода минеральных ресурсов, необходимых в производстве вычислительного оборудования.

Для сравнения, глава OpenAI Сэм Альтман ранее утверждал, что ChatGPT расходует лишь 0,32 миллилитра воды на запрос — менее 1% от показателей Mistral. Однако отсутствие комплексной экологической отчетности от OpenAI затрудняет объективное сопоставление этих данных.

Отчет подтверждает прямую зависимость между размером языковой модели и ее воздействием на окружающую среду.

Модель, превосходящая другую в десять раз по количеству параметров, оказывает приблизительно в десять раз более сильное экологическое воздействие при равном количестве сгенерированных токенов. Это наблюдение подчеркивает необходимость оптимального выбора масштаба модели для конкретных задач.

На основе проведенного анализа Mistral AI предлагает внедрить три ключевых отраслевых показателя: совокупное влияние процесса обучения модели, экологические издержки на один запрос и соотношение воздействия одного запроса к общему жизненному циклу.

Компания считает обязательным публичное раскрытие первых двух метрик для повышения прозрачности индустрии искусственного интеллекта.

Автор: Ирина Задорожная
Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.