Claude Opus 4.5 превзошел людей в задаче для инженеров

Anthropic столкнулась с необычной проблемой - их ИИ-модель стала слишком хороша для тестового задания при найме. Claude Opus 4.5 решает задачу на оптимизацию кода быстрее и эффективнее живых кандидатов. Теперь компания открыла задание публично и предлагает всем попробовать обойти ИИ.

Тест изначально создавали для отбора performance-инженеров. Задача требует оптимизировать ядро для симулированного процессора, похожего на GPU. Нужно упаковать векторы, распределить операции и добиться минимального числа тактов выполнения.

Проблема в том, что Claude Opus 4.5 побил все человеческие рекорды. За два часа лучшие кандидаты достигают примерно 1790 тактов. Модель за то же время выдает 1579. Разница существенная - больше 10%.

Но это не предел для ИИ. Дав модели 11,5 часов, разработчики получили результат 1487 тактов. Именно эту планку Anthropic установила как цель для желающих побить рекорд. Кто справится лучше, тому обещают рассмотреть резюме и возможное приглашение на собеседование.

Компания выложила полный набор инструментов - симулятор процессора, тесты на корректность и визуализатор для отладки. Любой может скачать, попробовать и сравнить свой результат с ИИ.

Решение открыть задание говорит о многом. Во-первых, Anthropic уверена, что люди не легко обойдут модель. Иначе бы не рисковали репутацией. Во-вторых, это умный способ рекрутинга - те немногие, кто сможет победить Claude, действительно выдающиеся специалисты.

Ситуация поднимает философский вопрос о будущем технических собеседований. Если ИИ решает задачи лучше кандидатов, зачем эти задачи? Получается, тест измеряет не профессионализм, а способность превзойти машину в узкой задаче.

С другой стороны, это показывает реальные возможности современных моделей. Claude Opus 4.5 не просто генерирует код по шаблону. Он понимает оптимизацию, находит узкие места и придумывает эффективные решения. Это уровень работы опытного инженера.

Для разработчиков это вызов. Многие захотят проверить себя против ИИ, даже если не ищут работу. Anthropic получает внимание сообщества и демонстрирует силу своей модели.

Остается вопрос - найдется ли человек, который пройдет планку в 1487 тактов? И если найдется, что это скажет о пределах текущих моделей ИИ?