DeepSeek V4 Pro обошёл GPT-5.5 Pro по точности — 38 против 33

DeepSeek V4 Pro обошёл GPT-5.5 Pro по точности — 38 против 33

DeepSeek V4 Pro набрал 38 очков против 33 у GPT-5.5 Pro в прямом сравнении на задачах, где главное — точность следования инструкциям. Тестирование провёл технический ресурс RuntimeWire, задачи генерировались непосредственно перед запуском, чтобы ни одна из моделей не могла подготовиться заранее. Оценивала результаты модель Grok от xAI.

Самый показательный тест — код для маскировки данных в логах. DeepSeek написал одно регулярное выражение с единым приоритетом обработки паттернов: адреса e-mail, IP-адреса и номера тикетов не конфликтуют между собой. GPT-5.5 Pro разбил задачу на несколько отдельных регулярных выражений — формально работает, но при пересечении паттернов порядок обработки становится непредсказуемым.

На задаче с деловым письмом картина та же. GPT-5.5 Pro добавил детали, которых никто не просил: процедуры передачи смены, инструкции по эскалации, переадресацию на отдел Operations Planning. DeepSeek написал ровно то, что было в задании.

В задаче на структурирование JSON по итогам встречи GPT-5.5 Pro нарушил схему: добавил условный текст в поле launch_date, а в blocked_by вернул массив вместо одиночного значения. DeepSeek заполнил поля строго по схеме — без отклонений.

Единственная задача, где обе модели получили одинаковые баллы — нормализация заказов в JSON. Обе справились корректно.

Паттерн везде одинаковый: GPT-5.5 Pro склонен к «творческой интерпретации» — добавляет контекст сверх задания, импровизирует там, где нужна буквальность. Это не ошибки в привычном смысле, но именно такие отклонения ломают системы, которые ожидают предсказуемого вывода.

DeepSeek — китайская лаборатория, которая за последние полтора года превратилась в одного из главных конкурентов OpenAI по качеству фронтирных моделей. V4 Pro — её текущий флагман.

Юлия Самойлова
Юлия Самойлова

Пишет о технологиях искусственного интеллекта с 2019 года. Специализируется на материалах о практическом применении ИИ в различных отраслях.