Компания выпустила модель R1 1776 – модифицированную версию DeepSeek-R1. Из которой была удалена цензура Коммунистической партии Китая, сохранив при этом мощные возможности рассуждения. Для создания модели команда Perplexity AI использовала фреймворк NeMo 2.0 от Nvidia.
Процесс дообучения начался с ручного отбора 300 цензурированных тем, на основе которых с помощью специального классификатора были собраны реальные диалоги пользователей. После обработки и сбора фактически точных ответов модель прошла дополнительную тонкую настройку. Тестирование показало впечатляющие результаты: R1 1776 демонстрирует даже меньший уровень китайской цензуры, чем o3-mini и Claude 3.5.
При этом общая производительность модели практически не пострадала, показав снижение лишь на доли процента в некоторых тестах. Удивительным образом на тесте AIME 2024 производительность даже увеличилась на один процентный пункт.
Особую значимость релизу придает тот факт, что R1 1776 стала первой моделью с открытым исходным кодом от Perplexity AI. Это решение демонстрирует новый подход к развитию искусственного интеллекта, где прозрачность и отсутствие цензуры становятся ключевыми приоритетами.
Наглядным примером эффективности обновления служит изменение ответов модели на чувствительные темы.