X опубликовала код рекомендательного алгоритма соцсети

Соцсеть X опубликовала исходный код обновленного рекомендательного алгоритма. Илон Маск анонсировал это, назвав его алгоритмом следующего поколения. Код определяет, какие органические и рекламные посты видят пользователи.

Репозиторий появился на GitHub. Маск обещал обновлять его каждые четыре недели. Это позволит отслеживать изменения в том, как соцсеть формирует ленту.

Интересуетесь ИИ? Международный клуб ShareAI Александра Горного - объединяет тех, кто хочет внедрить в свой бизнес или работу ИИ или погрузиться в эту тему. Онлайн и оффлайн.
Узнать подробнее про клуб ShareAI

Алгоритм работает в несколько этапов. Сначала система берет посты от аккаунтов, на которые подписан пользователь. К ним добавляют материалы из внешних источников — профилей, которые пользователь не читает.

Из получившегося набора исключают дубликаты, слишком старые публикации и те, что пользователь уже видел. Это базовая фильтрация перед основным ранжированием.

Дальше учитываются личные предпочтения. Пользователь не увидит посты с игнорируемыми ключевыми словами или от заблокированных аккаунтов. Система уважает настройки приватности и фильтры.

Ранжирование результатов происходит через модель Phoenix. Это трансформер на основе Grok — собственной языковой модели X.

Phoenix анализирует множество факторов. Есть ли в посте изображения или видео. Информация о профиле автора. Наличие у него подписки и верификации. Все это влияет на позицию публикации в ленте.

Затем модель оценивает пост, чтобы предсказать, понравится ли он конкретному пользователю. Чем выше оценка, тем выше пост в ленте.

Последний раз X публиковала исходный код в 2023 году. Но The Verge отмечало, что тот репозиторий безнадежно устарел. Новая версия должна быть актуальной благодаря регулярным обновлениям.

Публикация кода — шаг к прозрачности. Пользователи и исследователи смогут понять, почему видят те или иные посты. Можно будет проверить, как система обрабатывает разные факторы.

Но есть нюанс. Код показывает механику алгоритма, но не раскрывает данные для обучения модели Phoenix. Без этих данных полностью воспроизвести систему невозможно.

Также неясно, насколько полон опубликованный код. Возможно, некоторые части остались закрытыми по соображениям безопасности или коммерческой тайны.

Тем не менее, это больше прозрачности, чем у конкурентов. Другие соцсети держат алгоритмы в секрете. X под управлением Маска делает ставку на открытость, по крайней мере частичную.

Регулярные обновления каждые четыре недели покажут, как алгоритм эволюционирует. Можно будет отследить изменения в приоритетах и механиках ранжирования. Это даст представление о направлении развития платформы.

Автор: Александр Чернов
Журналист с техническим бэкграундом, пишущий о практических аспектах внедрения искусственного интеллекта. Бывший главред федерального издания. Любит сбалансированную подачу информации без хайпа.