Как Reddit стал золотой жилой для компаний, разрабатывающих ИИ

Интересный парадокс: платформа, которая когда-то боролась с ИИ-компаниями, теперь — их главный партнер. Reddit, занимающий пятое место по посещаемости среди всех сайтов США (по данным на октябрь), стал желанным партнером для разработчиков искусственного интеллекта.

И причина проста — данные, огромное количество структурированных пользовательских данных, накопленных за 19 лет существования платформы.

Почему именно Reddit?

Февраль 2024 года стал поворотным моментом в истории Reddit. Google объявила о соглашении стоимостью $60 млн в год, которое позволит использовать данные платформы для обучения своих ИИ-систем.

OpenAI также заключила аналогичную сделку, хотя точная сумма не разглашается. Как отметил генеральный директор и соучредитель Reddit Стив Хаффман: «Это гонка вооружений. Мы ведем переговоры со всеми, посмотрим, к чему это приведет».

Reddit обладает уникальными преимуществами для компаний, разрабатывающих ИИ:

1. Структурированные данные: контент организован по темам;

2. Система голосования вместо алгоритмов для оценки качества;

3. Высокая искренность пользовательских постов;

4. Огромный объем данных: только за первое полугодие 2024 года пользователи создали более 5,3 млрд единиц контента (на 20,5% больше по сравнению со второй половиной 2020 года).

Как отмечает Джейми Севилья, директор исследовательского института Epoch AI, система голосования и карма на Reddit могут служить индикаторами качества контента для ИИ-моделей. В отличие от других социальных платформ, где популярность измеряется только «лайками» или количеством подписчиков, система Reddit более комплексная и информативная.

Reddit отвечает взаимностью

Стратегия монетизации данных принесла впечатляющие результаты. За первые 9 месяцев 2024 года доходы Reddit от лицензирования данных достигли $81,6 млн по сравнению с $12,3 млн годом ранее.

Хотя это все еще меньше, чем доходы от рекламы, темпы роста впечатляют инвесторов — акции компании за последние 3 месяца выросли более чем вдвое. К середине марта 2024 года акции Reddit (RDDT) достигли отметки в $169 за акцию.

Важно отметить, что компании заинтересованы не только в исторических данных за 19 лет, но и в постоянном потоке новой информации. «Это как манна небесная», — отмечает Ари Моркос, генеральный директор Dataology AI.

В марте 2024 года Reddit запустил собственный ИИ-инструмент — Reddit Answers. Эта функция позволяет пользователям получать структурированные ответы на вопросы, используя огромную базу обсуждений платформы. Система работает на основе собственных ИИ-моделей Reddit в сочетании с технологиями OpenAI и Google Cloud.

Например, если пользователь спрашивает: «Какие есть советы для улучшения сна?», система предоставляет структурированный ответ в формате маркированного списка, похожий на ответы ChatGPT или Perplexity, с возможностью просмотра исходных обсуждений.

На данный момент Reddit Answers доступен:

— Только для пользователей из США;

— Только на английском языке;

— Через веб-браузер или iOS (версия для Android в разработке);

— Только для SFW-контента;

— Не работает со старым интерфейсом платформы.

Система предоставляет не только краткие ответы, но и ссылки на исходные обсуждения, позволяя пользователям углубиться в интересующие их темы. При этом важно помнить, что ответы пользователей Reddit не проходят профессиональную проверку, поэтому даже точное обобщение AI может содержать предвзятую или неточную информацию.

Борьба за данные и новые горизонты

За последние шесть месяцев Reddit активно блокировал попытки сбора данных компаниями, отказывающимися платить за доступ к контенту. При этом платформа не стоит на месте: помимо Reddit Answers, компания использует ИИ для перевода контента и предоставления аналитических данных брендам.

Запуск Reddit Answers — это часть более масштабной трансформации в мире поисковых систем:

— OpenAI запустила веб-поиск в ChatGPT для платных подписчиков;

— Apple представила обновленную версию Siri;

— Meta разрабатывает собственный поисковый инструмент Meta AI*;

— Google интегрирует ИИ-генерируемые сводки в результаты поиска и развивает Gemini AI.

История Reddit демонстрирует, как компания превратила потенциальную угрозу в возможность для роста. Вместо борьбы с ИИ-компаниями платформа создала взаимовыгодное партнерство, которое не только принесло финансовую выгоду, но и стимулировало развитие собственных ИИ-инструментов. При этом Reddit сохраняет баланс между монетизацией данных и защитой приватности пользователей — личные сообщения по-прежнему остаются недоступными для ИИ-компаний.

*признана экстремистской и запрещена в РФ

Автор: Ирина Задорожная
Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.