Интересный парадокс: платформа, которая когда-то боролась с ИИ-компаниями, теперь — их главный партнер. Reddit, занимающий пятое место по посещаемости среди всех сайтов США (по данным на октябрь), стал желанным партнером для разработчиков искусственного интеллекта.
И причина проста — данные, огромное количество структурированных пользовательских данных, накопленных за 19 лет существования платформы.
Почему именно Reddit?
Февраль 2024 года стал поворотным моментом в истории Reddit. Google объявила о соглашении стоимостью $60 млн в год, которое позволит использовать данные платформы для обучения своих ИИ-систем.
OpenAI также заключила аналогичную сделку, хотя точная сумма не разглашается. Как отметил генеральный директор и соучредитель Reddit Стив Хаффман: «Это гонка вооружений. Мы ведем переговоры со всеми, посмотрим, к чему это приведет».
Reddit обладает уникальными преимуществами для компаний, разрабатывающих ИИ:
1. Структурированные данные: контент организован по темам;
2. Система голосования вместо алгоритмов для оценки качества;
3. Высокая искренность пользовательских постов;
4. Огромный объем данных: только за первое полугодие 2024 года пользователи создали более 5,3 млрд единиц контента (на 20,5% больше по сравнению со второй половиной 2020 года).
Как отмечает Джейми Севилья, директор исследовательского института Epoch AI, система голосования и карма на Reddit могут служить индикаторами качества контента для ИИ-моделей. В отличие от других социальных платформ, где популярность измеряется только «лайками» или количеством подписчиков, система Reddit более комплексная и информативная.
Reddit отвечает взаимностью
Стратегия монетизации данных принесла впечатляющие результаты. За первые 9 месяцев 2024 года доходы Reddit от лицензирования данных достигли $81,6 млн по сравнению с $12,3 млн годом ранее.
Хотя это все еще меньше, чем доходы от рекламы, темпы роста впечатляют инвесторов — акции компании за последние 3 месяца выросли более чем вдвое. К середине марта 2024 года акции Reddit (RDDT) достигли отметки в $169 за акцию.
Важно отметить, что компании заинтересованы не только в исторических данных за 19 лет, но и в постоянном потоке новой информации. «Это как манна небесная», — отмечает Ари Моркос, генеральный директор Dataology AI.
В марте 2024 года Reddit запустил собственный ИИ-инструмент — Reddit Answers. Эта функция позволяет пользователям получать структурированные ответы на вопросы, используя огромную базу обсуждений платформы. Система работает на основе собственных ИИ-моделей Reddit в сочетании с технологиями OpenAI и Google Cloud.
Например, если пользователь спрашивает: «Какие есть советы для улучшения сна?», система предоставляет структурированный ответ в формате маркированного списка, похожий на ответы ChatGPT или Perplexity, с возможностью просмотра исходных обсуждений.
На данный момент Reddit Answers доступен:
— Только для пользователей из США;
— Только на английском языке;
— Через веб-браузер или iOS (версия для Android в разработке);
— Только для SFW-контента;
— Не работает со старым интерфейсом платформы.
Система предоставляет не только краткие ответы, но и ссылки на исходные обсуждения, позволяя пользователям углубиться в интересующие их темы. При этом важно помнить, что ответы пользователей Reddit не проходят профессиональную проверку, поэтому даже точное обобщение AI может содержать предвзятую или неточную информацию.
Борьба за данные и новые горизонты
За последние шесть месяцев Reddit активно блокировал попытки сбора данных компаниями, отказывающимися платить за доступ к контенту. При этом платформа не стоит на месте: помимо Reddit Answers, компания использует ИИ для перевода контента и предоставления аналитических данных брендам.
Запуск Reddit Answers — это часть более масштабной трансформации в мире поисковых систем:
— OpenAI запустила веб-поиск в ChatGPT для платных подписчиков;
— Apple представила обновленную версию Siri;
— Meta разрабатывает собственный поисковый инструмент Meta AI*;
— Google интегрирует ИИ-генерируемые сводки в результаты поиска и развивает Gemini AI.
История Reddit демонстрирует, как компания превратила потенциальную угрозу в возможность для роста. Вместо борьбы с ИИ-компаниями платформа создала взаимовыгодное партнерство, которое не только принесло финансовую выгоду, но и стимулировало развитие собственных ИИ-инструментов. При этом Reddit сохраняет баланс между монетизацией данных и защитой приватности пользователей — личные сообщения по-прежнему остаются недоступными для ИИ-компаний.
*признана экстремистской и запрещена в РФ