Интересный парадокс: платформа, которая когда-то боролась с ИИ-компаниями, теперь - их главный партнер. Reddit, занимающий пятое место по посещаемости среди всех сайтов США (по данным на октябрь), стал желанным партнером для разработчиков искусственного интеллекта.
И причина проста - данные, огромное количество структурированных пользовательских данных, накопленных за 19 лет существования платформы.
Почему именно Reddit?
Февраль 2024 года стал поворотным моментом в истории Reddit. Google объявила о соглашении стоимостью $60 млн в год, которое позволит использовать данные платформы для обучения своих ИИ-систем.
OpenAI также заключила аналогичную сделку, хотя точная сумма не разглашается. Как отметил генеральный директор и соучредитель Reddit Стив Хаффман: “Это гонка вооружений. Мы ведем переговоры со всеми, посмотрим, к чему это приведет”.
Reddit обладает уникальными преимуществами для компаний, разрабатывающих ИИ:
-
Структурированные данные: контент организован по темам;
-
Система голосования вместо алгоритмов для оценки качества;
-
Высокая искренность пользовательских постов;
-
Огромный объем данных: только за первое полугодие 2024 года пользователи создали более 5,3 млрд единиц контента (на 20,5% больше по сравнению со второй половиной 2020 года).
Как отмечает Джейми Севилья, директор исследовательского института Epoch AI, система голосования и карма на Reddit могут служить индикаторами качества контента для ИИ-моделей. В отличие от других социальных платформ, где популярность измеряется только “лайками” или количеством подписчиков, система Reddit более комплексная и информативная.
Reddit отвечает взаимностью
Стратегия монетизации данных принесла впечатляющие результаты. За первые 9 месяцев 2024 года доходы Reddit от лицензирования данных достигли $81,6 млн по сравнению с $12,3 млн годом ранее.
Хотя это все еще меньше, чем доходы от рекламы, темпы роста впечатляют инвесторов - акции компании за последние 3 месяца выросли более чем вдвое. К середине марта 2024 года акции Reddit (RDDT) достигли отметки в $169 за акцию.
Важно отметить, что компании заинтересованы не только в исторических данных за 19 лет, но и в постоянном потоке новой информации. “Это как манна небесная”, - отмечает Ари Моркос, генеральный директор Dataology AI.
В марте 2024 года Reddit запустил собственный ИИ-инструмент - Reddit Answers. Эта функция позволяет пользователям получать структурированные ответы на вопросы, используя огромную базу обсуждений платформы. Система работает на основе собственных ИИ-моделей Reddit в сочетании с технологиями OpenAI и Google Cloud.
Например, если пользователь спрашивает: “Какие есть советы для улучшения сна?”, система предоставляет структурированный ответ в формате маркированного списка, похожий на ответы ChatGPT или Perplexity, с возможностью просмотра исходных обсуждений.
На данный момент Reddit Answers доступен:
-
Только для пользователей из США;
-
Только на английском языке;
-
Через веб-браузер или iOS (версия для Android в разработке);
-
Только для SFW-контента;
-
Не работает со старым интерфейсом платформы.
Система предоставляет не только краткие ответы, но и ссылки на исходные обсуждения, позволяя пользователям углубиться в интересующие их темы. При этом важно помнить, что ответы пользователей Reddit не проходят профессиональную проверку, поэтому даже точное обобщение AI может содержать предвзятую или неточную информацию.
Борьба за данные и новые горизонты
За последние шесть месяцев Reddit активно блокировал попытки сбора данных компаниями, отказывающимися платить за доступ к контенту. При этом платформа не стоит на месте: помимо Reddit Answers, компания использует ИИ для перевода контента и предоставления аналитических данных брендам.
Запуск Reddit Answers - это часть более масштабной трансформации в мире поисковых систем:
-
OpenAI запустила веб-поиск в ChatGPT для платных подписчиков;
-
Apple представила обновленную версию Siri;
-
Meta разрабатывает собственный поисковый инструмент Meta AI*;
-
Google интегрирует ИИ-генерируемые сводки в результаты поиска и развивает Gemini AI.
История Reddit демонстрирует, как компания превратила потенциальную угрозу в возможность для роста. Вместо борьбы с ИИ-компаниями платформа создала взаимовыгодное партнерство, которое не только принесло финансовую выгоду, но и стимулировало развитие собственных ИИ-инструментов. При этом Reddit сохраняет баланс между монетизацией данных и защитой приватности пользователей - личные сообщения по-прежнему остаются недоступными для ИИ-компаний.
*признана экстремистской и запрещена в РФ