Специалисты Яндекса в сотрудничестве с Институтом востоковедения РАН разработали систему искусственного интеллекта, которая значительно ускоряет анализ данных на восточных языках. Новый инструмент позволяет исследователям ежедневно обрабатывать до тысячи первоисточников из стран Азии, Африки и Ближнего Востока.
Интеллектуальный помощник создан на базе платформы для разработки ИИ-приложений Yandex AI Studio. В обучении генеративных моделей принимали участие специалисты платформы Yandex Cloud и студенты Школы анализа данных.
Узнать подробнее про клуб ShareAI
Система обрабатывает научные тексты, выделяет в них ключевые факты и формирует краткие аналитические выжимки. Помимо этого, решение анализирует публикации в китайских СМИ и создает русскоязычные дайджесты, что позволяет ученым оперативно получать информацию о событиях в регионе. Для информационного наполнения использован архив востоковедческих знаний, созданный на основе публикаций Института востоковедения РАН.
На сегодняшний день база ИИ-помощника превышает 1,5 миллиона документов. В ней представлены материалы на четырех вариантах китайского языка — континентальном, тайваньском, гонконгском и сингапурском. В планах разработчиков — расширение языковой поддержки. В будущем система сможет работать с японским, арабским, турецким, персидским и другими восточными языками, что предоставит российским исследователям прямой доступ к уникальным корпусам знаний.
«Институт востоковедения РАН проходит масштабную цифровую трансформацию, в центре которой — системная интеграция ИИ-технологий для работы с первоисточниками. Партнерство с Яндексом позволяет нам существенно расширить объем и глубину анализа материалов, сохраняя фундаментальность академического подхода», — отметил директор Института востоковедения РАН Аликбер Аликберов.
По словам старшего научного сотрудника Института востоковедения РАН Александра Костыркина, раньше ученые сталкивались с тем, что анализ материалов занимал много времени и ограничивал количество обрабатываемых источников. С помощью искусственного интеллекта этот процесс значительно ускорился: время поиска и анализа сократилось с нескольких часов до 10-15 минут на одну исследовательскую задачу.
Это дает востоковедам возможность обрабатывать больше материалов ежедневно, проводить более глубокий анализ и получать полное представление о тенденциях в изучаемых регионах. Такой подход позволяет сохранить фундаментальность академического востоковедения, дополнив его современными технологиями для более эффективной обработки информации.

