Яндекс и востоковеды создали ИИ для анализа восточных языков

Специалисты Яндекса в сотрудничестве с Институтом востоковедения РАН разработали систему искусственного интеллекта, которая значительно ускоряет анализ данных на восточных языках. Новый инструмент позволяет исследователям ежедневно обрабатывать до тысячи первоисточников из стран Азии, Африки и Ближнего Востока.

Интеллектуальный помощник создан на базе платформы для разработки ИИ-приложений Yandex AI Studio. В обучении генеративных моделей принимали участие специалисты платформы Yandex Cloud и студенты Школы анализа данных.

Интересуетесь ИИ? Международный клуб ShareAI Александра Горного - объединяет тех, кто хочет внедрить в свой бизнес или работу ИИ или погрузиться в эту тему. Онлайн и оффлайн.
Узнать подробнее про клуб ShareAI

Система обрабатывает научные тексты, выделяет в них ключевые факты и формирует краткие аналитические выжимки. Помимо этого, решение анализирует публикации в китайских СМИ и создает русскоязычные дайджесты, что позволяет ученым оперативно получать информацию о событиях в регионе. Для информационного наполнения использован архив востоковедческих знаний, созданный на основе публикаций Института востоковедения РАН.

На сегодняшний день база ИИ-помощника превышает 1,5 миллиона документов. В ней представлены материалы на четырех вариантах китайского языка — континентальном, тайваньском, гонконгском и сингапурском. В планах разработчиков — расширение языковой поддержки. В будущем система сможет работать с японским, арабским, турецким, персидским и другими восточными языками, что предоставит российским исследователям прямой доступ к уникальным корпусам знаний.

«Институт востоковедения РАН проходит масштабную цифровую трансформацию, в центре которой — системная интеграция ИИ-технологий для работы с первоисточниками. Партнерство с Яндексом позволяет нам существенно расширить объем и глубину анализа материалов, сохраняя фундаментальность академического подхода», — отметил директор Института востоковедения РАН Аликбер Аликберов.

По словам старшего научного сотрудника Института востоковедения РАН Александра Костыркина, раньше ученые сталкивались с тем, что анализ материалов занимал много времени и ограничивал количество обрабатываемых источников. С помощью искусственного интеллекта этот процесс значительно ускорился: время поиска и анализа сократилось с нескольких часов до 10-15 минут на одну исследовательскую задачу.

Это дает востоковедам возможность обрабатывать больше материалов ежедневно, проводить более глубокий анализ и получать полное представление о тенденциях в изучаемых регионах. Такой подход позволяет сохранить фундаментальность академического востоковедения, дополнив его современными технологиями для более эффективной обработки информации.

Автор: Александр Чернов
Журналист с техническим бэкграундом, пишущий о практических аспектах внедрения искусственного интеллекта. Бывший главред федерального издания. Любит сбалансированную подачу информации без хайпа.