Cohere выпускает мультимодальную модель Embed 4

Новая модель Embed 4 способна анализировать документы объемом до 200 страниц благодаря расширенному контекстному окну в 128 000 токенов. Embed 4 не просто развивает мультимодальные возможности своего предшественника Embed 3, но и представляет свой подход к работе с неструктурированными данными.

“Существующие модели embeddings не способны нативно понимать сложные мультимодальные бизнес-материалы, что вынуждает компании разрабатывать громоздкие системы предварительной обработки данных”, — заявили в Cohere. Новая модель решает эту проблему, позволяя компаниям эффективно извлекать информацию из массивов неструктурированных данных.

Особое внимание в Embed 4 уделено работе в регулируемых отраслях, таких как финансы, здравоохранение и производство. Модель обучена работать с “несовершенными” корпоративными данными, сохраняя точность несмотря на опечатки и проблемы форматирования. Более того, она способна эффективно обрабатывать отсканированные документы и рукописный текст, что критически важно для работы с юридической документацией, страховыми счетами и квитанциями о расходах.

Cohere предоставляет гибкие возможности развертывания: Embed 4 может быть установлена как в виртуальных частных облаках, так и в локальных технологических стеках для обеспечения максимальной безопасности данных. Модель поддерживает более 100 языков и может использоваться для работы с инвестиционными презентациями, документами по комплексной проверке, отчетами о клинических испытаниях, руководствами по ремонту и продуктовой документацией.

Выпуск Embed 4 происходит на фоне растущего интереса к технологиям Retrieval Augmented Generation (RAG) в корпоративном секторе. Новая модель позволяет трансформировать документы в числовые представления для использования в RAG-системах, что открывает новые возможности для создания интеллектуальных агентов, способных эффективно работать с корпоративной информацией.