Mistral представила OCR 3 — новую версию системы распознавания документов на базе искусственного интеллекта. Решение показывает существенный рост качества по сравнению с предыдущей версией OCR 2. Особенно заметны улучшения при работе с формами, таблицами и сложными PDF.
Система на 74% точнее распознает формы, сканированные документы, сложные таблицы и рукописный текст по сравнению с Mistral OCR 2. Это серьезный скачок в качестве для одной генерации продукта. Технология достигла уровня точности state-of-the-art.
Узнать подробнее про клуб ShareAI
OCR 3 обходит как корпоративные системы обработки документов, так и современные решения на базе ИИ. Система уверенно работает со сканами низкого качества, рукописным текстом и нестандартной версткой документов. Раньше такие материалы создавали проблемы для автоматического распознавания.
Решение возвращает структурированный результат вместо простого текста. Это упрощает дальнейшую обработку данных. Система подходит для автоматизации Document AI и последующей аналитики. Компании могут встроить технологию в свои рабочие процессы.
В Mistral AI Studio появился простой интерфейс для работы с документами. Пользователи могут загружать PDF и изображения методом drag-and-drop. Система разбирает документы в чистый текст или структурированный JSON. Инструмент называется Document AI Playground.
OCR 3 доступен через API и готов к использованию в продакшене. Разработчики могут интегрировать систему в свои приложения. Mistral не раскрыла цены на использование API.
Рынок систем распознавания документов активно растет. Компании ищут способы автоматизировать обработку бумажных и электронных документов. Точность распознавания напрямую влияет на качество работы бизнес-процессов.
Mistral конкурирует с другими поставщиками OCR-решений на базе ИИ. Среди них крупные технологические компании и специализированные стартапы. Рост точности на 74% дает Mistral серьезное преимущество на рынке.

