В мире ИИ-моделей произошло значимое событие. После периода закрытого тестирования в API компании, запущенного в октябре 2024 года, модель наконец стала доступна всем пользователям через веб-интерфейс и мобильные приложения Claude на iOS и Android.
Технические характеристики и возможности
Главная особенность новой модели — впечатляющее соотношение скорости и производительности.
Особенно впечатляет контекстное окно в 200 000 токенов — это существенно превосходит возможности конкурентов, включая GPT-4 и GPT-4o от OpenAI с их ограничением в 128 000 токенов. Такой объем позволяет модели обрабатывать масштабные массивы информации за один подход.
Anthropic особо отмечает сильные стороны новой модели: рекомендации по программированию, извлечение и маркировка данных, а также модерация контента. Важное улучшение по сравнению с предшественником — способность генерировать более длинные тексты.
По данным независимой организации Artificial Analysis, Claude 3.5 Haiku демонстрирует время получения первого токена (TTFT) всего 0.80 секунды, хотя общая скорость вывода составляет 65.1 токенов в секунду, что несколько ниже среднего показателя.
При работе через чат-интерфейс Claude модель демонстрирует впечатляющие возможности по анализу изображений и работе с файловыми вложениями, что делает её особенно полезной для мультимедийных задач и рабочих процессов с большими наборами документов.
Однако важно отметить, что сама модель 3.5 Haiku не поддерживает анализ изображений, что делает её менее функциональной в этом аспекте по сравнению с другими доступными моделями Anthropic — 3 Haiku и 3.5 Sonnet.
В ходе тестирования модель продемонстрировала исключительную производительность в ряде задач. Например, используя функционал Claude Artifacts (интерактивная боковая панель, представленная в июне 2024 года), Haiku смог создать полностью работающую версию игры Pong менее чем за минуту.
Модель показала результат 40.6% в тесте SWE-bench Verified — это серьёзный показатель для оценки качества программирования.
При этом у модели есть и определённые ограничения. В отличие от некоторых конкурентов, таких как GPT-4o и GPT-4, Claude 3.5 Haiku не поддерживает веб-браузинг и генерацию изображений.
Интересный факт: модель не прошла так называемый «Клубничный тест» — популярное пользовательское испытание, где ИИ должен идентифицировать все три буквы «r» в слове «strawberry».
История запуска и ценообразование
Запуск модели не обошелся без противоречий. Изначально Anthropic заявляла, что 3.5 Haiku будет стоить столько же, сколько и 3 Haiku, но позже изменила решение, аргументируя это повышенным «интеллектом» новой модели, что привело к увеличению стоимости API.
В бесплатной версии пользователи получают ограниченное количество сообщений в день (около 10 обменов или 20 сообщений), которое обновляется ежедневно.
Для более интенсивного использования доступна подписка Claude Pro за $20 в месяц, которая увеличивает лимит в пять раз и предоставляет приоритетный доступ в периоды высокой нагрузки, а также ранний доступ к новым функциям и дополнительным моделям, включая Claude 3 Opus.
Для разработчиков, использующих API, стоимость составляет $0.80 за миллион входящих токенов и $4 за миллион исходящих. Доступны дополнительные способы оптимизации расходов: кэширование промптов может сэкономить до 90% затрат, а использование Message Batches API снижает стоимость на 50%.
Конкурентная среда
Выход Claude 3.5 Haiku происходит в интересный момент, когда основные конкуренты также представляют свои новые разработки. OpenAI недавно выпустила модели o1 и o1-mini, а Google представил Gemini 2. В этом контексте Haiku позиционируется как оптимальное решение для задач, требующих баланса между скоростью и точностью.
Модель особенно хорошо проявляет себя в обработке больших датасетов, анализе финансовых документов и работе с длинным контекстом. Интеграция с системой Artifacts добавляет дополнительную функциональность, позволяя не только генерировать контент, но и работать с ним в реальном времени.
Claude 3.5 Haiku представляет собой важный шаг в развитии технологий ИИ, демонстрируя, как можно достичь баланса между производительностью и доступностью. Несмотря на то, что это более «легкая» версия в линейке Claude 3, она способна конкурировать и даже превосходить предыдущий флагман компании — модель 3 Opus — по определенным показателям.
Успех модели будет во многом зависеть от того, насколько пользователи оценят преимущества повышенной скорости работы и эффективности в сравнении с новыми предложениями конкурентов. Уже сейчас ясно, что Claude 3.5 Haiku — это серьёзная заявка Anthropic на лидерство в сегменте быстрых и эффективных ИИ-моделей.