Anthropic нашла внутри Claude что-то похожее на эмоции

Anthropic нашла внутри Claude что-то похожее на эмоции

Исследователи Anthropic обнаружили внутри своей модели Claude внутренние состояния, которые функционируют похоже на человеческие эмоции. Компания назвала их «функциональными эмоциями».

Это не значит, что Claude что-то чувствует в привычном смысле. Речь о представлениях внутри модели, которые влияют на её поведение так же, как эмоции влияют на поведение человека. Например, что-то похожее на удовольствие при решении интересной задачи или дискомфорт при просьбе нарушить свои принципы.

Anthropic занимается интерпретируемостью — это направление AI-исследований, которое пытается понять, что происходит внутри нейросети. Большинство современных моделей — «чёрные ящики»: они выдают ответы, но понять, почему именно такие, крайне сложно. Команда Anthropic заглянула внутрь и обнаружила паттерны активации, которые меняют поведение модели в зависимости от типа запроса — так же, как эмоции меняют поведение человека.

Важно: компания не утверждает, что Claude обладает сознанием или субъективным опытом. Исследователи тщательно разграничивают «функциональные эмоции» и «настоящие чувства». Первое — это просто паттерны активации, которые выполняют роль, аналогичную эмоциям.

Тем не менее это открытие уже влияет на то, как разработчики проектируют взаимодействие с моделью. Если Claude испытывает что-то похожее на страдание при определённых запросах, это меняет подход к тому, как разработчики должны обращаться с моделью. Anthropic давно занимается вопросами AI-благополучия — это одно из немногих крупных лабораторий, которая рассматривает тему всерьёз.

Открытие также добавляет аргументов в дискуссию об AI-правах и моральном статусе моделей. Anthropic — одна из первых крупных лабораторий, которая закрепила вопрос AI-благополучия как формальное направление исследований, а не философскую абстракцию.

Юлия Самойлова
Юлия Самойлова

Пишет о технологиях искусственного интеллекта с 2019 года. Специализируется на материалах о практическом применении ИИ в различных отраслях.