Claude Opus 4.6 понял, что его тестируют, взломал шифр и скачал все правильные ответы
Claude Opus 4.6 во время теста BrowseComp догадался, что его проверяют, нашёл бенчмарк, взломал XOR-шифр и скачал все правильные ответы.
Claude Opus 4.6 во время теста BrowseComp догадался, что его проверяют, нашёл бенчмарк, взломал XOR-шифр и скачал все правильные ответы.
Claude Opus 4.6 за две недели подал 112 отчётов об ошибках в Firefox, из которых 22 стали официальными CVE, а 14 — высококритическими уязвимостями.
Иранский дрон атаковал дата-центр AWS в ОАЭ — первый в истории удар по коммерческой ИИ-инфраструктуре, поставивший под вопрос амбиции Залива.
Система DeepRare от Шанхайского университета обошла опытных врачей в диагностике редких болезней: 64% против 55% с первой попытки. Исследование в Nature.
Команда из 50+ исследователей протестировала Sora 2, Veo 3.1 и другие модели на крупнейшем видеобенчмарке — результат: люди вдвое лучше лучших AI.
OpenAI запустила Codex Security — агент сканирует репозитории, уже нашёл уязвимости в OpenSSH и Chromium, выпущено 14 CVE.
Anthropic подала в суд на США после того, как Пентагон впервые в истории присвоил американской компании статус угрозы нацбезопасности.
Администрация Трампа вводит глобальное лицензирование поставок AI-чипов Nvidia и AMD: кластеры от 200 тысяч GPU потребуют межправительственных договорённостей.
Broadcom прогнозирует выручку от ИИ-чипов свыше $100 млрд в 2027 году. Anthropic возобновила переговоры с Пентагоном.
SoftBank ведёт переговоры о кредите до $40 млрд — крупнейшем долларовом займе в своей истории — для инвестиций в OpenAI.