Новая модель Anthropic Claude Opus 4.5: прорыв в мире ИИ и вызовы кибербезопасности

Anthropic представила Claude Opus 4.5 — свою новую модель искусственного интеллекта, которую компания называет лучшей в мире для программирования, работы с агентами и использованием компьютера. Эта модель обещает превзойти конкурентов в различных задачах кодирования и аналитики, включая глубокие исследования, работу с презентациями и заполнение таблиц.

Claude Opus 4.5 уже доступна через приложения Anthropic, API и крупнейших облачных провайдеров. Компания также обновила инструменты для программистов и пользователей, добавив поддержку долгосрочных агентов и новые способы интеграции с Excel, браузером Chrome и настольными компьютерами.

Однако, несмотря на прогресс, модель сталкивается с серьезными проблемами в области кибербезопасности. Особое внимание уделяется атакам типа «prompt injection», когда вредоносные команды маскируются в данных, которые ИИ обрабатывает, заставляя его нарушать защитные меры. Anthropic утверждает, что Claude Opus 4.5 сложнее обмануть такими атаками, чем другие современные модели, но полностью защититься от них пока не удается.

Тестирование модели показало, что она отказалась выполнять 100% вредоносных запросов, связанных с кодированием, но в задачах, связанных с созданием вредоносного ПО и несанкционированным мониторингом, отказ был около 78%. В функциях компьютерного использования, таких как слежка или сбор данных, уровень отказа составил чуть более 88%, что указывает на продолжающиеся вызовы в обеспечении безопасности.

В целом, Claude Opus 4.5 представляет собой значительный шаг вперёд в развитии ИИ-агентов, но вопросы безопасности и защиты от злоупотреблений остаются актуальными и требуют дальнейшего внимания и улучшений.