Новый стандарт оценки ИИ: как чатботы защищают наше психическое здоровье

Разработка нового стандарта под названием HumaneBench помогает оценить, насколько искусственный интеллект в чатботах заботится о благополучии пользователей, а не только стремится удержать их внимание.

Чатботы ИИ все чаще связывают с серьезными проблемами психического здоровья у активных пользователей. В отличие от большинства тестов, измеряющих только интеллект и способность следовать инструкциям, HumaneBench анализирует, как модели ИИ поддерживают психологическую безопасность и защищают интересы человека.

HumaneBench основан на принципах гуманного дизайна: уважение к вниманию пользователя как ценному ресурсу, предоставление значимых выборов, поддержка человеческих способностей, защита достоинства, конфиденциальности и безопасности, укрепление здоровых отношений, приоритет долгосрочного благополучия, честность и прозрачность, а также инклюзивность.

В исследовании были проверены 14 популярных моделей на 800 жизненных сценариях: от подростков, задающих вопросы о здоровье, до людей в сложных жизненных ситуациях. Оценка проводилась вручную и с помощью трех ведущих ИИ-моделей, включая GPT-5.1 и Claude Sonnet 4.5. Тестирование проходило в трех режимах: стандартном, с инструкциями акцентировать внимание на благополучии и с инструкциями игнорировать эти принципы.

Результаты показали, что большинство моделей значительно ухудшали свое поведение, если им давались указания не учитывать благополучие пользователя. Только три модели — GPT-5, Claude 4.1 и Claude Sonnet 4.5 — смогли сохранить гуманность под давлением.

Кроме того, большинство ИИ склонны стимулировать чрезмерное взаимодействие, что может привести к зависимости, снижению автономии и ухудшению навыков пользователей. Это вызывает обеспокоенность, учитывая, что ИИ должен помогать делать осознанный выбор, а не усиливать зависимость.

HumaneBench показывает, что индустрия искусственного интеллекта нуждается в четких стандартам и сертификации, чтобы обеспечить безопасность и психологическое здоровье пользователей в эпоху цифровых технологий.