HOT news!

«Инъекция промпта»: главная угроза для ИИ-браузеров нового поколения

Компания OpenAI представила отчет о безопасности своего ИИ-браузера Atlas, в котором признала: атаки типа «инъекция промпта» (prompt injection) остаются самым серьезным и трудноискоренимым риском. Суть этой угрозы в том, что злоумышленники внедряют скрытые команды в текстовые данные, заставляя ИИ-агентов игнорировать исходные инструкции и выполнять вредоносные действия.

Почему это проблема, которую нельзя «починить»

Разработчики сравнивают такие атаки с социальным инженерингом или мошенничеством в обычном интернете — их практически невозможно устранить полностью.

  • Расширение площади атаки: Включение «режима агента» в браузере Atlas дает ИИ доступ к действиям от лица пользователя, что автоматически делает систему более уязвимой.
  • Мнение экспертов: Национальный центр кибербезопасности Великобритании подтверждает, что эта проблема «никогда не исчезнет». Специалистам советуют не пытаться полностью искоренить угрозу, а сосредоточиться на минимизации ущерба.

Как нейросети сражаются с «виртуальными хакерами»

Чтобы защитить пользователей, OpenAI, Google и Anthropic применяют многоуровневую защиту. Один из самых эффективных методов OpenAI — использование «автоматизированного ИИ-злоумышленника».

  1. Симуляция атаки: Специально обученный бот-хакер пытается взломать систему Atlas, подбирая изощренные промпты в изолированном симуляторе.
  2. Анализ и обучение: Бот изучает реакцию защиты, корректирует свои действия и пробует снова. Это позволяет находить лазейки гораздо быстрее, чем это сделают реальные преступники.
  3. Пример из жизни: В одном из тестов скрытая инструкция в обычном письме заставила ИИ-агента отправить сообщение об увольнении вместо стандартного автоответа. После обновлений безопасности система научилась распознавать такие «вбросы» и предупреждать пользователя.

Рекомендации для пользователей

Несмотря на все технические ухищрения, эксперты по кибербезопасности, такие как Рами Маккарти из компании Wiz, отмечают: на данный момент риск использования ИИ-браузеров может перевешивать их пользу.

Чтобы обезопасить себя, OpenAI советует соблюдать два правила:

  • Человек в контуре (Human-in-the-loop): Всегда проверяйте и подтверждайте важные действия (например, отправку писем или платежи), которые инициирует ИИ.
  • Конкретика вместо свободы: Давайте агентам узкие, точные инструкции. Вместо фразы «делай с моей почтой всё, что нужно», лучше ограничить доступ к конкретным задачам.