Skip to main content

Моделирование угроз с MAESTRO

MAESTRO (Multi-Agent Environment, Security, Threat, Risk, and Outcome) — специализированный фреймворк, разработанный Cloud Security Alliance (CSA) специально для моделирования угроз в агентном AI.

Семь слоев MAESTRO

  1. Базовые модели

    • Угрозы: Враждебные примеры, кража моделей, бэкдоры
    • Смягчение: Обучение устойчивости к враждебным атакам, лимиты запросов API
  2. Операции с данными

    • Угрозы: Отравление данных, эксфильтрация, подделка
    • Смягчение: Хеширование (SHA-256), шифрование, защита RAG
  3. Фреймворки агентов

    • Угрозы: Атаки цепочки поставок, сбои валидации входов
    • Смягчение: Инструменты анализа состава программного обеспечения, безопасные зависимости
  4. Развертывание и инфраструктура

    • Угрозы: Захват контейнеров, отказ в обслуживании (DoS), латеральное движение
    • Смягчение: Сканирование контейнеров, взаимный TLS, квоты ресурсов
  5. Оценка и наблюдаемость

    • Угрозы: Отравление метрик, утечка логов
    • Смягчение: Обнаружение дрифта (Evidently AI), неизменяемые логи
  6. Безопасность и соответствие

    • Угрозы: Уклонение агентов, предвзятость, необъяснимость
    • Смягчение: Аудиты, техники объяснимого AI
  7. Экосистема агентов

    • Угрозы: Несанкционированные действия, меж-агентные атаки
    • Смягчение: Контроль на основе ролей, принятие решений на основе кворума

Лучшие практики: Интеграция в жизненный цикл разработки программного обеспечения, обновление моделей на основе возникающих угроз, приоритизация рисков с использованием систем оценки (CVSS для AI), симуляция атак через red teaming.