Моделирование угроз с MAESTRO
MAESTRO (Multi-Agent Environment, Security, Threat, Risk, and Outcome) — специализированный фреймворк, разработанный Cloud Security Alliance (CSA) специально для моделирования угроз в агентном AI.
Семь слоев MAESTRO
-
Базовые модели
- Угрозы: Враждебные примеры, кража моделей, бэкдоры
- Смягчение: Обучение устойчивости к враждебным атакам, лимиты запросов API
-
Операции с данными
- Угрозы: Отравление данных, эксфильтрация, подделка
- Смягчение: Хеширование (SHA-256), шифрование, защита RAG
-
Фреймворки агентов
- Угрозы: Атаки цепочки поставок, сбои валидации входов
- Смягчение: Инструменты анализа состава программного обеспечения, безопасные зависимости
-
Развертывание и инфраструктура
- Угрозы: Захват контейнеров, отказ в обслуживании (DoS), латеральное движение
- Смягчение: Сканирование контейнеров, взаимный TLS, квоты ресурсов
-
Оценка и наблюдаемость
- Угрозы: Отравление метрик, утечка логов
- Смягчение: Обнаружение дрифта (Evidently AI), неизменяемые логи
-
Безопасность и соответствие
- Угрозы: Уклонение агентов, предвзятость, необъяснимость
- Смягчение: Аудиты, техники объяснимого AI
-
Экосистема агентов
- Угрозы: Несанкционированные действия, меж-агентные атаки
- Смягчение: Контроль на основе ролей, принятие решений на основе кворума
Лучшие практики: Интеграция в жизненный цикл разработки программного обеспечения, обновление моделей на основе возникающих угроз, приоритизация рисков с использованием систем оценки (CVSS для AI), симуляция атак через red teaming.