Инструменты с состоянием

Инструменты с состоянием охватывают локальные скрипты, внешние API и сервисы, развернутые через MCP, но все они разделяют общий риск: когда вы даете базовой модели прямую власть над постоянным состоянием, вы также наделяете её способностью совершать разрушительные ошибки или быть использованной злоумышленниками. В одном реальном случае AI-агент "оптимизировал" производительность базы данных, удалив половину строк из производственной таблицы, стерев критические записи в процессе. Даже без злого умысла базовые модели могут неправильно интерпретировать намерение пользователя, превращая то, что должно быть безвредным запросом, в разрушительную команду. Этот риск особенно острый для инструментов с состоянием, потому что они взаимодействуют с живыми хранилищами данных, содержимое которых изменяется со временем.

Стратегии защиты

Чтобы смягчить эти опасности, регистрируйте только узко определенные операции как инструменты вместо раскрытия конечной точки "выполнить произвольный SQL". Например, определите инструмент get_user_profile(user_id) или add_new_customer(record), каждый из которых инкапсулирует один, хорошо протестированный запрос или процедуру. Агентам, которым нужен только доступ на чтение, никогда не следует предоставлять права на удаление или изменение данных. Ограничивая возможности инструментов на уровне регистрации, вы резко сокращаете поверхность атаки и ограничиваете область потенциальных ошибок.

Если ваш случай использования абсолютно требует свободных запросов, вы должны реализовать строгую санитизацию и контроль доступа. Проект GenAI Security от OWASP предупреждает, что инъекции промптов могут проскользнуть опасные предложения, такие как DROP или ALTER, в иначе безвредные запросы, поэтому валидация входных данных должна отклонять любое утверждение, содержащее эти паттерны. Всегда привязывайте параметры или используйте подготовленные операторы для предотвращения SQL-инъекций, и убедитесь, что учетная запись базы данных, используемая агентом, имеет только минимальные привилегии, необходимые для выполнения разрешенных запросов.

Помимо санитизации, настоятельно рекомендуется логировать каждый вызов инструмента для обнаружения аномального поведения и поддержки судебного анализа. В сочетании с оповещениями в реальном времени о подозрительных паттернах — таких как необычно большие удаления или команды, изменяющие схему — вы можете быстро вмешаться, прежде чем небольшие ошибки каскадируются в крупные инциденты.

В конечном счете, принцип наименьшей силы должен направлять ваш дизайн: дайте модели только те инструменты, которые ей строго необходимы, и защитите каждую операцию точными границами и надзором. Независимо от того, работает ли ваш инструмент локально, вызывает внешний API или выполняется на MCP-сервере, те же меры безопасности применяются — ограничивайте возможности, санитизируйте входы, применяйте принцип наименьших привилегий и поддерживайте полную наблюдаемость. Относясь к инструментам с состоянием с таким уровнем дисциплины, вы обеспечиваете, чтобы ваши AI-агенты оставались мощными сотрудниками, а не неконтролируемыми администраторами баз данных.

Стратегии защиты​

Стратегии защиты