Краткое содержание: Введение в агентов
Основные тезисы
1. Определение AI агентов
- Автономные агенты — интеллектуальные системы, способные к независимому анализу данных, интерпретации среды и принятию решений на основе контекста
- Автономность существует в виде спектра: от истинных автономных агентов до детерминированных скриптов
- Ключевой тест: демонстрирует ли система реальное принятие решений или следует статическим скриптам?
- Движущие силы: foundation модели и обучение с подкреплением
- Агентная система включает: инструменты, память, foundation модель, оркестрацию, инфраструктуру
2. Революция предобучения
- Предобученные модели могут адаптироваться к широкому спектру задач без дополнительного обучения
- Доступны через один вызов API, без необходимости обучения или размещения
- Современные LLM (GPT-5, Claude, Llama, Gemini, DeepSeek) обеспечивают:
- Понимание естественного языка
- Контекстно-зависимое взаимодействие
- Генерацию структурированного контента
- Использование инструментов
- Адаптивное планирование
3. Типы агентов
Семь основных типов:
- Бизнес-задачи — автоматизация рабочих процессов (UiPath, Power Automate, Zapier)
- Разговорные — чатботы и поддержка клиентов
- Исследовательские — сбор и синтез информации (Perplexity AI, Elicit)
- Аналитические — анализ данных и отчеты (Power BI Copilot, Glean)
- Разработчики — помощь в программировании (Cursor, GitHub Copilot)
- Доменно-специфичные — специализированные области (Harvey, Hippocratic AI)
- Использующие браузер — навигация и взаимодействие с веб-сайтами
Дополнительные типы: голосовые и видео-агенты
4. Выбор модели
- Изобилие выбора: коммерческие провайдеры (OpenAI, Anthropic, Google) и open-source (Llama, Mistral)
- Реалистичный старт: использовать последнюю модель общего назначения от ведущего провайдера
- Тренд: автоматизированный выбор модели — маршрутизация простых запросов к малым моделям, сложных — к большим
- Будущее: мультимодельные системы станут нормой
5. Асинхронные операции
- Традиционные системы: синхронные (шаг за шагом)
- Автономные агенты: асинхронные (параллельная обработка, динамический приоритет)
- Трансформация работы: от исполнителей задач к менеджерам задач
- Агенты делают человеческие роли проактивными, а не реактивными
6. Практические применения
Семь примеров агентов:
- Поддержка клиентов — 24/7, обработка запросов, эскалация
- Финансовые услуги — управление счетами, мошенничество, портфели
- Здравоохранение — прием пациентов, сортировка, координация
- IT-поддержка — устранение неполадок, обновления, безопасность
- Юридические документы — обзор контрактов, исследования, соответствие
- SOC аналитики — расследование угроз, реагирование на инциденты
- Цепочка поставок — оптимизация запасов, отслеживание, прогнозирование
7. Рабочие процессы и агенты
Когда использовать что:
- Простой код: детерминистические входные данные, миллисекундная задержка, регулируемые домены
- Детерминированные рабочие процессы: конечные ветви, явная обработка ошибок
- RAG/чатботы: ответы на вопросы по корпусу документов
- Автономные агенты: неструктурированные входные данные, многошаговое планирование, непрерывное обучение
Ключевые факторы выбора:
- Вариабельность входных данных
- Сложность рассуждения
- Ограничения производительности/соответствия
- Бремя обслуживания
8. Принципы построения
- Масштабируемость — распределенные архитектуры, автомасштабирование
- Модульность — независимые компоненты, четкие интерфейсы
- Непрерывное обучение — обучение на опыте, обратная связь пользователей
- Устойчивость — обработка ошибок, безопасность, избыточность
- Будущая защита — открытые стандарты, гибкая инфраструктура
9. Организация для успеха
- Баланс: гибкость экспериментирования + стратегическое выравнивание
- Стратегия: "один стандарт на большую группу"
- Избегание зависимости от поставщика: открытые стандарты (OpenAPI), модульность
- Обмен знаниями: форумы, репозитории, документация
- Легковесное управление: принципы, а не мандаты
10. Агентные фреймворки
Основные фреймворки:
- LangGraph: модульная оркестрация, графы, асинхронность (фокус книги)
- AutoGen: мультиагентная координация, динамические роли
- CrewAI: простота, быстрый старт, абстракции "crew" и "tasks"
- OpenAI Agents SDK: интеграция с OpenAI, безопасность
Выбор:
- Прототипы → CrewAI или OpenAI SDK
- Продакшн → LangGraph или AutoGen
- Альтернатива: прямое использование API поставщиков
Ключевые выводы
- Автономность — это спектр, не все "агенты" действительно автономны
- Предобучение революционизировало доступность AI — один вызов API вместо месяцев разработки
- Выбор решения (код/рабочий процесс/RAG/агент) критически важен для успеха проекта
- Принципы проектирования (масштабируемость, модульность, обучение, устойчивость) — основа эффективных систем
- Организационная культура (баланс экспериментирования и стандартизации) определяет успех внедрения
- Будущее мультимодельное — проектирование для гибкости окупится
Следующие шаги
В следующих главах мы углубимся в:
- Проектирование агентных систем (компоненты, архитектуры, компромиссы)
- Дизайн пользовательского опыта
- Использование инструментов
- Оркестрацию
- Память и знания
- Обучение в агентных системах