3. Типы агентов
Разнообразие и путаница
По мере роста популярности термина "агент", его значение расширилось, охватывая широкий спектр AI-систем, что часто создает путаницу относительно того, что действительно составляет AI агента.
Семь практических типов агентов (по The Information)
1. Агенты бизнес-задач (Business-task agents)
- Автоматизируют предопределенные бизнес-процессы
- Примеры: UiPath (роботизированная автоматизация процессов), Microsoft Power Automate, Zapier
- Выполняют последовательности детерминированных действий, обычно запускаемых событиями
- Минимальное контекстное рассуждение
2. Разговорные агенты (Conversational agents)
- Чатботы и агенты службы поддержки клиентов
- Оптимизированы для:
- Управления диалогом
- Распознавания намерений
- Очередности разговора
- Примеры: виртуальные помощники, встроенные в платформы поддержки клиентов
3. Исследовательские агенты (Research agents)
- Проводят сбор информации, синтез и суммаризацию
- Сканируют документы, базы знаний или веб
- Предоставляют структурированные выходные данные для помощи аналитикам
- Примеры: Perplexity AI, Elicit
4. Аналитические агенты (Analytics agents)
- Фокусируются на интерпретации структурированных наборов данных
- Генерируют инсайты, дашборды и отчеты
- Часто тесно интегрируются с корпоративными хранилищами данных
- Позволяют пользователям запрашивать сложные данные на естественном языке
- Примеры: Power BI Copilot, Glean
5. Агенты-разработчики (Developer agents)
- Помогают разработчикам генерировать, рефакторить и объяснять код
- Глубоко интегрируются в рабочие процессы IDE
- Увеличивают продуктивность разработки программного обеспечения
- Примеры: Cursor, Windsurf, GitHub Copilot
6. Доменно-специфичные агенты (Domain-specific agents)
- Настроены для специализированных профессиональных доменов
- Комбинируют доменно-специфические знания со структурированными рабочими процессами
- Предоставляют целевую помощь экспертного уровня
- Примеры: Harvey (юридический), Hippocratic AI (медицинский), финансовые агенты
7. Агенты, использующие браузер (Browser-using agents)
- Навигация, взаимодействие, извлечение информации и выполнение действий на веб-сайтах без человеческого взаимодействия
- В отличие от традиционной роботизированной автоматизации процессов (RPA), которая следует предписанным шагам
- Современные агенты комбинируют:
- Понимание языка
- Визуальное восприятие
- Динамическое планирование
- Адаптируются на лету
Дополнительные типы
Голосовые агенты (Voice agents)
- Работают на сквозном понимании и генерации речи
- Включают разговорную автоматизацию в:
- Службе поддержки клиентов
- Записи на прием
- Обработке заказов в реальном времени
Видео-агенты (Video agents)
- Представляют пользователям видео-ответы на основе аватаров
- Комбинируют:
- Синхронизированную речь
- Выражения лица
- Жесты
- Быстро появляются в:
- Продажах
- Обучении
- Онбординге клиентов
- Маркетинге
- Инструментах виртуального присутствия
Важное замечание
Количество и разнообразие типов агентов быстро растет. Мы, вероятно, увидим новые виды агентов во многих доменах по мере эволюции области и ее базовых технологий.
В этой книге мы фокусируемся на основной категории агентов, построенных вокруг языковых моделей, особенно тех, которые используют текст и код.