Skip to main content

3. Типы агентов

Разнообразие и путаница

По мере роста популярности термина "агент", его значение расширилось, охватывая широкий спектр AI-систем, что часто создает путаницу относительно того, что действительно составляет AI агента.

Семь практических типов агентов (по The Information)

1. Агенты бизнес-задач (Business-task agents)

  • Автоматизируют предопределенные бизнес-процессы
  • Примеры: UiPath (роботизированная автоматизация процессов), Microsoft Power Automate, Zapier
  • Выполняют последовательности детерминированных действий, обычно запускаемых событиями
  • Минимальное контекстное рассуждение

2. Разговорные агенты (Conversational agents)

  • Чатботы и агенты службы поддержки клиентов
  • Оптимизированы для:
    • Управления диалогом
    • Распознавания намерений
    • Очередности разговора
  • Примеры: виртуальные помощники, встроенные в платформы поддержки клиентов

3. Исследовательские агенты (Research agents)

  • Проводят сбор информации, синтез и суммаризацию
  • Сканируют документы, базы знаний или веб
  • Предоставляют структурированные выходные данные для помощи аналитикам
  • Примеры: Perplexity AI, Elicit

4. Аналитические агенты (Analytics agents)

  • Фокусируются на интерпретации структурированных наборов данных
  • Генерируют инсайты, дашборды и отчеты
  • Часто тесно интегрируются с корпоративными хранилищами данных
  • Позволяют пользователям запрашивать сложные данные на естественном языке
  • Примеры: Power BI Copilot, Glean

5. Агенты-разработчики (Developer agents)

  • Помогают разработчикам генерировать, рефакторить и объяснять код
  • Глубоко интегрируются в рабочие процессы IDE
  • Увеличивают продуктивность разработки программного обеспечения
  • Примеры: Cursor, Windsurf, GitHub Copilot

6. Доменно-специфичные агенты (Domain-specific agents)

  • Настроены для специализированных профессиональных доменов
  • Комбинируют доменно-специфические знания со структурированными рабочими процессами
  • Предоставляют целевую помощь экспертного уровня
  • Примеры: Harvey (юридический), Hippocratic AI (медицинский), финансовые агенты

7. Агенты, использующие браузер (Browser-using agents)

  • Навигация, взаимодействие, извлечение информации и выполнение действий на веб-сайтах без человеческого взаимодействия
  • В отличие от традиционной роботизированной автоматизации процессов (RPA), которая следует предписанным шагам
  • Современные агенты комбинируют:
    • Понимание языка
    • Визуальное восприятие
    • Динамическое планирование
  • Адаптируются на лету

Дополнительные типы

Голосовые агенты (Voice agents)

  • Работают на сквозном понимании и генерации речи
  • Включают разговорную автоматизацию в:
    • Службе поддержки клиентов
    • Записи на прием
    • Обработке заказов в реальном времени

Видео-агенты (Video agents)

  • Представляют пользователям видео-ответы на основе аватаров
  • Комбинируют:
    • Синхронизированную речь
    • Выражения лица
    • Жесты
  • Быстро появляются в:
    • Продажах
    • Обучении
    • Онбординге клиентов
    • Маркетинге
    • Инструментах виртуального присутствия

Важное замечание

Количество и разнообразие типов агентов быстро растет. Мы, вероятно, увидим новые виды агентов во многих доменах по мере эволюции области и ее базовых технологий.

В этой книге мы фокусируемся на основной категории агентов, построенных вокруг языковых моделей, особенно тех, которые используют текст и код.