Skip to main content

Типы агентов

Прежде чем углубляться в конкретные стратегии оркестрации, важно понять различные типы агентов, которые можно построить. Каждый тип агента воплощает отличный подход к рассуждению, планированию и действию, формируя то, как задачи декомпозируются и выполняются. Некоторые агенты реагируют мгновенно с предпрограммированными отображениями, в то время как другие итеративно рассуждают и размышляют для обработки сложных, открытых целей. Выбор типа агента напрямую влияет на производительность, стоимость и возможности вашей системы.

Рефлекс-агенты (Reflex Agents)

Рефлекс-агенты реализуют прямое отображение от ввода к действию без какого-либо внутреннего следа рассуждений. Простые рефлекс-агенты следуют правилам "если-условие, то-действие", вызывая соответствующий инструмент немедленно при обнаружении предопределенных триггеров. Поскольку они обходят промежуточные шаги мышления, рефлекс-агенты обеспечивают ответы с минимальной задержкой и предсказуемой производительностью, что делает их хорошо подходящими для случаев использования, таких как маршрутизация на основе ключевых слов, одношаговые поиски данных или базовые автоматизации (например, "Если X, вызвать инструмент Y").

Однако их ограниченная выразительность означает, что они не могут обрабатывать задачи, требующие многошагового рассуждения или контекста за пределами непосредственного ввода.

Характеристики:

  • Миллисекундные ответы
  • Нет многошагового рассуждения
  • Лучшие случаи использования: маршрутизация по ключевым словам, простые поиски

ReAct-агенты

ReAct-агенты чередуют Рассуждение (Reasoning) и Действие (Action) в итеративном цикле: модель генерирует мысль, выбирает и вызывает инструмент, наблюдает результат и повторяет по мере необходимости. Этот паттерн позволяет агенту разбивать сложные задачи на управляемые шаги, обновляя свой план на основе промежуточных наблюдений.

Варианты реализации:

  • ZERO_SHOT_REACT_DESCRIPTION (LangChain): Представляет инструменты и инструкции в одном промпте, полагаясь на врожденное рассуждение LLM для выбора и вызова инструментов без примеров трассировок.
  • CHAT_ZERO_SHOT_REACT_DESCRIPTION: Расширяет это, включая историю разговора, позволяя агенту использовать прошлые обмены при принятии решения о следующем действии.

ReAct-агенты превосходны в исследовательских сценариях — динамическом анализе данных, агрегации из множества источников или устранении неполадок — где способность адаптироваться в процессе перевешивает дополнительную задержку и вычислительные накладные расходы. Их структура с циклом также обеспечивает прозрачность ("цепочка мыслей"), которая помогает в отладке и аудите, хотя это может увеличить затраты на API и время ответа.

Характеристики:

  • Гибкость, адаптация на лету
  • Более высокая задержка и стоимость
  • Лучшие случаи использования: исследовательские рабочие процессы, устранение неполадок

Планировщик-исполнитель (Planner-Executor Agents)

Планировщик-исполнитель разделяет задачу на две отдельные фазы: планирование, где модель генерирует многошаговый план; и выполнение, где каждый запланированный шаг выполняется через вызовы инструментов. Это четкое разделение позволяет планировщику сосредоточиться на рассуждении с длинным горизонтом, в то время как исполнители вызывают только необходимые инструменты, уменьшая избыточные вызовы LLM.

Преимущества:

  • Четкая декомпозиция: Сложные задачи разбиваются на управляемые подзадачи.
  • Отлаживаемость: Явные планы раскрывают, где и почему возникают ошибки.
  • Эффективность затрат: Меньшие модели или меньше вызовов LLM обрабатывают выполнение, резервируя большие модели для планирования.

Поскольку план явный, отладка и мониторинг становятся простыми — вы можете проверить сгенерированный план, отследить, какой шаг не удался, и перепланировать при необходимости.

Характеристики:

  • Четкое разбиение задач
  • Накладные расходы на планирование
  • Лучшие случаи использования: сложные многошаговые процессы

Агенты декомпозиции запросов (Query-Decomposition Agents)

Агенты декомпозиции запросов решают сложный вопрос, итеративно разбивая его на подвопросы, вызывая поиск или другие инструменты для каждого, а затем синтезируя окончательный ответ. Этот паттерн — часто называемый "self-ask with search" — побуждает модель: "Какой последующий вопрос мне нужен?" → вызов поиска → "Какой следующий вопрос?" → … → "Какой окончательный ответ?"

Пример: SELF_ASK_WITH_SEARCH

Спросить: "Кто жил дольше, X или Y?"
Само-вопрос: "Какова продолжительность жизни X?" → инструмент поиска
Само-вопрос: "Какова продолжительность жизни Y?" → инструмент поиска
Синтезировать: "X жил 85 лет, Y жил 90 лет, поэтому Y жил дольше"

Этот подход превосходен, когда требуется извлечение внешних знаний, обеспечивая, чтобы каждый факт был обоснован выходом инструмента перед составлением окончательного ответа.

Характеристики:

  • Точность обоснованного извлечения
  • Множественные вызовы инструментов
  • Лучшие случаи использования: исследования, вопросы на основе фактов

Агенты рефлексии (Reflection Agents)

Агенты рефлексии и метарассуждения расширяют парадигму ReAct, не только чередуя мысль и действие, но и просматривая прошлые шаги для выявления и исправления ошибок перед продолжением. В этом подходе — примером которого является недавно предложенный фреймворк ReflAct — агент непрерывно обосновывает свое рассуждение в размышлениях о целевом состоянии, измеряя свое текущее состояние против намеченного результата и корректируя свой план, когда возникают несоответствия.

Промпты рефлексии побуждают модель критиковать свою собственную цепочку мыслей, исправлять логические ошибки и подкреплять успешные стратегии, эффективно симулируя человеческий стиль самооценки во время сложного решения проблем.

Этот паттерн сияет в рабочих процессах с высокими ставками, где ранние ошибки могут каскадироваться в дорогостоящие сбои — таких как оркестрация финансовых транзакций, поддержка медицинской диагностики или реагирование на критические инциденты. Сопоставляя каждое действие с шагом рефлексии, агенты обнаруживают, когда выходы инструментов отклоняются от ожиданий, и могут перепланировать или откатить перед фиксацией необратимых операций. Добавленные накладные расходы метарассуждения действительно влекут дополнительную задержку и вычисления, но для задач, где правильность и надежность перевешивают скорость, агенты рефлексии предлагают мощный защитный барьер против распространения ошибок и помогают поддерживать соответствие общим целям.

Характеристики:

  • Раннее обнаружение ошибок
  • Добавленные вычисления и задержка
  • Лучшие случаи использования: задачи с высокими ставками, критичные для безопасности

Агенты глубокого исследования (Deep Research Agents)

Агенты глубокого исследования специализируются на решении открытых, очень сложных расследований, которые требуют обширного сбора внешних знаний, тестирования гипотез и синтеза — подумайте об обзорах литературы, научных открытиях или стратегическом рыночном анализе. Они объединяют множественные паттерны: фазу планировщика-исполнителя для построения исследовательских рабочих процессов; декомпозицию запросов для разбиения больших вопросов на целевые поиски; и циклы ReAct для итеративного уточнения гипотез на основе новых находок.

В типичном цикле агент глубокого исследования будет:

  1. Планировать общую исследовательскую программу (например, определить ключевые подтемы или источники данных).
  2. Декомпозировать каждую подтему в конкретные запросы (через SELF_ASK или подобное).
  3. Вызывать инструменты — от академических поисковых API до доменно-специфичных баз данных — и размышлять о релевантности и надежности каждого результата.
  4. Синтезировать инсайты в развивающийся отчет или набор рекомендаций, используя управляемую LLM суммаризацию и критику на каждом шаге.

Сильные стороны:

  • Возможности: Может обрабатывать высокосложные, многоэтапные расследования, опирающиеся на специализированные базы данных и междисциплинарные источники.
  • Адаптивность: Направление исследования корректируется по мере появления новых доказательств.
  • Прозрачность: Явные планы и шаги декомпозиции облегчают аудит методологии.

Слабые стороны:

  • Высокая стоимость: Обширное использование базовых моделей и множественные вызовы API увеличивают вычислительные и токен-расходы.
  • Задержка: Каждый слой планирования, декомпозиции и рефлексии добавляет задержку.
  • Хрупкость: Зависит от качества и доступности внешних источников данных и требует тщательной обработки ошибок и стратегий отката.

Лучшие случаи использования — это длинные, экспертного уровня задачи — академические обзоры литературы, техническая проверка должной осмотрительности, конкурентная разведка — где глубина и строгость превосходят скорость.

Характеристики:

  • Управление многоэтапными адаптивными расследованиями
  • Очень высокие вычислительные затраты и очень высокая задержка
  • Лучшие случаи использования: длинные обзоры литературы