Обучение в агентных системах (Learning in Agentic Systems)

Эта глава охватывает различные техники для подхода и интеграции обучения в агентные системы. Добавление способности для агентов учиться и улучшаться со временем — невероятно полезное дополнение, но не является необходимым при проектировании агентов. Реализация возможностей обучения требует дополнительного проектирования, оценки и мониторинга, что может или не может стоить инвестиций в зависимости от приложения.

Под обучением мы понимаем улучшение производительности агентной системы через взаимодействие с окружающей средой. Этот процесс позволяет агентам адаптироваться к изменяющимся условиям, уточнять свои стратегии и улучшать общую эффективность.

Два основных подхода к обучению:

Непараметрическое обучение: Техники для изменения и улучшения производительности автоматически без изменения параметров задействованных моделей.
Параметрическое обучение: Техники, в которых мы специально обучаем или дообучаем параметры базовой модели.

Мы начнем с исследования техник непараметрического обучения, затем рассмотрим подходы параметрического дообучения, включая контролируемое дообучение и оптимизацию прямых предпочтений, которые адаптируют веса модели для целевых улучшений.