Skip to main content

Краткое содержание: Дизайн пользовательского опыта для агентных систем

Основные тезисы

1. Модальности взаимодействия

Агентные системы взаимодействуют с пользователями через различные модальности, каждая с уникальными преимуществами и ограничениями:

Текстовые интерфейсы

  • Преимущества: Простота, знакомость, поддержка синхронных и асинхронных взаимодействий, отслеживаемость
  • Ограничения: Проблемы с обнаруживаемостью, двусмысленность естественного языка, ограничения длины ответа, отсутствие эмоциональной нюансировки
  • Применение: Чатботы поддержки клиентов, инструменты командной строки, помощники по продуктивности
  • Современные тренды: AI-улучшенные терминалы (Warp, Claude Code, Gemini CLI), преобразующие командную строку в разговорного партнера

Графические интерфейсы

  • Преимущества: Визуальная ясность, снижение когнитивной нагрузки, структурированные рабочие процессы
  • Ключевые примеры: LangSmith, n8n, Arize, AutoGen — визуальная оркестрация рабочих процессов
  • Генеративные UI: Динамическое создание интерфейсов на основе пользовательских запросов (Perplexity AI, AI coding copilots)
  • Вызовы: Ограниченное экранное пространство, управление отзывчивостью, баланс автоматизации и контроля

Речевые и голосовые интерфейсы

  • Исторические ограничения: Высокая задержка, роботизированное ощущение
  • Современные достижения: Низкая задержка, обработка прерываний, интеграция использования инструментов
  • Особенности: Скорость речи (150-180 слов/мин) vs чтения (250-300 слов/мин)
  • Применение: Hands-free задачи, быстрые запросы, action-oriented рабочие процессы
  • Будущее: Здравоохранение, поддержка клиентов, промышленные приложения

Видео-интерфейсы

  • Преимущества: Мультисенсорные каналы, эмоциональная нюансировка, человеческие выражения
  • Вызовы: Высокие требования к вычислительной мощности, "зловещая долина", проблемы конфиденциальности
  • Будущее: Виртуальные встречи, AR-наложения, цифровые аватары для обслуживания клиентов

Комбинирование модальностей

  • Принцип: Пользователи не думают в терминах границ модальностей — они хотят достичь целей естественно
  • Требования: Управление состоянием, сохранение контекста, адаптация стиля коммуникации

2. Ползунок автономии

Критическое измерение UX — уровень автономии, предоставленный агентам.

Три режима автономии:

  1. Ручной: Пользователь выполняет все действия самостоятельно
  2. "Спросить" (вспомогательный): Агент предлагает, пользователь одобряет
  3. "Агент": Агент автономно выполняет задачи с уведомлениями

Принципы интеграции:

  • Четкое раскрытие степеней автономии
  • Бесшовные переходы между уровнями
  • Предсказуемое поведение на каждом уровне
  • Коммуникация рисков и преимуществ
  • Адаптация на основе доверия пользователя

Значение:

Ползунок автономии — это механизм построения доверия, дающий пользователям контроль и уважающий их экспертизу.

3. Синхронные vs асинхронные опыты

Синхронные опыты:

  • Характеристики: Реальное время, немедленный обмен, низкая задержка
  • Принципы: Немедленность, ясность, краткость, механика чередования, изящная обработка ошибок
  • Применение: Живой чат, голосовые разговоры, дашборды в реальном времени

Асинхронные опыты:

  • Характеристики: Гибкость, постоянство, периодическая коммуникация
  • Принципы: Четкая коммуникация статуса, управление контекстом, управление ожиданиями
  • Применение: Долго выполняющиеся задачи, детальные отчеты, фоновый мониторинг

Баланс проактивности:

  • Проактивность может быть полезной (срочные предупреждения, оптимизации) или навязчивой
  • Ключ: осознание контекста и контроль пользователя
  • Приоритет: релевантность и ценность уведомлений

4. Сохранение контекста и непрерывность

Важность:

  • Создает ощущение непрерывности, персонализации и интеллекта
  • Снижает когнитивную нагрузку и разочарование
  • Определяет, воспринимается ли агент как сотрудник или инструмент

Подходы к реализации:

  • Клиентский контекст: Быстро в сессии, теряет непрерывность между устройствами
  • Серверный контекст: Долгосрочная память, межплатформенность, но возможна задержка
  • Гибридный подход: Краткосрочный на клиенте, долгосрочный на сервере — оптимальный баланс

Поддержание состояния:

  • Идентификация пользователей/сессий
  • Сохранение в базе данных или распределенном кэше
  • Четкие границы сессий, валидация данных, механизмы отката

Персонализация:

  • Сохранение предпочтений: Настройки пользователя, часто выбираемые опции
  • Поведенческая адаптация: Корректировка стиля на основе паттернов
  • Проактивная помощь: Предвосхищение потребностей

5. Коммуникация возможностей агента

Проблема обнаруживаемости:

  • В текстовых/голосовых интерфейсах отсутствуют видимые аффордансы
  • Пользователи не знают, что агент может делать

Стратегии:

  • Предложенные кнопки действий: Визуальные аффордансы в чат-интерфейсах
  • Онбординг и туториалы: Введение в основные функции
  • Расширяемые меню/карточки возможностей: Структурированный список функций
  • Динамические предложения: Рекомендации на основе ввода
  • Проактивные введения: "Я могу помочь вам с X, Y, Z"

Принципы:

  • Прогрессивное раскрытие: основные возможности сначала
  • Контекстуальная релевантность: показывать наиболее вероятные действия
  • Визуальная группировка и четкая иерархия

6. Коммуникация уверенности и неопределенности

Важность:

  • Агенты работают в вероятностных средах
  • Не все ответы имеют одинаковую степень уверенности
  • Критично для построения доверия

Способы выражения:

  • Явные утверждения: "Я на 90% уверен"
  • Визуальные сигналы: Иконки, цветные предупреждения, индикаторы
  • Поведенческие корректировки: Предложения вместо рекомендаций при низкой уверенности

Принципы:

  • Избегать чрезмерной уверенности при высокой неопределенности
  • Избегать чрезмерного хеджирования в низкорисковых взаимодействиях
  • Фрейминг ответов в соответствии с ожиданиями и ставками

7. Запрос руководства от пользователей

Принципы:

  • Задавать сфокусированные, полезные вопросы при двусмысленности
  • Четкие, вежливые, осознающие контекст вопросы
  • Прозрачность относительно причин запроса
  • Избегать слишком многих вопросов сразу
  • Логическая последовательность: критические двусмысленности первыми

Преобразование неопределенности:

  • Неопределенность → возможность для сотрудничества
  • Партнерство и совместный контроль

8. Изящное обращение с ошибками

Принципы:

  • Прозрачное признание проблемы
  • Полезное объяснение
  • Действенные следующие шаги
  • Предопределенные механизмы отката
  • Сохранение состояния в многошаговых задачах
  • Эмпатический язык
  • Четкие пути к разрешению
  • Обучение на ошибках

Цель:

Поддержание доверия и минимизация разочарования даже при сбоях.

9. Доверие в дизайне взаимодействия

Прозрачность:

  • Четкая коммуникация возможностей и ограничений
  • Объяснения действий и решений
  • Видимость в рассуждениях агента
  • Баланс: достаточно информации без перегрузки

Предсказуемость и надежность:

  • Последовательное поведение в различных сценариях
  • Одинаковые ответы на одинаковые вопросы
  • Вдумчивая обработка крайних случаев
  • Устойчивость системы
  • Соответствие ожиданиям

Результат:

Агенты становятся надежными цифровыми партнерами, а не просто инструментами.

Ключевые выводы

  1. Модальности имеют значение: Выбор модальности должен соответствовать задаче, окружению и ожиданиям пользователя
  2. Автономия — это спектр: Ползунок автономии критичен для построения доверия
  3. Контекст — это UX: Сохранение контекста определяет, воспринимается ли агент как сотрудник или инструмент
  4. Обнаруживаемость критична: Особенно в текстовых/голосовых интерфейсах без видимых аффордансов
  5. Прозрачность и предсказуемость: Основа доверия в агентных системах
  6. Изящный сбой: То, как агент обрабатывает ошибки, так же важно, как успех
  7. Коммуникация неопределенности: Критична для построения доверия в вероятностных системах
  8. Комбинирование модальностей: Будущее агентного UX в бесшовных переходах между модальностями

Паттерны проектирования

Общие паттерны:

  • Прогрессивное раскрытие: Основные возможности сначала, продвинутые по мере необходимости
  • Контекстуальная релевантность: Показывать наиболее вероятные действия
  • Гибридное управление контекстом: Краткосрочный на клиенте, долгосрочный на сервере
  • Изящная деградация: Четкие пути к разрешению при сбоях
  • Проактивная коммуникация: Сообщение возможностей и статуса

Специфичные для модальности:

  • Текст: Предложенные кнопки, примеры промптов, онбординг
  • Графический: Визуальная оркестрация, генеративные UI, структурированные меню
  • Голос: Обработка прерываний, краткие резюме, переключение на текст при проблемах
  • Видео: Эмоциональная нюансировка, мультисенсорные каналы

Следующие шаги

В следующей главе мы рассмотрим:

  • Использование инструментов (Tool Use)
  • Как перейти от обычных чатботов к системам, которые могут выполнять реальную работу