Перейти к содержанию

Лучшие практики

Рекомендации по настройке голосовых AI-агентов в SpeakNode для достижения наилучшего качества разговоров.

Голосовые настройки

Stability (стабильность голоса)

Параметр stability контролирует постоянство звучания голоса между фразами.

Значение Эффект
0.3–0.5 Более выразительный, эмоциональный голос
0.5–0.75 Рекомендуемый диапазон. Баланс естественности и стабильности
0.75–1.0 Монотонный, ровный голос

Скорость речи

Значение Применение
0.8–0.9x Медленная речь — для пожилой аудитории или сложной информации
0.9–1.1x Рекомендуемый диапазон. Естественная скорость разговора
1.1–1.3x Быстрая речь — для коротких уведомлений

Крайние значения

Скорость ниже 0.8x или выше 1.3x может сделать речь неразборчивой или неестественной.

Фоновые звуки

Фоновый звук создаёт эффект присутствия и повышает доверие собеседника.

  • Офис — подходит для деловых звонков, создаёт ощущение колл-центра
  • Тишина — для формальных сценариев, где фон неуместен
  • Кофейня — для неформальных, дружелюбных разговоров

Дизайн разговора

Таймаут молчания

Время ожидания ответа пользователя перед тем, как агент продолжит разговор.

Сценарий Рекомендуемый таймаут
Поддержка клиентов 5–10 секунд
Сбор данных (анкета) 10–15 секунд
Продажи 5–8 секунд
Подтверждение визита 5–7 секунд

Прерывания

Управление тем, может ли пользователь перебить агента.

Прерывания полностью отключены — пользователь вынужден дослушивать каждый ответ до конца, что вызывает раздражение.

Прерывания включены, но отключены во время первого сообщения. Пользователь может перебить агента в любой момент разговора, кроме приветствия.

Обработка тишины

Когда пользователь молчит, агент должен реагировать адекватно:

Вы молчите. Есть ли у вас вопросы?
Если у вас есть вопросы, я готов помочь. Могу также повторить информацию.

Выбор LLM-модели

Модель Скорость Качество Стоимость Рекомендуемые сценарии
GPT-4o mini Быстрая Хорошее Низкая FAQ, простые сценарии, подтверждения
GPT-4o Средняя Высокое Средняя Поддержка, продажи, сложные разговоры
Claude 3.5 Sonnet Средняя Высокое Средняя Детальные консультации, аналитика
GPT-4 Turbo Медленная Очень высокое Высокая Критические сценарии, юридические вопросы

Баланс скорости и качества

Для голосовых агентов скорость ответа критична. Задержка более 2 секунд создаёт неестественную паузу. Начните с быстрой модели и переходите к более мощной, только если качество ответов недостаточно.

Общие паттерны

Системный промпт

Ты — AI-ассистент. Помогай пользователям.
Слишком общий промпт. Агент не понимает контекст и отвечает расплывчато.

# Личность
Ты — Анна, оператор поддержки интернет-магазина «Домашний уют».
Говоришь дружелюбно, но профессионально.

# Цель
Помочь клиенту с вопросами по заказу, доставке или возврату.

# Ограничения
- Не обсуждай конкурентов
- Не давай скидок без подтверждения менеджера
- Максимум 3 предложения в каждом ответе

Длина ответов

Длинные подробные ответы по 5–7 предложений. Пользователь устаёт слушать и теряет нить.

Краткие ответы по 1–3 предложения. Если нужна подробность, спросите, хочет ли пользователь узнать больше.

Мультиагентные паттерны

Агент-маршрутизатор

Создайте основного агента, который определяет тему обращения и переключает на профильного:

# Цель
Определи тему обращения клиента и перенаправь на нужного специалиста.

# Темы
- Технические проблемы → переключи на агента техподдержки
- Вопросы по оплате → переключи на агента биллинга
- Общие вопросы → ответь самостоятельно

Эскалация

Настройте правило переключения для передачи сложных случаев:

# Ограничения
Если клиент трижды выражает недовольство или просит менеджера —
переключи на агента эскалации.

Тестирование

Всегда тестируйте мультиагентные сценарии end-to-end. Убедитесь, что контекст разговора передаётся корректно при переключении между агентами.