Лучшие практики¶
Рекомендации по настройке голосовых AI-агентов в SpeakNode для достижения наилучшего качества разговоров.
Голосовые настройки¶
Stability (стабильность голоса)¶
Параметр stability контролирует постоянство звучания голоса между фразами.
| Значение | Эффект |
|---|---|
| 0.3–0.5 | Более выразительный, эмоциональный голос |
| 0.5–0.75 | Рекомендуемый диапазон. Баланс естественности и стабильности |
| 0.75–1.0 | Монотонный, ровный голос |
Скорость речи¶
| Значение | Применение |
|---|---|
| 0.8–0.9x | Медленная речь — для пожилой аудитории или сложной информации |
| 0.9–1.1x | Рекомендуемый диапазон. Естественная скорость разговора |
| 1.1–1.3x | Быстрая речь — для коротких уведомлений |
Крайние значения
Скорость ниже 0.8x или выше 1.3x может сделать речь неразборчивой или неестественной.
Фоновые звуки¶
Фоновый звук создаёт эффект присутствия и повышает доверие собеседника.
- Офис — подходит для деловых звонков, создаёт ощущение колл-центра
- Тишина — для формальных сценариев, где фон неуместен
- Кофейня — для неформальных, дружелюбных разговоров
Дизайн разговора¶
Таймаут молчания¶
Время ожидания ответа пользователя перед тем, как агент продолжит разговор.
| Сценарий | Рекомендуемый таймаут |
|---|---|
| Поддержка клиентов | 5–10 секунд |
| Сбор данных (анкета) | 10–15 секунд |
| Продажи | 5–8 секунд |
| Подтверждение визита | 5–7 секунд |
Прерывания¶
Управление тем, может ли пользователь перебить агента.
Прерывания полностью отключены — пользователь вынужден дослушивать каждый ответ до конца, что вызывает раздражение.
Прерывания включены, но отключены во время первого сообщения. Пользователь может перебить агента в любой момент разговора, кроме приветствия.
Обработка тишины¶
Когда пользователь молчит, агент должен реагировать адекватно:
Выбор LLM-модели¶
| Модель | Скорость | Качество | Стоимость | Рекомендуемые сценарии |
|---|---|---|---|---|
| GPT-4o mini | Быстрая | Хорошее | Низкая | FAQ, простые сценарии, подтверждения |
| GPT-4o | Средняя | Высокое | Средняя | Поддержка, продажи, сложные разговоры |
| Claude 3.5 Sonnet | Средняя | Высокое | Средняя | Детальные консультации, аналитика |
| GPT-4 Turbo | Медленная | Очень высокое | Высокая | Критические сценарии, юридические вопросы |
Баланс скорости и качества
Для голосовых агентов скорость ответа критична. Задержка более 2 секунд создаёт неестественную паузу. Начните с быстрой модели и переходите к более мощной, только если качество ответов недостаточно.
Общие паттерны¶
Системный промпт¶
# Личность
Ты — Анна, оператор поддержки интернет-магазина «Домашний уют».
Говоришь дружелюбно, но профессионально.
# Цель
Помочь клиенту с вопросами по заказу, доставке или возврату.
# Ограничения
- Не обсуждай конкурентов
- Не давай скидок без подтверждения менеджера
- Максимум 3 предложения в каждом ответе
Длина ответов¶
Длинные подробные ответы по 5–7 предложений. Пользователь устаёт слушать и теряет нить.
Краткие ответы по 1–3 предложения. Если нужна подробность, спросите, хочет ли пользователь узнать больше.
Мультиагентные паттерны¶
Агент-маршрутизатор¶
Создайте основного агента, который определяет тему обращения и переключает на профильного:
# Цель
Определи тему обращения клиента и перенаправь на нужного специалиста.
# Темы
- Технические проблемы → переключи на агента техподдержки
- Вопросы по оплате → переключи на агента биллинга
- Общие вопросы → ответь самостоятельно
Эскалация¶
Настройте правило переключения для передачи сложных случаев:
# Ограничения
Если клиент трижды выражает недовольство или просит менеджера —
переключи на агента эскалации.
Тестирование
Всегда тестируйте мультиагентные сценарии end-to-end. Убедитесь, что контекст разговора передаётся корректно при переключении между агентами.