Воспроизведение аудио


В телефонном канале и в голосовых ассистентах в качестве ответов бота можно использовать не только синтезированные реплики, но и предзаписанные аудиофайлы. Основное преимущество аудио в том, что речь диктора более живая и динамичная. Это позволяет более качественно выстраивать диалог с клиентами.

Если вам нужно, чтобы бот озвучивал в диалоге переменные значения, зависящие от контекста, вы можете воспользоваться синтезом речи с переменными.

Формат аудиофайлов

Для телефонного канала
Для голосовых ассистентов
  • Расширение файла .wav.
    • Постоянный битрейт 128 кбит/c.
    • 1 канал (моно).
    • Частота дискретизации 8–48 кГц.
    • Кодирование 16-bit (PCM) little-endian.
  • Размер файла не более 10 Мбайт.
  • Расширение файла .mp3.
  • Продолжительность не более 4 минут.
  • Размер файла не более 10 Мбайт.

Использование в сценарии

Есть несколько способов воспроизвести аудио из сценария:

  • Через DSL-тег audio.
  • Через метод $reactions.audio.
  • Через ответ с типом audio в массиве $response.replies.

Во всех случаях нужно указать прямую ссылку на аудиофайл. Файл может быть размещен в любом хранилище, где до него есть публичный доступ.

state: Playback
    audio: https://example.com/audio.wav

Кэширование аудио

При первом воспроизведении аудиофайлы кэшируются на сервере, где размещен бот. Это позволяет при повторном воспроизведении проигрывать их без дополнительных задержек.

Ключом в кэше выступают ссылки на аудиофайлы. Это означает, что если изменить содержимое исходного аудиофайла, например обрезать или заменить текст на другой, но название оставить прежним, изменения не отразятся в боте. Будет по-прежнему использоваться изначальная версия аудио из кэша.

При внесении изменений в воспроизводимые аудиофайлы не забывайте их переименовывать.