JAICP

Распознавание и синтез речи


В ботах, которые совершают и принимают звонки, используется распознавание и синтез речи:

  • Automatic Speech Recognition (ASR) или распознавание речи — процесс преобразования речи в текст.
  • Text-To-Speech (TTS) или синтез речи — процесс генерации речи по печатному тексту.

При создании телефонного канала вы можете:

  • Выбрать одного из провайдеров ASR/TTS, предоставляемых Just AI.
    В этом случае из интерфейса JAICP вы можете задать настройки синтеза и распознавания речи: например, выбрать модель распознавания, голос для синтеза и другие параметры.

  • Создать подключение с использованием собственного аккаунта одного из провайдеров ASR/TTS.

    Если для ASR/TTS вы используете собственное подключение, использование минут ASR/TTS Just AI для вас не тарифицируется.

Затем для формирования ответов из сценария вам нужно будет использовать тег a или метод $reactions.answer.

Разметка синтеза речи

Чтобы сделать речь бота более выразительной, вы можете использовать разметку синтеза речи. JAICP поддерживает специальный язык разметки синтеза речи (SSML), который позволяет настраивать тон, произношение, скорость, громкость речи и пр. Подробнее см. в разделе Разметка синтеза речи.

Синтез речи с переменными

Вы также можете использовать синтез речи с переменными, если хотите, чтобы бот озвучивал в диалоге переменные значения, зависящие от контекста. Подробнее см. в разделе Синтез речи с переменными.