{
    "componentChunkName": "component---src-templates-doc-page-js",
    "path": "/docs/ru/telephony/recognition_synthesis_settings/",
    "result": {"data":{"site":{"siteMetadata":{"title":"Gatsby-doc-engine"}},"markdownRemark":{"id":"5f54cfcb-d0a4-5eeb-94de-42a814901898","excerpt":"Распознавание и синтез речи В ботах, которые совершают и принимают звонки, используется распознавание и синтез речи. Automatic Speech Recognition (ASR) или…","html":"<h1>Распознавание и синтез речи</h1>\n<hr>\n<p>В ботах, которые совершают и принимают звонки, используется распознавание и синтез речи.</p>\n<ul>\n<li><em>Automatic Speech Recognition (ASR)</em> или распознавание речи — процесс преобразования речи в текст.</li>\n<li><em>Text-To-Speech (TTS)</em> или синтез речи — процесс генерации речи по печатному тексту.</li>\n</ul>\n<p>При создании телефонного канала вы можете:</p>\n<ul>\n<li><a href=\"#%D0%92%D1%8B%D0%B1%D0%BE%D1%80-%D0%BF%D1%80%D0%BE%D0%B2%D0%B0%D0%B9%D0%B4%D0%B5%D1%80%D0%B0\">Выбрать одного из провайдеров ASR/TTS</a>, предоставляемых Just AI.\n<ul>\n<li>В этом случае из интерфейса JAICP вы можете задать <a href=\"#%D0%9D%D0%B0%D1%81%D1%82%D1%80%D0%BE%D0%B9%D0%BA%D0%B0-ASR-%D0%B8-TTS\">настройки синтеза и распознавания речи</a>: например, выбрать модель распознавания, голос для синтеза и другие параметры.</li>\n</ul>\n</li>\n<li><a href=\"/1.11.7/docs/ru/telephony/own_telephony\">Создать подключение</a> с использованием собственного аккаунта одного из провайдеров ASR/TTS.</li>\n</ul>\n<p class='warn'>Если для ASR/TTS вы используете собственное подключение, использование <a href=/1.11.7/docs/ru/account_management/plan#asrtts-just-ai  >минут ASR/TTS Just AI</a> для вас не тарифицируется.</p>\n<h2>Выбор провайдера</h2>\n<p>При <a href=\"/1.11.7/docs/ru/telephony/telephone_channel\">создании телефонного канала</a> вы можете выбрать провайдеров для ASR и TTS. Для этого перейдите на вкладку <em>ASR</em> и выберите подключение, затем проделайте то же самое для <em>TTS</em>.</p>\n<p class='tip'>При выборе определенного провайдера для ASR/TTS в случае неполадок вам необходимо самостоятельно переключить канал на другого провайдера.</p>\n<p>Вы также можете оставить вариант <em>По умолчанию</em>. В этом случае будут автоматически применены настройки наиболее стабильных провайдеров ASR и TTS. При неполадках у одного провайдера канал будет переключен на другого.</p>\n<h2>Настройка ASR и TTS</h2>\n<h3>ASR</h3>\n<p>При создании телефонного канала вы можете выбрать одно из подключений для ASR и дополнительные настройки для него.</p>\n<br>\n<table>\n<thead>\n<tr>\n<th>Подключение</th>\n<th>Настройки</th>\n<th>Описание</th>\n</tr>\n</thead>\n<tbody>\n<tr>\n<td><strong>Google</strong></td>\n<td><em>Язык</em></td>\n<td>Сервис позволяет распознавать речь на различных языках. Полный список вы найдёте <a href=\"https://cloud.google.com/speech-to-text/docs/languages\" target=\"_blank\" rel=\"noopener noreferrer\">в документации Google</a>.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Модель</em></td>\n<td>Для распознавания речи используется <a href=\"https://cloud.google.com/speech-to-text/docs/basics#select-model\" target=\"_blank\" rel=\"noopener noreferrer\">одна из моделей машинного обучения</a>. Google обучил эти модели для определенных типов и источников звука. <br> <br> В <a href=\"https://cloud.google.com/speech-to-text/docs/languages\" target=\"_blank\" rel=\"noopener noreferrer\">таблице</a> перечислены модели, доступные для каждого языка: <br> <br> <em>Command and search</em> — используйте эту модель для распознавания речи в коротких аудиофайлах, например голосовых команд. <br> <br> <em>Default</em> — используйте эту модель в любых других случаях. <br> <br> <em>Phone call</em> — используйте эту модель для распознавания речи во время телефонного звонка. Модель доступна только при использовании <a href=\"/1.11.7/docs/ru/telephony/own_telephony#%D0%9A%D0%B0%D0%BA-%D0%BF%D0%BE%D0%B4%D0%BA%D0%BB%D1%8E%D1%87%D0%B8%D1%82%D1%8C-ASRTTS-Google\">собственного подключения ASR</a>.</td>\n</tr>\n<tr>\n<td><strong>Yandex</strong></td>\n<td><em>Язык</em></td>\n<td>Сервис позволяет распознавать речь на языках: <br> <br> <code class=\"language-text\">ru-RU</code> — русский, <br> <code class=\"language-text\">en-US</code> — английский, <br> <code class=\"language-text\">tr-TR</code> — турецкий.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Модель</em></td>\n<td>Для распознавания речи используется <a href=\"https://cloud.yandex.ru/docs/speechkit/stt/models\" target=\"_blank\" rel=\"noopener noreferrer\">одна из моделей машинного обучения</a>. Для обучения моделей используются массивы данных из сервисов и приложений Яндекса. <br></td>\n</tr>\n<tr>\n<td></td>\n<td><em>Распознавание чисел</em></td>\n<td>Если параметр включен, то в распознанном тексте указываются числа, а не числительные.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Сниженная чувствительность к шуму</em></td>\n<td>Уменьшает чувствительность распознавания к фоновому шуму.</td>\n</tr>\n<tr>\n<td><strong>Tinkoff</strong></td>\n<td></td>\n<td>На данный момент настройка подключения недоступна.</td>\n</tr>\n</tbody>\n</table>\n<h3>TTS</h3>\n<p>При создании телефонного канала вы можете выбрать одно из подключений для TTS и дополнительные настройки для него.</p>\n<br>\n<table>\n<thead>\n<tr>\n<th>Подключение</th>\n<th>Настройки</th>\n<th>Описание</th>\n</tr>\n</thead>\n<tbody>\n<tr>\n<td><strong>Google</strong></td>\n<td><em>Язык</em></td>\n<td>Сервис позволяет синтезировать речь на различных языках. Полный список вы найдёте <a href=\"https://cloud.google.com/text-to-speech/docs/voices\" target=\"_blank\" rel=\"noopener noreferrer\">в документации Google</a>.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Голос</em></td>\n<td>Сервис позволяет использовать различные голоса. Полный список вы найдете <a href=\"https://cloud.google.com/text-to-speech/docs/voices\" target=\"_blank\" rel=\"noopener noreferrer\">в документации Google</a>. <br> <br> По умолчанию используется голос: <br> <br><code class=\"language-text\">en-US-Wavenet-A</code> для английского;<br> <code class=\"language-text\">ru-RU-Wavenet-B</code> для русского; <br> <code class=\"language-text\">cmn-CN-Wavenet-B</code> для китайского; <br> <code class=\"language-text\">Wavenet-A</code> для других языков.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Скорость</em></td>\n<td>Темп или скорость речи, где <code class=\"language-text\">1</code> — нормальная скорость определенного голоса.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Высота голоса</em></td>\n<td>Высота голоса, где <code class=\"language-text\">20</code> — увеличение на 20 полутонов от исходного тона, а <code class=\"language-text\">-20</code> — соответствующее уменьшение.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Повышение громкости</em></td>\n<td>Увеличение громкости в дБ от нормальной громкости определенного голоса. При установленном значении <code class=\"language-text\">+6.0</code> дБ громкость воспроизведения приблизительно в два раза превышает нормальную. Настоятельно не рекомендуется превышать <code class=\"language-text\">+10.0</code> дБ.</td>\n</tr>\n<tr>\n<td><strong>Yandex</strong></td>\n<td><em>Язык</em></td>\n<td>Вы можете синтезировать речь на трех языках:<br> <br> <code class=\"language-text\">ru-RU</code> русский; <br> <code class=\"language-text\">en-US</code> английский; <br> <code class=\"language-text\">tr-TR</code> турецкий.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Голос</em></td>\n<td>Сервис позволяет использовать различные голоса, полный список вы найдёте <a href=\"https://cloud.yandex.ru/docs/speechkit/tts/voices\" target=\"_blank\" rel=\"noopener noreferrer\">в документации Yandex</a>. По умолчанию используется голос: <br> <br><code class=\"language-text\">alyss</code> для английского;<br> <code class=\"language-text\">alena</code> для русского; <br> <code class=\"language-text\">alyss</code> для других языков.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Скорость</em></td>\n<td>Темп или скорость речи, где <code class=\"language-text\">1</code> — нормальная скорость определенного голоса.</td>\n</tr>\n<tr>\n<td><strong>Aimyvoice</strong></td>\n<td><em>Голос</em></td>\n<td>Для использования в JAICP доступны голоса <a href=\"https://aimyvoice.com/catalog/8\" target=\"_blank\" rel=\"noopener noreferrer\">Татьяна</a> и <a href=\"https://aimyvoice.com/catalog/34\" target=\"_blank\" rel=\"noopener noreferrer\">Василий</a>.</td>\n</tr>\n</tbody>\n</table>\n<p class='warn'><a href=https://aimyvoice.com/ target=\"_blank\" rel=\"noopener noreferrer\">Aimyvoice</a> — платформа для синтеза речи от Just AI, где вы можете подобрать готовый голос для вашей задачи, а также обучать собственные голоса на своих данных.</p>\n<h4>Yandex v3 <span class=\"tag-heading blue\">Ранний доступ</span></h4>\n<p>В настройках TTS от Yandex доступен дополнительный переключатель <em>Включить Yandex v3</em>.\r\nЕсли переключатель активен, для синтеза речи используется третья версия протокола Yandex SpeechKit.</p>\n<blockquote>\n<p>Возможность сменить версию протокола находится в раннем доступе.\r\nОбратитесь к нам по адресу <a href=\"mailto:sales@just-ai.com\" target=\"_blank\" rel=\"noopener noreferrer\">sales@just-ai.com</a> за подробной информацией.</p>\n</blockquote>\n<p>Если используется третья версия протокола, для подключения дополнительно доступны настройки:</p>\n<ul>\n<li><em>Громкость</em> — громкость относительно цифровой полной шкалы <a href=\"https://ru.wikipedia.org/wiki/LKFS\" target=\"_blank\" rel=\"noopener noreferrer\">LUFS</a> от −145 до 0. Рекомендуемый диапазон значений — от −20 до −16 LUFS.</li>\n<li><em>Использовать переменные</em> — если переключатель активен, для синтеза речи используется технология <a href=\"/1.11.7/docs/ru/telephony/tts-with-variables/yandex-adaptive\">Yandex SpeechKit Brand Voice Adaptive</a> с поддержкой переменных.</li>\n</ul>\n<p class='tip'><strong>Примечание 1.</strong> При использовании Yandex v3 длина фраз, которые подаются на синтез,\r\nне должна превышать 160 символов, включая пробелы и знаки препинания. В противном случае провайдер вернет ошибку.</p>\n<p class='tip'><strong>Примечание 2.</strong> При активном переключателе <em>Использовать переменные</em> в сценарии не работает тег <a href=/1.11.7/docs/ru/JAICP_DSL/tags/reaction_tags/a  ><code class=\"language-text\">a</code></a> и метод <a href=/1.11.7/docs/ru/JS_API/built_in_services/reactions/answer  ><code class=\"language-text\">$reactions.answer</code></a>.\r\nВозможно только воспроизведение аудио через тег <a href=/1.11.7/docs/ru/JAICP_DSL/tags/reaction_tags/audio  ><code class=\"language-text\">audio</code></a> или <a href=/1.11.7/docs/ru/JS_API/built_in_services/reactions/audio  ><code class=\"language-text\">$reactions.audio</code></a>, а также вызов <a href=/1.11.7/docs/ru/JS_API/built_in_services/reactions/ttsWithVariables  ><code class=\"language-text\">$reactions.ttsWithVariables</code></a>.</p>","frontmatter":{"title":"","description":null},"headings":[{"value":"Распознавание и синтез речи"}]}},"pageContext":{"slug":"/docs/ru/telephony/recognition_synthesis_settings/","previous":{"fields":{"slug":"/docs/ru/telephony/sip_providers/"},"frontmatter":{"title":"","description":null}},"next":{"fields":{"slug":"/docs/ru/telephony/lists_of_numbers/"},"frontmatter":{"title":"","description":null}}}},
    "staticQueryHashes": ["1209419333"]}