{
    "componentChunkName": "component---src-templates-doc-page-js",
    "path": "/docs/ru/telephony/recognition_synthesis_settings/",
    "result": {"data":{"site":{"siteMetadata":{"title":"Gatsby-doc-engine"}},"markdownRemark":{"id":"1aa8c8a9-08a3-5587-bae8-d4dee40b2d81","excerpt":"Распознавание и синтез речи В ботах, которые совершают и принимают звонки, используется распознавание и синтез речи. Automatic Speech Recognition (ASR) или…","html":"<h1>Распознавание и синтез речи</h1>\n<hr>\n<p>В ботах, которые совершают и принимают звонки, используется распознавание и синтез речи.</p>\n<ul>\n<li><em>Automatic Speech Recognition (ASR)</em> или распознавание речи — процесс преобразования речи в текст.</li>\n<li><em>Text-To-Speech (TTS)</em> или синтез речи — процесс генерации речи по печатному тексту.</li>\n</ul>\n<p>При создании телефонного канала вы можете:</p>\n<ul>\n<li><a href=\"#%D0%92%D1%8B%D0%B1%D0%BE%D1%80-%D0%BF%D1%80%D0%BE%D0%B2%D0%B0%D0%B9%D0%B4%D0%B5%D1%80%D0%B0\">Выбрать одного из провайдеров ASR/TTS</a>, предоставляемых Just AI.\n<ul>\n<li>В этом случае из интерфейса JAICP вы можете задать <a href=\"#%D0%9D%D0%B0%D1%81%D1%82%D1%80%D0%BE%D0%B9%D0%BA%D0%B0-ASR-%D0%B8-TTS\">настройки синтеза и распознавания речи</a>: например, выбрать модель распознавания, голос для синтеза и другие параметры.</li>\n</ul>\n</li>\n<li><a href=\"/1.11.1/docs/ru/telephony/own_telephony\">Создать подключение</a> с использованием собственного аккаунта одного из провайдеров ASR/TTS.</li>\n</ul>\n<p class='warn'>Если для ASR/TTS вы используете собственное подключение, использование <a href=/1.11.1/docs/ru/account_management/plan#asrtts-just-ai  >минут ASR/TTS Just AI</a> для вас не тарифицируется.</p>\n<br>\n<h2>Выбор провайдера</h2>\n<p>При <a href=\"/1.11.1/docs/ru/telephony/telephone_channel\">создании телефонного канала</a> вы можете выбрать провайдеров для ASR и TTS. Для этого перейдите на вкладку <em>ASR</em> и выберите подключение, затем проделайте то же самое для <em>TTS</em>.</p>\n<p class='tip'>При выборе определенного провайдера для ASR/TTS в случае неполадок вам необходимо самостоятельно переключить канал на другого провайдера.</p>\n<p>Вы также можете оставить вариант <em>По умолчанию</em>. В этом случае будут автоматически применены настройки наиболее стабильных провайдеров ASR и TTS. При неполадках у одного провайдера канал будет переключен на другого.</p>\n<br>\n<h2>Настройка ASR и TTS</h2>\n<h3>ASR</h3>\n<p>При создании телефонного канала вы можете выбрать одно из подключений для ASR и дополнительные настройки для него.</p>\n<br>\n<table>\n<thead>\n<tr>\n<th>Подключение</th>\n<th>Настройки</th>\n<th>Описание</th>\n</tr>\n</thead>\n<tbody>\n<tr>\n<td><strong>Google</strong></td>\n<td><em>Язык</em></td>\n<td>Сервис позволяет распознавать речь на различных языках. Полный список вы найдёте <a href=\"https://cloud.google.com/speech-to-text/docs/languages\" target=\"_blank\" rel=\"noopener noreferrer\">в документации Google</a>.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Модель</em></td>\n<td>Для распознавания речи используется <a href=\"https://cloud.google.com/speech-to-text/docs/basics#select-model\" target=\"_blank\" rel=\"noopener noreferrer\">одна из моделей машинного обучения</a>. Google обучил эти модели для определенных типов и источников звука. <br> <br> В <a href=\"https://cloud.google.com/speech-to-text/docs/languages\" target=\"_blank\" rel=\"noopener noreferrer\">таблице</a> перечислены модели, доступные для каждого языка: <br> <br> <em>Command and search</em> — используйте эту модель для распознавания речи в коротких аудиофайлах, например голосовых команд. <br> <br> <em>Default</em> — используйте эту модель в любых других случаях. <br> <br> <em>Phone call</em> — используйте эту модель для распознавания речи во время телефонного звонка. Модель доступна только при использовании <a href=\"/1.11.1/docs/ru/telephony/own_telephony#%D0%9A%D0%B0%D0%BA-%D0%BF%D0%BE%D0%B4%D0%BA%D0%BB%D1%8E%D1%87%D0%B8%D1%82%D1%8C-ASRTTS-Google\">собственного подключения ASR</a>.</td>\n</tr>\n<tr>\n<td><strong>Yandex</strong></td>\n<td><em>Язык</em></td>\n<td>Сервис позволяет распознавать речь на языках: <br> <br> <code class=\"language-text\">ru-RU</code> — русский, <br> <code class=\"language-text\">en-US</code> — английский, <br> <code class=\"language-text\">tr-TR</code> — турецкий.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Модель</em></td>\n<td>Для распознавания речи используется <a href=\"https://cloud.yandex.ru/docs/speechkit/stt/models\" target=\"_blank\" rel=\"noopener noreferrer\">одна из моделей машинного обучения</a>. Для обучения моделей используются массивы данных из сервисов и приложений Яндекса. <br></td>\n</tr>\n<tr>\n<td></td>\n<td><em>Распознавание чисел</em></td>\n<td>Если параметр включен, то в распознанном тексте указываются числа, а не числительные.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Сниженная чувствительность к шуму</em></td>\n<td>Уменьшает чувствительность распознавания к фоновому шуму.</td>\n</tr>\n<tr>\n<td><strong>Tinkoff</strong></td>\n<td></td>\n<td>На данный момент настройка подключения недоступна.</td>\n</tr>\n</tbody>\n</table>\n<br>\n<h3>TTS</h3>\n<p>При создании телефонного канала вы можете выбрать одно из подключений для TTS и дополнительные настройки для него.</p>\n<br>\n<table>\n<thead>\n<tr>\n<th>Подключение</th>\n<th>Настройки</th>\n<th>Описание</th>\n</tr>\n</thead>\n<tbody>\n<tr>\n<td><strong>Google</strong></td>\n<td><em>Язык</em></td>\n<td>Сервис позволяет синтезировать речь на различных языках. Полный список вы найдёте <a href=\"https://cloud.google.com/text-to-speech/docs/voices\" target=\"_blank\" rel=\"noopener noreferrer\">в документации Google</a>.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Голос</em></td>\n<td>Сервис позволяет использовать различные голоса. Полный список вы найдете <a href=\"https://cloud.google.com/text-to-speech/docs/voices\" target=\"_blank\" rel=\"noopener noreferrer\">в документации Google</a>. <br> <br> По умолчанию используется голос: <br> <br><code class=\"language-text\">en-US-Wavenet-A</code> для английского;<br> <code class=\"language-text\"> ru-RU-Wavenet-B</code> для русского; <br> <code class=\"language-text\">cmn-CN-Wavenet-B</code> для китайского; <br> <code class=\"language-text\">Wavenet-A</code> для других языков.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Скорость</em></td>\n<td>Темп или скорость речи. Где <code class=\"language-text\">1</code> — нормальная скорость определенного голоса.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Высота голоса</em></td>\n<td>Высота голоса. Где <code class=\"language-text\">20</code> — увеличение на 20 полутонов от исходного тона, а <code class=\"language-text\">-20</code> соответствующее уменьшение.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Повышение громкости</em></td>\n<td>Увеличение громкости в дБ от нормальной громкости определенного голоса. При установленном значении <code class=\"language-text\">+6.0</code> дБ громкость воспроизведения приблизительно в два раза превышает нормальную. Настоятельно не рекомендуется превышать <code class=\"language-text\">+10.0</code> дБ.</td>\n</tr>\n<tr>\n<td><strong>Yandex</strong></td>\n<td><em>Язык</em></td>\n<td>Вы можете синтезировать речь на трех языках:<br> <br> <code class=\"language-text\">ru-RU</code> русский; <br> <code class=\"language-text\">en-US</code> английский; <br> <code class=\"language-text\">tr-TR</code> турецкий.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Голос</em></td>\n<td>Сервис позволяет использовать различные голоса, полный список вы найдёте <a href=\"https://cloud.yandex.ru/docs/speechkit/tts/voices\" target=\"_blank\" rel=\"noopener noreferrer\">в документации Yandex</a>. По умолчанию используется голос: <br> <br><code class=\"language-text\">alyss</code> для английского;<br> <code class=\"language-text\">alena</code> для русского; <br> <code class=\"language-text\">alyss</code> для других языков.</td>\n</tr>\n<tr>\n<td></td>\n<td><em>Скорость</em></td>\n<td>Темп или скорость речи. Где <code class=\"language-text\">1</code> — нормальная скорость определенного голоса.</td>\n</tr>\n</tbody>\n</table>","frontmatter":{"title":"","description":null},"headings":[{"value":"Распознавание и синтез речи"}]}},"pageContext":{"slug":"/docs/ru/telephony/recognition_synthesis_settings/","previous":{"fields":{"slug":"/docs/ru/telephony/sip_providers/"},"frontmatter":{"title":"","description":null}},"next":{"fields":{"slug":"/docs/ru/telephony/own_telephony/"},"frontmatter":{"title":"","description":null}}}},
    "staticQueryHashes": ["1209419333"]}