{
    "componentChunkName": "component---src-templates-doc-page-js",
    "path": "/docs/ru/telephony/recognition_synthesis_settings/",
    "result": {"data":{"site":{"siteMetadata":{"title":"Gatsby-doc-engine"}},"markdownRemark":{"id":"ae0150d2-7072-52a4-81fb-e98407c3a18b","excerpt":"Распознавание и синтез речи В ботах, которые совершают и принимают звонки используется синтез и распознавание речи, TTS и ASR, соответственно. Text-To-Speech…","html":"<h1>Распознавание и синтез речи</h1>\n<hr>\n<p>В ботах, которые совершают и принимают звонки используется синтез и распознавание речи, <a href=\"#TTS\">TTS</a> и <a href=\"#ASR\">ASR</a>, соответственно.</p>\n<ul>\n<li><em>Text-To-Speech (TTS)</em> или синтез речи — процесс генерирования речи по печатному тексту.</li>\n<li><em>Automatic Speech Recognition (ASR)</em> или распознавание речи — процесс преобразования речи в текст.</li>\n</ul>\n<p>При создании телефонного канала вы можете:</p>\n<ul>\n<li><a href=\"#%D0%9D%D0%B0%D1%81%D1%82%D1%80%D0%BE%D0%B9%D0%BA%D0%B0-%D1%80%D0%B0%D1%81%D0%BF%D0%BE%D0%B7%D0%BD%D0%B0%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F-%D0%B8-%D1%81%D0%B8%D0%BD%D1%82%D0%B5%D0%B7%D0%B0-%D1%80%D0%B5%D1%87%D0%B8\">Выбрать провайдеров, а также настроить синтез и распознавание речи</a>. Например, выбрать голос или модель распознавания. Или оставить стандартные настройки по умолчанию.</li>\n<li><a href=\"/1.10.3/docs/ru/telephony/own_telephony\">Создать подключение</a> с использованием собственного аккаунта одного из провайдеров для распознавания и синтеза речи.</li>\n</ul>\n</br>\n<h3>Выбор провайдера</h3>\n<p>При <a href=\"/1.10.3/docs/ru/telephony/telephone_channel\">создании телефонного канала</a> вы можете выбрать провайдеров для ASR и TTS. Для этого перейдите на вкладку <em>ASR</em> и выберите подключение, затем проделайте то же самое для <em>TTS</em>.</p>\n<p>Обратите внимание, что при выборе определенного провайдера для ASR и TTS в случае неполадок вам необходимо самостоятельно переключить канал на другого поставщика.</p>\n<p>Также вы можете оставить вариант <em>По умолчанию</em>, в этом случае будут автоматически применены настройки наиболее стабильных провайдеров ASR и TTS. При неполадках у провайдеров, канал будет переключен на другого поставщика.</p>\n</br>\n<h3>Настройка ASR и TTS</h3>\n<h4>ASR</h4>\n<p>При создании телефонного канала вы можете выбрать одно из подключений для ASR и дополнительные настройки для него.</p>\n</br>\n<table>\n<thead>\n<tr>\n<th>Подключение</th>\n<th>Настройки</th>\n<th>Описание</th>\n</tr>\n</thead>\n<tbody>\n<tr>\n<td><strong>Google</strong></td>\n<td><em>Язык</em></td>\n<td>Сервис позволяет распознавать речь на различных языках. Полный список вы найдёте <a href=\"https://cloud.google.com/speech-to-text/docs/languages\" target=\"_blank\" rel=\"noopener noreferrer\">здесь</a>. По умолчанию используется английский язык <code class=\"language-text\">en-US</code>.</td>\n</tr>\n</tbody>\n</table>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">       | *Модель* | Для распознавания речи используется [одна из моделей машинного обучения](https://cloud.google.com/speech-to-text/docs/basics#select-model). Google обучил эти модели для определенных типов и источников звука. &lt;/br> &lt;/br> В [таблице](https://cloud.google.com/speech-to-text/docs/languages) перечислены модели, доступные для каждого языка: &lt;/br> &lt;/br> `Phone call` — используйте эту модель для распознавания речи во время телефонного звонка. &lt;/br> &lt;/br> `Command and search` — используйте эту модель для распознавания речи в коротких аудиофайлах, например, голосовые команды. &lt;/br> &lt;/br> `Default` — используйте эту модель, если ранее описанные не подошли.</code></pre></div>\n<p><strong>Yandex</strong> | <em>Язык</em>  | Сервис позволяет распознавать речь на языках: </br> </br> <code class=\"language-text\">ru-RU</code> (по умолчанию) — русский, </br> <code class=\"language-text\">en-US</code> — английский, </br> <code class=\"language-text\">tr-TR</code> — турецкий.\r\n| <em>Модель</em> |  Для распознавания речи используется <a href=\"https://cloud.yandex.ru/docs/speechkit/stt/models\" target=\"_blank\" rel=\"noopener noreferrer\">одна из моделей машинного обучения</a>. Для обучения моделей используются массивы данных из сервисов и приложений Яндекса. </br> </br>\r\n<strong>Tinkoff</strong> | | На данный момент настройка подключения недоступна.</p>\n</br>\n<h4>TTS</h4>\n<p>При создании телефонного канала вы можете выбрать одно из подключений для TTS и дополнительные настройки для него.</p>\n</br>\n<table>\n<thead>\n<tr>\n<th>Подключение</th>\n<th>Настройки</th>\n<th>Описание</th>\n</tr>\n</thead>\n<tbody>\n<tr>\n<td><strong>Google</strong></td>\n<td><em>Язык</em></td>\n<td>Сервис позволяет синтезировать речь на различных языках. Полный список вы найдёте <a href=\"https://cloud.google.com/speech-to-text/docs/languages\" target=\"_blank\" rel=\"noopener noreferrer\">здесь</a>.</td>\n</tr>\n</tbody>\n</table>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">       | *Голос* | Сервис позволяет использовать различные голоса, полный список вы найдёте [здесь](https://cloud.google.com/text-to-speech/docs/voices). &lt;/br> &lt;/br> По умолчанию используется голос: &lt;/br> &lt;/br>`en-US-Wavenet-A` для английского;&lt;/br> ` ru-RU-Wavenet-B` для русского; &lt;/br> `cmn-CN-Wavenet-B` для китайского; &lt;/br> `Wavenet-A` для других языков.\r\n       | *Скорость* | Темп или скорость речи. Где `1` — нормальная скорость определенного голоса.\r\n       | *Высота голоса* | Высота голоса. Где `20` — увеличение на 20 полутонов от исходного тона, а `-20` соответствующее уменьшение.\r\n       | *Повышение громкости* | Увеличение громкости в дБ от нормальной громкости определенного голоса. При установленном значении `+6.0` дБ громкость воспроизведения приблизительно в два раза превышает нормальную. Настоятельно не рекомендуется превышать `+10.0` дБ.</code></pre></div>\n<p><strong>Яндекс</strong> | <em>Язык</em> | Вы можете синтезировать речь на трех языках:</br> </br> <code class=\"language-text\">ru-RU</code> русский; </br> <code class=\"language-text\">en-US</code> английский; </br> <code class=\"language-text\">tr-TR</code> турецкий.\r\n| <em>Голос</em> | Сервис позволяет использовать различные голоса, полный список вы найдёте <a href=\"https://cloud.yandex.ru/docs/speechkit/tts/voices\" target=\"_blank\" rel=\"noopener noreferrer\">здесь</a>. По умолчанию используется голос: </br> </br><code class=\"language-text\">alyss</code> для английского;</br> <code class=\"language-text\">alena</code> для русского; </br> <code class=\"language-text\">alyss</code> для других языков.\r\n| <em>Скорость</em> | Темп или скорость речи. Где <code class=\"language-text\">1</code> — нормальная скорость определенного голоса.</p>","frontmatter":{"title":"","description":null},"headings":[{"value":"Распознавание и синтез речи"}]}},"pageContext":{"slug":"/docs/ru/telephony/recognition_synthesis_settings/","previous":{"fields":{"slug":"/docs/ru/telephony/sip_providers/"},"frontmatter":{"title":"","description":null}},"next":{"fields":{"slug":"/docs/ru/telephony/script_voice_bot/"},"frontmatter":{"title":"","description":null}}}},
    "staticQueryHashes": ["1209419333"]}