Size: a a a

Яндекс.Диалоги (сообщество разработчиков)

2020 November 10

С

Сергей in Яндекс.Диалоги (сообщество разработчиков)
Есть баг, почему-то только на станции. Если в навыке произносится: "Алиса"(самим навыком), то колонка начинает слушать сама себя и навык прерывается.
источник

С

Сергей in Яндекс.Диалоги (сообщество разработчиков)
А еще новый голос Аня какой-то хриплый
источник

Сс

Страшный сетевой адм... in Яндекс.Диалоги (сообщество разработчиков)
Сергей
А еще новый голос Аня какой-то хриплый
Или курит, или ковидла наелась...
источник
2020 November 11

A

Arkady in Яндекс.Диалоги (сообщество разработчиков)
Зачем так мрачно... Может, просто от души выбралась в караоке)
источник

AL

Aleksei Lakhno in Яндекс.Диалоги (сообщество разработчиков)
ID:0
Большое обновление голосов: новая технология синтеза и 3 новых голоса

Отличные новости для любителей теста Тьюринга!

Мы провели большое обновление голосов, которые разработчики Яндекс.Диалогов могут использовать для озвучивания своих навыков. Каждый из них работает на новой технологии GPU, что позволяет синтезированной речи звучать естественнее и приятнее для человека. 

Старые голоса (Захар, Джейн, Оксана и Ермил) были по умолчанию заменены на новые.

Также в консоли появилось 3 новых голоса. Встречайте:
Аня — веселая и общительная, прекрасно подойдет для детских или игровых навыков.
Костя — дружелюбный и ненавязчивый, любит рассказать о чем-нибудь новом.
Филипп — деловой и вдумчивый, подойдет для озвучивания новостей и организационных навыков. 

Обновленные голоса уже доступны в консоли Диалогов. Примеры синтеза можно послушать в блоге

Приятного знакомства!
Новые голоса - это здорово! Правда вылезло и пару неприятных моментов:
1. После обновления кое-где поехали ударения, если они не были проставлены явно. Например, во фразе "Назовите два номера от 1 до 14." раньше ударение в слове "номера" было на первый слог, а после обновления стало на последний. Пришлось проставить явно.
2. Кое-где поменялись склонения чисел. Раньше фраза "На карточке 1 - кошка, на карточке 2 - самолет." озвучивалась как "На карточке один - кошка, ...", а теперь "На карточке одна кошка, ...".

По таким моментам любое обновление генерации голоса может сломать озвучку незаметно для разработчика. Получается, все числа и потенциально неоднозначные ударения надо явно прописывать отдельно в text, отдельно в tts, даже если значение из text на момент создания навыка воспроизводится корректно без указания tts.

Поделитесь, кто как подходит к решению вопроса в своих навыках: сразу явно проставляете ударения и прописываете числа текстом в tts или только в том случае, если штатная озвучка поля text на момент разработки навыка ошибается?
источник

АП

Александр Полозов... in Яндекс.Диалоги (сообщество разработчиков)
Aleksei Lakhno
Новые голоса - это здорово! Правда вылезло и пару неприятных моментов:
1. После обновления кое-где поехали ударения, если они не были проставлены явно. Например, во фразе "Назовите два номера от 1 до 14." раньше ударение в слове "номера" было на первый слог, а после обновления стало на последний. Пришлось проставить явно.
2. Кое-где поменялись склонения чисел. Раньше фраза "На карточке 1 - кошка, на карточке 2 - самолет." озвучивалась как "На карточке один - кошка, ...", а теперь "На карточке одна кошка, ...".

По таким моментам любое обновление генерации голоса может сломать озвучку незаметно для разработчика. Получается, все числа и потенциально неоднозначные ударения надо явно прописывать отдельно в text, отдельно в tts, даже если значение из text на момент создания навыка воспроизводится корректно без указания tts.

Поделитесь, кто как подходит к решению вопроса в своих навыках: сразу явно проставляете ударения и прописываете числа текстом в tts или только в том случае, если штатная озвучка поля text на момент разработки навыка ошибается?
А как сменить Алису на Аню?
источник

AL

Aleksei Lakhno in Яндекс.Диалоги (сообщество разработчиков)
ID:0
Большое обновление голосов: новая технология синтеза и 3 новых голоса

Отличные новости для любителей теста Тьюринга!

Мы провели большое обновление голосов, которые разработчики Яндекс.Диалогов могут использовать для озвучивания своих навыков. Каждый из них работает на новой технологии GPU, что позволяет синтезированной речи звучать естественнее и приятнее для человека. 

Старые голоса (Захар, Джейн, Оксана и Ермил) были по умолчанию заменены на новые.

Также в консоли появилось 3 новых голоса. Встречайте:
Аня — веселая и общительная, прекрасно подойдет для детских или игровых навыков.
Костя — дружелюбный и ненавязчивый, любит рассказать о чем-нибудь новом.
Филипп — деловой и вдумчивый, подойдет для озвучивания новостей и организационных навыков. 

Обновленные голоса уже доступны в консоли Диалогов. Примеры синтеза можно послушать в блоге

Приятного знакомства!
Раньше для быстрого тестирования озвучки (ударения, склонения и т.п.) в процессе разработки часто использовал форму синтеза речи со страницы https://cloud.yandex.ru/services/speechkit
Но теперь там, похоже, совсем другая версия генерации голоса используется. Есть ли что-то на замену?
источник

AL

Aleksei Lakhno in Яндекс.Диалоги (сообщество разработчиков)
Александр Полозов
А как сменить Алису на Аню?
В консоли разработчика можно выбрать голос для навыка
источник

VP

Vitaliy Potapov in Яндекс.Диалоги (сообщество разработчиков)
Aleksei Lakhno
Новые голоса - это здорово! Правда вылезло и пару неприятных моментов:
1. После обновления кое-где поехали ударения, если они не были проставлены явно. Например, во фразе "Назовите два номера от 1 до 14." раньше ударение в слове "номера" было на первый слог, а после обновления стало на последний. Пришлось проставить явно.
2. Кое-где поменялись склонения чисел. Раньше фраза "На карточке 1 - кошка, на карточке 2 - самолет." озвучивалась как "На карточке один - кошка, ...", а теперь "На карточке одна кошка, ...".

По таким моментам любое обновление генерации голоса может сломать озвучку незаметно для разработчика. Получается, все числа и потенциально неоднозначные ударения надо явно прописывать отдельно в text, отдельно в tts, даже если значение из text на момент создания навыка воспроизводится корректно без указания tts.

Поделитесь, кто как подходит к решению вопроса в своих навыках: сразу явно проставляете ударения и прописываете числа текстом в tts или только в том случае, если штатная озвучка поля text на момент разработки навыка ошибается?
+1. У меня тоже в нескольких местах ударения и интонации съехали на новых голосах. У меня была идея завести публичный список слов, где ударение неоднозначное и автоматом прогонять по этому списку все тексты навыка.
источник

2

200cm3 in Яндекс.Диалоги (сообщество разработчиков)
Александр Полозов
А как сменить Алису на Аню?
а можно все посмотреть
источник

2

200cm3 in Яндекс.Диалоги (сообщество разработчиков)
простите. не удержался
источник

АП

Александр Полозов... in Яндекс.Диалоги (сообщество разработчиков)
Aleksei Lakhno
В консоли разработчика можно выбрать голос для навыка
Т.е. пользователь конечной Яндекс.Станции не может сменить Алису на Аню на постоянку - это только для навыков фишка?
источник

С

Сергей in Яндекс.Диалоги (сообщество разработчиков)
Александр Полозов
Т.е. пользователь конечной Яндекс.Станции не может сменить Алису на Аню на постоянку - это только для навыков фишка?
Нет конечно
источник

VP

Vitaliy Potapov in Яндекс.Диалоги (сообщество разработчиков)
Сергей
Нет конечно
А почему "конечно"?) В сбере например можно 😊
источник

С

Сергей in Яндекс.Диалоги (сообщество разработчиков)
Vitaliy Potapov
А почему "конечно"?) В сбере например можно 😊
Потому что голосовой ассистент Яндекса это Алиса. Мне кажется, все понятно. У Сбера это все дело называется Салют, а там уже три голоса на выбор.
источник

K

KaralevanKarolli 96 in Яндекс.Диалоги (сообщество разработчиков)
Aliyoo
источник

K

KaralevanKarolli 96 in Яндекс.Диалоги (сообщество разработчиков)
Kmlar bor guruh da
источник

2

200cm3 in Яндекс.Диалоги (сообщество разработчиков)
write in russian, please
источник

ДС

Дэн Смит in Яндекс.Диалоги (сообщество разработчиков)
Сбер вложил лямов 10 на обучение сотрудников нейронкам, и это только в этом году ))
источник

ДС

Дэн Смит in Яндекс.Диалоги (сообщество разработчиков)
не удивительно
источник