Size: a a a

Распознавание речи

2018 December 26

AZ

Andrey Zhonin in Распознавание речи
на style tokens уже получается очень убедительная интонация. Но ее все равно размечать
источник

ап

алексей пономаренко in Распознавание речи
https://github.com/Olga-Yakovleva/RHVoice вот не плохой проект по синтезу голоса. Русский язык вполне, единственное на слух ощущается что голос синтетический.
источник
2019 January 02

n

neardeath in Распознавание речи
В общем, т. к. Яндекс не продоставляет SDK с функционалом как у Яндекс.Станции (т. е. преобразования голоса в команды и разделение их на команды для колонки (увеличить громкость) и для Алисы (какая завтра погода)), хочу спросить, как реализовать данные функции?
источник
2019 January 04

KD

Konstantin Dolgikh in Распознавание речи
neardeath
В общем, т. к. Яндекс не продоставляет SDK с функционалом как у Яндекс.Станции (т. е. преобразования голоса в команды и разделение их на команды для колонки (увеличить громкость) и для Алисы (какая завтра погода)), хочу спросить, как реализовать данные функции?
Если вам нужно распознавание сущностей в тексте, то это Natural Language Processing. Сфинкс этим не занимается совсем. Есть отечественная Open Source разработка на Питон "Наташа", но я с ней не разобрался, могу дать ссылку на чат по NLP в Телеграме (там можно и по Наташе вопросы задавать и более общие вопросы)

UPD: https://t.me/natural_language_processing

UPD2: ну или просто ручками прописывать поиск соответствующих команд в распознаваемом тексте :)
источник

n

neardeath in Распознавание речи
Konstantin Dolgikh
Если вам нужно распознавание сущностей в тексте, то это Natural Language Processing. Сфинкс этим не занимается совсем. Есть отечественная Open Source разработка на Питон "Наташа", но я с ней не разобрался, могу дать ссылку на чат по NLP в Телеграме (там можно и по Наташе вопросы задавать и более общие вопросы)

UPD: https://t.me/natural_language_processing

UPD2: ну или просто ручками прописывать поиск соответствующих команд в распознаваемом тексте :)
Спасибо большое, просмотрю
источник
2019 January 05

t2

tonko 22 in Распознавание речи
Должно ли падать качество распознавания речи, если модель под 16к, а файлы я перегоняю из 8к (ffmpeg -ar 16000)? Другими словами, имеет ли смысл записывать в 16к либо переобучать модель под 8к?
источник

AZ

Andrey Zhonin in Распознавание речи
Должно. Имеет, записывать на 16кгц
источник

t2

tonko 22 in Распознавание речи
Спасибо, понял
источник

t2

tonko 22 in Распознавание речи
А если допустим нет возможности писать 16к, то что лучше - обучать модель под 8, снижая sample rate обучающей выборки, либо же обучаться на 16к, и конвертировать 8->16 при распознавании?
источник

AZ

Andrey Zhonin in Распознавание речи
Первое, второе бессмысленно. Но первое затратно, акустику учить
источник

t2

tonko 22 in Распознавание речи
Благодарю
источник

t2

tonko 22 in Распознавание речи
Я с espnet сейчас экспериментирую
источник

t2

tonko 22 in Распознавание речи
Еще надо бы добраться до wav2letter
источник
2019 January 13

RF

Richard Feynman in Распознавание речи
Всем привет
источник

RF

Richard Feynman in Распознавание речи
Есть вопрос про livespeech на питон 3.6
источник

RF

Richard Feynman in Распознавание речи
источник

RF

Richard Feynman in Распознавание речи
с такой ошибкой
источник

RF

Richard Feynman in Распознавание речи
может кто-нибудь помочь?
источник

NS

Nikolay Shmyrev in Распознавание речи
;h
источник

RF

Richard Feynman in Распознавание речи
?
источник