Size: a a a

Распознавание речи

2019 July 10

V

Vlad in Распознавание речи
Чую за месяц сделать прототип я не успею))
А что можете подсказать из того, что сами пробовали?
источник

NS

Nikolay Shmyrev in Распознавание речи
Все мои советы в прикреплённом сообщении 😉
источник

V

Vlad in Распознавание речи
Понял)
Более подробной документации по синтезу речи из закрепа я так понимаю нету?)
источник

NS

Nikolay Shmyrev in Распознавание речи
Вот црт читает. Звук хороший, а интонация плохо.
источник

NS

Nikolay Shmyrev in Распознавание речи
источник

V

Vlad in Распознавание речи
Фига се
источник

V

Vlad in Распознавание речи
Круто
источник

V

Vlad in Распознавание речи
А частоту дискретизации можно увеличить?
источник

V

Vlad in Распознавание речи
А, вижу, есть параметр в synth.py
источник

NS

Nikolay Shmyrev in Распознавание речи
частоту дискретизации менять нельзя, модель на 8khz
источник

V

Vlad in Распознавание речи
Для обучения вся необходимая информация находится в train.py? В каком виде должны быть данные для обучения? И можно ли изменить качество (т.е. частоту дискретизации синтезированной речи) в ущерб скорости например?
источник

V

Vlad in Распознавание речи
Обученными моделями с радостью поделюсь, если вам интересно)
источник

NS

Nikolay Shmyrev in Распознавание речи
Vlad
Для обучения вся необходимая информация находится в train.py? В каком виде должны быть данные для обучения? И можно ли изменить качество (т.е. частоту дискретизации синтезированной речи) в ущерб скорости например?
Проще всего почитать https://github.com/NVIDIA/tacotron2
источник

V

Vlad in Распознавание речи
Хорошо, спасибо)
А обучение waveglow нужно отдельно выполнять? Или оно встроено в обучение в train.py по инструкции tacotron2?
источник

NS

Nikolay Shmyrev in Распознавание речи
Waveglow отдельно
источник

V

Vlad in Распознавание речи
Ага... Значит, для обучения: делаем по инструкции tacotron2, но с вашими файлами (при этом клонировать репо tacotron2 я так понимаю не нужно), после обучения в эту же папку с проектом ставим waveglow, обучаем на тех же данных, а затем можно использовать. Я правильно понял..?
источник

NS

Nikolay Shmyrev in Распознавание речи
да
источник

NS

Nikolay Shmyrev in Распознавание речи
ну почти 😉
источник

V

Vlad in Распознавание речи
А какие нюансы?)
источник

VK

Viacheslav Klimkov in Распознавание речи
Нестабильный attention mechanism хаха
источник