Возникла пара вопросов про базовые вещи, хочу уточнить: Закреплённая модель тренирована же на сэмплах 8/16 кгц? И, сответственно, 16кгцовые входные данные будут распознаваться лучше, чем какие нибудь 44100?
Если не ошибаюсь, он никак не будет распознавать 44100, как и 16
Но я полагаю сэмплов в 44100 для тренировки найти не очень реально
Mini_librispeech , о котором Николай говорил учит на 16кГц, и распознает такие же, а преобразовать тем же ffmpeg можно в обе стороны, не знаю насколько это негативно влияет на процесс обучения
Почему тяжело-то? С ютуба можно скачать, вон товарищи https://github.com/snakers4/open_stt накачили и продают теперь. Другое дело, что для распознавания это не особо полезно, разницы между 16 и 44 в точности никакой. Только если на стереосигнале тренировать.
Почему тяжело-то? С ютуба можно скачать, вон товарищи https://github.com/snakers4/open_stt накачили и продают теперь. Другое дело, что для распознавания это не особо полезно, разницы между 16 и 44 в точности никакой. Только если на стереосигнале тренировать.
> Мы выкладываем датасет под двойной лицензией: для некоммерческих целей мы предлагаем лицензию cc-by-nc 4.0, для коммерческих целей — использование после договорённости с нами. https://m.habr.com/ru/post/450760/
А с владельцами контента на ютюбе, на сайте пранкеров и во всех прочих местах вы договорились? Или в договоре все подобные риски учтены и взяты на вас?
Почитал комментарии вот здесь: https://m.habr.com/ru/post/450760/comments/ . Мдаа. Я не юрист, но выглядит это не очень надежно. И еще печально, что если ты это купил,то это свидетельство тому, что ты используешь этот датасет в коммерческих целях. Так ты можешь стать мишенью для исков правообладателей.
Почитал комментарии вот здесь: https://m.habr.com/ru/post/450760/comments/ . Мдаа. Я не юрист, но выглядит это не очень надежно. И еще печально, что если ты это купил,то это свидетельство тому, что ты используешь этот датасет в коммерческих целях. Так ты можешь стать мишенью для исков правообладателей.
Глубинный народ не признаёт права на информацию, выложенную в открытый доступ 😉
Ну это спорный вопрос, персональную информацию многие собирают, например. И не считается это зазорным. Тут тоже у правообладателя не возникает убытков.
Вообще непонятно как можно доказать на каких данных была обучена модель
Ну вот когда ты купил,ты подставился. Наверное, выкрутишься ("собирался использовать и купил, но потом передумал, базу удалил и списал расходы в убыток"). Но зачем...