Телеграмм чат группы cmusphinx_ru страница 113

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Распознавание речи

225 membersпожаловаться на группу

2019 May 14

II

Igor Ishin in Распознавание речи

Andrei Obyortyshev

Возникла пара вопросов про базовые вещи, хочу уточнить:
Закреплённая модель тренирована же на сэмплах 8/16 кгц? И, сответственно, 16кгцовые входные данные будут распознаваться лучше, чем какие нибудь 44100?

Если не ошибаюсь, он никак не будет распознавать 44100, как и 16

источник

14:58пожаловаться #1

AO

Andrei Obyortyshev in Распознавание речи

Если не ошибаюсь, он никак не будет распознавать 44100, как и 16

Получается, мы либо даунгрейдим запись до 8кГц, либо тренируем модель на 44,1 кГц? :)

источник

15:01пожаловаться #2

AO

Andrei Obyortyshev in Распознавание речи

Но я полагаю сэмплов в 44100 для тренировки найти не очень реально

источник

15:02пожаловаться #3

II

Igor Ishin in Распознавание речи

Andrei Obyortyshev

Но я полагаю сэмплов в 44100 для тренировки найти не очень реально

Mini_librispeech , о котором Николай говорил учит на 16кГц, и распознает такие же, а преобразовать тем же ffmpeg можно в обе стороны, не знаю насколько это негативно влияет на процесс обучения

источник

15:08пожаловаться #4

RA

Robert Arzin in Распознавание речи

Andrei Obyortyshev

Но я полагаю сэмплов в 44100 для тренировки найти не очень реально

Крайне тяжело

источник

20:22пожаловаться #5

NS

Nikolay Shmyrev in Распознавание речи

Крайне тяжело

Почему тяжело-то? С ютуба можно скачать, вон товарищи https://github.com/snakers4/open_stt накачили и продают теперь. Другое дело, что для распознавания это не особо полезно, разницы между 16 и 44 в точности никакой. Только если на стереосигнале тренировать.

snakers4/open_stt

Russian open STT dataset. Contribute to snakers4/open_stt development by creating an account on GitHub.

источник

20:24пожаловаться #6

2019 May 17

RA

Robert Arzin in Распознавание речи

Nikolay Shmyrev

Почему тяжело-то? С ютуба можно скачать, вон товарищи https://github.com/snakers4/open_stt накачили и продают теперь. Другое дело, что для распознавания это не особо полезно, разницы между 16 и 44 в точности никакой. Только если на стереосигнале тренировать.

snakers4/open_stt

Russian open STT dataset. Contribute to snakers4/open_stt development by creating an account on GitHub.

Продают?

источник

12:34пожаловаться #7

AZ

Alexey Zholobov in Распознавание речи

> Мы выкладываем датасет под двойной лицензией: для некоммерческих целей мы предлагаем лицензию cc-by-nc 4.0, для коммерческих целей — использование после договорённости с нами.
https://m.habr.com/ru/post/450760/

Огромный открытый датасет русской речи

Специалистам по распознаванию речи давно не хватало большого открытого корпуса устной русской речи, поэтому только крупные компании могли позволить себе занима...

источник

12:45пожаловаться #8

AZ

Al Zatv in Распознавание речи

А с владельцами контента на ютюбе, на сайте пранкеров и во всех прочих местах вы договорились? Или в договоре все подобные риски учтены и взяты на вас?

источник

13:10пожаловаться #9

AZ

Al Zatv in Распознавание речи

Почитал комментарии вот здесь: https://m.habr.com/ru/post/450760/comments/ . Мдаа. Я не юрист, но выглядит это не очень надежно. И еще печально, что если ты это купил,то это свидетельство тому, что ты используешь этот датасет в коммерческих целях. Так ты можешь стать мишенью для исков правообладателей.

источник

19:28пожаловаться #10

AZ

Al Zatv in Распознавание речи

Я имею в виду, настоящих правообладателей:)

источник

19:28пожаловаться #11

NS

Nikolay Shmyrev in Распознавание речи

Почитал комментарии вот здесь: https://m.habr.com/ru/post/450760/comments/ . Мдаа. Я не юрист, но выглядит это не очень надежно. И еще печально, что если ты это купил,то это свидетельство тому, что ты используешь этот датасет в коммерческих целях. Так ты можешь стать мишенью для исков правообладателей.

Глубинный народ не признаёт права на информацию, выложенную в открытый доступ 😉

источник

19:58пожаловаться #12

AU

Alex Usov in Распознавание речи

😂

источник

19:58пожаловаться #13

AZ

Al Zatv in Распознавание речи

Ну дык это, лежит же, грех же не взять:)

источник

19:59пожаловаться #14

NS

Nikolay Shmyrev in Распознавание речи

Ну это спорный вопрос, персональную информацию многие собирают, например. И не считается это зазорным. Тут тоже у правообладателя не возникает убытков.

источник

20:04пожаловаться #15

AU

Alex Usov in Распознавание речи

Вообще непонятно как можно доказать на каких данных была обучена модель

источник

20:05пожаловаться #16

AU

Alex Usov in Распознавание речи

Всем привет!

источник

20:05пожаловаться #17

AU

Alex Usov in Распознавание речи

Я уже давно добавился. Вчера наконец дочитал всю историю чата...

источник

20:06пожаловаться #18

NS

Nikolay Shmyrev in Распознавание речи

Вообще непонятно как можно доказать на каких данных была обучена модель

Запросто можно доказать. Можно вставлять отметки, вроде https://www.microsoft.com/en-us/research/uploads/prod/2018/11/2019ASPLOS_Final_DeepSigns.pdf

источник

20:07пожаловаться #19

AZ

Al Zatv in Распознавание речи

Вообще непонятно как можно доказать на каких данных была обучена модель

Ну вот когда ты купил,ты подставился. Наверное, выкрутишься ("собирался использовать и купил, но потом передумал, базу удалил и списал расходы в убыток"). Но зачем...

источник

20:07пожаловаться #20