Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2021 March 23

UT

Unknown T. in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Андрей Копылов
Да, наверное нужно в сторону ASR смотреть. Модели обычно выдают метрику, насколько они уверены в правильности распознавания. И далее уже от механики зависит. Если человек читает заранее подготовленный текст, то просто сравнивать с ним результат распознавания. Если это произвольная речь, то взять например BERT и проверять слова, которые неуверенно распознанны, подходят ли они вообще по смыслу в контексте предложения.  Ну и какую-то свою обощенную метрику сделать: если слово распозналось правильно, но метрика уверенности распознавания низкая - то это среднее качество произношения.. Если слово совсем не то - то низкое качество произношения.
Задача вроде не сложная, сейчас много крутых моделей в свободном доступе, тем более на английском, все модели предобучены, взять и слепить.
Задача облегчается тем, что текст заранее известен. Нужно только проверить качество произношения конкретного слова / фразы.

Спасибо за идею с качеством распознавания — тоже вариант. Единственное, что при таком подходе у нас есть только ответ в виде одного числа — плохо или хорошо произнесено слово. В идеале, конечно, хотелось бы указать на конкретные ошибки. Поэтому и думал, может распознавать список звуков типа [c] [a] [r] и их продолжительность, а потом сравнивать с эталоном?
источник

АК

Андрей Копылов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Unknown T.
Задача облегчается тем, что текст заранее известен. Нужно только проверить качество произношения конкретного слова / фразы.

Спасибо за идею с качеством распознавания — тоже вариант. Единственное, что при таком подходе у нас есть только ответ в виде одного числа — плохо или хорошо произнесено слово. В идеале, конечно, хотелось бы указать на конкретные ошибки. Поэтому и думал, может распознавать список звуков типа [c] [a] [r] и их продолжительность, а потом сравнивать с эталоном?
Это тоже можно из ASR выдрать, при распознавании сначала акустическая модель преобразует звук в фонемы, а потом сравнивает по словарю
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Андрей Копылов
Это тоже можно из ASR выдрать, при распознавании сначала акустическая модель преобразует звук в фонемы, а потом сравнивает по словарю
Далеко не во всех алгоритмах
источник

АК

Андрей Копылов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Timofey Naumenko
Далеко не во всех алгоритмах
Ну в старых типа sphinx, kaldi
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Сейчас обычно кодируют текст в BPE
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Андрей Копылов
Ну в старых типа sphinx, kaldi
da
источник

UT

Unknown T. in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Андрей Копылов
Это тоже можно из ASR выдрать, при распознавании сначала акустическая модель преобразует звук в фонемы, а потом сравнивает по словарю
Хм, интересно. Посмотрю тогда на sphinx и kaldi
источник

АК

Андрей Копылов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Unknown T.
Хм, интересно. Посмотрю тогда на sphinx и kaldi
Лучше kaldi, он поинтереснее
источник

UT

Unknown T. in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Андрей Копылов
Лучше kaldi, он поинтереснее
Окей, спасибо большое :)
источник

VT

Vlad Timofeev in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Как считаете какая приемлимая вилка зарплаты для джуна без опыта, но с проектами в москве?
источник

ЕТ

Евгений Томилов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Vlad Timofeev
Как считаете какая приемлимая вилка зарплаты для джуна без опыта, но с проектами в москве?
100-120К российских рублей.
источник

@

@Evgeniia_Orlova in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Евгений Томилов
100-120К российских рублей.
В целом ок
источник

VT

Vlad Timofeev in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Евгений Томилов
100-120К российских рублей.
Шутите?
источник

@

@Evgeniia_Orlova in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Vlad Timofeev
Шутите?
Нет
источник

D•

Dan • Captain in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Vlad Timofeev
Шутите?
Нет, это приемлемо
источник

D•

Dan • Captain in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Я бы даже сказал 90-110
источник

VT

Vlad Timofeev in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Какой кошмар
источник

D•

Dan • Captain in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Vlad Timofeev
Какой кошмар
Всегда можно пойти работать в Яндекс. Таксистом :)
источник

VT

Vlad Timofeev in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Таксист это 50к и 55ч рабочий день)
источник

ЕТ

Евгений Томилов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Vlad Timofeev
Шутите?
Нет, для России для джуна это равновесие Нэша.
источник