Size: a a a

Natural Language Processing

2019 November 23

DK

Denis Kirjanov in Natural Language Processing
Sergey Bilenko
У них разве есть перевод речи в титры? По моему у них только голосовое общение с чат-ботами
Именно Яндекс диалог гляньте
источник

SB

Sergey Bilenko in Natural Language Processing
Denis Kirjanov
Именно Яндекс диалог гляньте
Не нашел Яндекс диалог. Есть Яндекс.диалоги. Но там совсем не про распознавание речи. Вот, что там пишут - "Яндекс.Диалоги позволяют подключить чат с оператором или автоматизированный навык вашей компании к сервисам Яндекса. Таким образом, вы получаете как новый способ оказания услуг, так и доступ к новой аудитории."

Распознавание речи есть в Яндекс.Облаке, но оно платное и ни разу не дешевое.
источник

ДТ

Дмитрий Тырин in Natural Language Processing
Vlad
Есть решения, что работают качественнее (ESPnet, DeepSpeech), но им нужна мощная видеокарта для быстрой работы, и всё равно не факт, что получится в реалтайм запустить. Ну и знания в мл желательны
Для них вроде нету моделей русского языка. Только английские
источник

DK

Denis Kirjanov in Natural Language Processing
Sergey Bilenko
Не нашел Яндекс диалог. Есть Яндекс.диалоги. Но там совсем не про распознавание речи. Вот, что там пишут - "Яндекс.Диалоги позволяют подключить чат с оператором или автоматизированный навык вашей компании к сервисам Яндекса. Таким образом, вы получаете как новый способ оказания услуг, так и доступ к новой аудитории."

Распознавание речи есть в Яндекс.Облаке, но оно платное и ни разу не дешевое.
Точно — он Яндекс разговор, во
источник

MI

Mike Ishenin in Natural Language Processing
Sergey Bilenko
Не нашел Яндекс диалог. Есть Яндекс.диалоги. Но там совсем не про распознавание речи. Вот, что там пишут - "Яндекс.Диалоги позволяют подключить чат с оператором или автоматизированный навык вашей компании к сервисам Яндекса. Таким образом, вы получаете как новый способ оказания услуг, так и доступ к новой аудитории."

Распознавание речи есть в Яндекс.Облаке, но оно платное и ни разу не дешевое.
Да кажется совсем недорогое там распознавание
источник

SB

Sergey Bilenko in Natural Language Processing
Mike Ishenin
Да кажется совсем недорогое там распознавание
За распознавание в реальном времени выходит около 550 рублей в час. Для социального проекта это крайне дорого.
источник

V

Vlad in Natural Language Processing
Дмитрий Тырин
Для них вроде нету моделей русского языка. Только английские
Вот же: https://github.com/espnet/espnet/blob/master/egs/ru_open_stt/asr1/RESULTS.md

На базе датасета ru_open_stt
источник

SB

Sergey Bilenko in Natural Language Processing
Denis Kirjanov
Точно — он Яндекс разговор, во
Спасибо, хорошая программа, не знал про такую. Но она только для Andроид и только для устной речи при живом общении. При живом общении 90% слабослышащих хорошо читают по губам. В основном проблемы у них с просмотром фильмов и с разговорами по Skype/Zoom - качество картинки не всегда позволяет читать по губам
источник

DK

Denis Kirjanov in Natural Language Processing
Sergey Bilenko
Спасибо, хорошая программа, не знал про такую. Но она только для Andроид и только для устной речи при живом общении. При живом общении 90% слабослышащих хорошо читают по губам. В основном проблемы у них с просмотром фильмов и с разговорами по Skype/Zoom - качество картинки не всегда позволяет читать по губам
Ох, про 90 процентов — это крайне оптимистичная статистика, мне кажется. Если приведёте пруф, буду признателен

У фильмов обычно есть субтитры, к скайпу теоретически можно тот же разговор приложить

Я бы скорее думал о театрах и vr-очках, которые бы текст с модельки выводили на эти очки
источник

ДТ

Дмитрий Тырин in Natural Language Processing
Спасибо! Я на самом деле имел в виду deepspeech) гляну espnet. Если честно не слышал даже про него
источник

V

Vlad in Natural Language Processing
У DeepSpeech я не встречал открытых русских моделей, но можно по идее самому обучить, всё для этого есть)
источник

SB

Sergey Bilenko in Natural Language Processing
Denis Kirjanov
Ох, про 90 процентов — это крайне оптимистичная статистика, мне кажется. Если приведёте пруф, буду признателен

У фильмов обычно есть субтитры, к скайпу теоретически можно тот же разговор приложить

Я бы скорее думал о театрах и vr-очках, которые бы текст с модельки выводили на эти очки
Возможно, насчет 90% я не прав. Статистики нет, есть личные ощущения. Если у собеседника не сильно плохая дикция, то прочитать его по губам почти всегда удается. Но только одного собеседника, в коллективном разговоре это не срабатывает.
Виртуальные очки - это пока технологически сложно. А вот встроить распознавание речи в качестве сервиса в операционную систему компьютера было бы заманчиво, чтобы сервис весь аудиапоток переводил в титры. Тогда можно и видеолекции смотреть (если они не с Youtobe, то титров у них нет) и фильмы и голосовые звонки из различных приложений принимать и собеседования по Skype проходить
источник

DK

Denis Kirjanov in Natural Language Processing
Sergey Bilenko
Возможно, насчет 90% я не прав. Статистики нет, есть личные ощущения. Если у собеседника не сильно плохая дикция, то прочитать его по губам почти всегда удается. Но только одного собеседника, в коллективном разговоре это не срабатывает.
Виртуальные очки - это пока технологически сложно. А вот встроить распознавание речи в качестве сервиса в операционную систему компьютера было бы заманчиво, чтобы сервис весь аудиапоток переводил в титры. Тогда можно и видеолекции смотреть (если они не с Youtobe, то титров у них нет) и фильмы и голосовые звонки из различных приложений принимать и собеседования по Skype проходить
Смотря как мы определяем слабослышащих

По моим оценкам, там процентов 30
источник

T

Teemoor in Natural Language Processing
Sergey Bilenko
За распознавание в реальном времени выходит около 550 рублей в час. Для социального проекта это крайне дорого.
ради социального проекта можно попробовать договориться с яндексом о бесплатном доступе
источник

VI

Vitaly Ivanin in Natural Language Processing
Кто-нибудь работал с датасетом реддита?
Есть ли какой-нибудь ридер для него?
источник
2019 November 24

VI

Vitaly Ivanin in Natural Language Processing
Вообще хочется корпус для обучения классификатора для неформального чатика, типа: из пяти следующих сообщений ответом на это является такое-то, или никакое.

Гугление дало мало, знаю некоторые датасеты, но незнаю репозиториев, в которых их в каком-то удобном виде парсят
источник

D

Dmitry in Natural Language Processing
Vitaly Ivanin
Вообще хочется корпус для обучения классификатора для неформального чатика, типа: из пяти следующих сообщений ответом на это является такое-то, или никакое.

Гугление дало мало, знаю некоторые датасеты, но незнаю репозиториев, в которых их в каком-то удобном виде парсят
Выгрузи историю телеги и распарсь, связи там между сообщениями есть. Хотя это очень "сложный" датасет))
источник

D

Dmitry in Natural Language Processing
Я из одного чата ~45 000 сообщений так ввпарсил.
источник

D

Dmitry in Natural Language Processing
Тематическое моделирование делал
источник

m

mel kaye in Natural Language Processing
Vitaly Ivanin
Вообще хочется корпус для обучения классификатора для неформального чатика, типа: из пяти следующих сообщений ответом на это является такое-то, или никакое.

Гугление дало мало, знаю некоторые датасеты, но незнаю репозиториев, в которых их в каком-то удобном виде парсят
telegram-export ✨  ✨
источник