Телеграмм чат группы natural_language

У них разве есть перевод речи в титры? По моему у них только голосовое общение с чат-ботами

Именно Яндекс диалог гляньте

15:30пожаловаться #1

SB

Denis Kirjanov

Именно Яндекс диалог гляньте

Не нашел Яндекс диалог. Есть Яндекс.диалоги. Но там совсем не про распознавание речи. Вот, что там пишут - "Яндекс.Диалоги позволяют подключить чат с оператором или автоматизированный навык вашей компании к сервисам Яндекса. Таким образом, вы получаете как новый способ оказания услуг, так и доступ к новой аудитории."

Распознавание речи есть в Яндекс.Облаке, но оно платное и ни разу не дешевое.

Дмитрий Тырин in Natural Language Processing

15:38пожаловаться #2

ДТ

Vlad

Есть решения, что работают качественнее (ESPnet, DeepSpeech), но им нужна мощная видеокарта для быстрой работы, и всё равно не факт, что получится в реалтайм запустить. Ну и знания в мл желательны

Для них вроде нету моделей русского языка. Только английские

15:45пожаловаться #3

DK

Не нашел Яндекс диалог. Есть Яндекс.диалоги. Но там совсем не про распознавание речи. Вот, что там пишут - "Яндекс.Диалоги позволяют подключить чат с оператором или автоматизированный навык вашей компании к сервисам Яндекса. Таким образом, вы получаете как новый способ оказания услуг, так и доступ к новой аудитории."

Распознавание речи есть в Яндекс.Облаке, но оно платное и ни разу не дешевое.

Точно — он Яндекс разговор, во

Mike Ishenin in Natural Language Processing

15:50пожаловаться #4

MI

Не нашел Яндекс диалог. Есть Яндекс.диалоги. Но там совсем не про распознавание речи. Вот, что там пишут - "Яндекс.Диалоги позволяют подключить чат с оператором или автоматизированный навык вашей компании к сервисам Яндекса. Таким образом, вы получаете как новый способ оказания услуг, так и доступ к новой аудитории."

Распознавание речи есть в Яндекс.Облаке, но оно платное и ни разу не дешевое.

Да кажется совсем недорогое там распознавание

16:00пожаловаться #5

SB

Mike Ishenin

Да кажется совсем недорогое там распознавание

За распознавание в реальном времени выходит около 550 рублей в час. Для социального проекта это крайне дорого.

End-to-End Speech Processing Toolkit. Contribute to espnet/espnet development by creating an account on GitHub.

16:07пожаловаться #6

V

Vlad in Natural Language Processing

Дмитрий Тырин

Для них вроде нету моделей русского языка. Только английские

Вот же: https://github.com/espnet/espnet/blob/master/egs/ru_open_stt/asr1/RESULTS.md

На базе датасета ru_open_stt

GitHub

espnet/espnet

16:22пожаловаться #7

SB

Denis Kirjanov

Точно — он Яндекс разговор, во

Спасибо, хорошая программа, не знал про такую. Но она только для Andроид и только для устной речи при живом общении. При живом общении 90% слабослышащих хорошо читают по губам. В основном проблемы у них с просмотром фильмов и с разговорами по Skype/Zoom - качество картинки не всегда позволяет читать по губам

16:33пожаловаться #8

DK

Спасибо, хорошая программа, не знал про такую. Но она только для Andроид и только для устной речи при живом общении. При живом общении 90% слабослышащих хорошо читают по губам. В основном проблемы у них с просмотром фильмов и с разговорами по Skype/Zoom - качество картинки не всегда позволяет читать по губам

Ох, про 90 процентов — это крайне оптимистичная статистика, мне кажется. Если приведёте пруф, буду признателен

У фильмов обычно есть субтитры, к скайпу теоретически можно тот же разговор приложить

Я бы скорее думал о театрах и vr-очках, которые бы текст с модельки выводили на эти очки

Дмитрий Тырин in Natural Language Processing

16:38пожаловаться #9

ДТ

Vlad

Вот же: https://github.com/espnet/espnet/blob/master/egs/ru_open_stt/asr1/RESULTS.md

На базе датасета ru_open_stt

GitHub

espnet/espnet

End-to-End Speech Processing Toolkit. Contribute to espnet/espnet development by creating an account on GitHub.

Спасибо! Я на самом деле имел в виду deepspeech) гляну espnet. Если честно не слышал даже про него

16:45пожаловаться #10

V

Vlad in Natural Language Processing

У DeepSpeech я не встречал открытых русских моделей, но можно по идее самому обучить, всё для этого есть)

16:46пожаловаться #11

SB

Denis Kirjanov

Ох, про 90 процентов — это крайне оптимистичная статистика, мне кажется. Если приведёте пруф, буду признателен

У фильмов обычно есть субтитры, к скайпу теоретически можно тот же разговор приложить

Я бы скорее думал о театрах и vr-очках, которые бы текст с модельки выводили на эти очки

Возможно, насчет 90% я не прав. Статистики нет, есть личные ощущения. Если у собеседника не сильно плохая дикция, то прочитать его по губам почти всегда удается. Но только одного собеседника, в коллективном разговоре это не срабатывает.
Виртуальные очки - это пока технологически сложно. А вот встроить распознавание речи в качестве сервиса в операционную систему компьютера было бы заманчиво, чтобы сервис весь аудиапоток переводил в титры. Тогда можно и видеолекции смотреть (если они не с Youtobe, то титров у них нет) и фильмы и голосовые звонки из различных приложений принимать и собеседования по Skype проходить

16:52пожаловаться #12

DK

Возможно, насчет 90% я не прав. Статистики нет, есть личные ощущения. Если у собеседника не сильно плохая дикция, то прочитать его по губам почти всегда удается. Но только одного собеседника, в коллективном разговоре это не срабатывает.
Виртуальные очки - это пока технологически сложно. А вот встроить распознавание речи в качестве сервиса в операционную систему компьютера было бы заманчиво, чтобы сервис весь аудиапоток переводил в титры. Тогда можно и видеолекции смотреть (если они не с Youtobe, то титров у них нет) и фильмы и голосовые звонки из различных приложений принимать и собеседования по Skype проходить

Смотря как мы определяем слабослышащих

По моим оценкам, там процентов 30

16:57пожаловаться #13

T

Teemoor in Natural Language Processing

За распознавание в реальном времени выходит около 550 рублей в час. Для социального проекта это крайне дорого.

ради социального проекта можно попробовать договориться с яндексом о бесплатном доступе

Vitaly Ivanin in Natural Language Processing

17:01пожаловаться #14

VI

Кто-нибудь работал с датасетом реддита?
Есть ли какой-нибудь ридер для него?

Vitaly Ivanin in Natural Language Processing

23:52пожаловаться #15

2019 November 24

VI

Вообще хочется корпус для обучения классификатора для неформального чатика, типа: из пяти следующих сообщений ответом на это является такое-то, или никакое.

Гугление дало мало, знаю некоторые датасеты, но незнаю репозиториев, в которых их в каком-то удобном виде парсят

00:27пожаловаться #16

D

Dmitry in Natural Language Processing

Vitaly Ivanin

Вообще хочется корпус для обучения классификатора для неформального чатика, типа: из пяти следующих сообщений ответом на это является такое-то, или никакое.

Гугление дало мало, знаю некоторые датасеты, но незнаю репозиториев, в которых их в каком-то удобном виде парсят

Выгрузи историю телеги и распарсь, связи там между сообщениями есть. Хотя это очень "сложный" датасет))

01:13пожаловаться #17

D

Dmitry in Natural Language Processing

Я из одного чата ~45 000 сообщений так ввпарсил.

01:13пожаловаться #18

D

Dmitry in Natural Language Processing

Тематическое моделирование делал

01:13пожаловаться #19

m

mel kaye in Natural Language Processing

Vitaly Ivanin

Вообще хочется корпус для обучения классификатора для неформального чатика, типа: из пяти следующих сообщений ответом на это является такое-то, или никакое.

Гугление дало мало, знаю некоторые датасеты, но незнаю репозиториев, в которых их в каком-то удобном виде парсят

telegram-export ✨ ✨