Size: a a a

Natural Language Processing

2019 November 21

NK

Nikolay Karelin in Natural Language Processing
Подсветка в тексте, облака слов, иногда графы. Какие-то более систематизированные вещи не встречал, самому интересно.
источник

SM

SAP ML FAN in Natural Language Processing
источник

K

Kir in Natural Language Processing
Делал такое в школе
источник

MI

Mike Ishenin in Natural Language Processing
Kir
Делал такое в школе
А есть код публичный? Я бы поигрался 🚂
источник

K

Kir in Natural Language Processing
Mike Ishenin
А есть код публичный? Я бы поигрался 🚂
нету ( менеджер в этом чате мой и строгий.
могу в привате рассказать о подходе, но он ужасно деревянный
источник
2019 November 22

N

N in Natural Language Processing
Привет! А кто-нибудь знает, где можно найти датасеты текстов с эвфемизмами?
источник
2019 November 23

SB

Sergey Bilenko in Natural Language Processing
Приветствую всех! Подскажите, пожалуйста, какую сейчас систему распознавания русской речи лучше использовать, так чтобы была бесплатная и ей хватало ресурсов для работе на среднестатистическогом десктопе? Пока нашел информацию, что русскую речь приемлемо распознаёт Sphinx. Ещё есть Kaldi с русской речевой моделью от мая 2018 года, но вроде она похуже будет.
PS Хочу заняться сугубо социальным проектом - компьютерный сурдопереводчик для слабослышащих людей.
источник

ДТ

Дмитрий Тырин in Natural Language Processing
Sergey Bilenko
Приветствую всех! Подскажите, пожалуйста, какую сейчас систему распознавания русской речи лучше использовать, так чтобы была бесплатная и ей хватало ресурсов для работе на среднестатистическогом десктопе? Пока нашел информацию, что русскую речь приемлемо распознаёт Sphinx. Ещё есть Kaldi с русской речевой моделью от мая 2018 года, но вроде она похуже будет.
PS Хочу заняться сугубо социальным проектом - компьютерный сурдопереводчик для слабослышащих людей.
Если записей не много и они не конфиденциальные, то можно отправлять в гугл на распознавание. У pocetshinx есть такая возможность (выбрать кому отправлять запрос - гугл, майкрософт и ещё парочка)
источник

DK

Denis Kirjanov in Natural Language Processing
Sergey Bilenko
Приветствую всех! Подскажите, пожалуйста, какую сейчас систему распознавания русской речи лучше использовать, так чтобы была бесплатная и ей хватало ресурсов для работе на среднестатистическогом десктопе? Пока нашел информацию, что русскую речь приемлемо распознаёт Sphinx. Ещё есть Kaldi с русской речевой моделью от мая 2018 года, но вроде она похуже будет.
PS Хочу заняться сугубо социальным проектом - компьютерный сурдопереводчик для слабослышащих людей.
Ну эту задачу вроде Яндекс.диалог решает
источник

SB

Sergey Bilenko in Natural Language Processing
Дмитрий Тырин
Если записей не много и они не конфиденциальные, то можно отправлять в гугл на распознавание. У pocetshinx есть такая возможность (выбрать кому отправлять запрос - гугл, майкрософт и ещё парочка)
Предполагается сурдоперевод в реальном времени или с разумным временем задержки. Отправлять на распознавание в облака - это не дорого будет?
источник

V

Vlad in Natural Language Processing
Sergey Bilenko
Предполагается сурдоперевод в реальном времени или с разумным временем задержки. Отправлять на распознавание в облака - это не дорого будет?
Это будет медленно. В таком режиме только локальное решение
источник

ДТ

Дмитрий Тырин in Natural Language Processing
Sergey Bilenko
Предполагается сурдоперевод в реальном времени или с разумным временем задержки. Отправлять на распознавание в облака - это не дорого будет?
Не пробовал) в любом случае задача распознавания довольно затратная по вычислениям
Прикинуть время можно по переводчику: там есть возможность надиктовать текст
источник

SB

Sergey Bilenko in Natural Language Processing
Denis Kirjanov
Ну эту задачу вроде Яндекс.диалог решает
У них разве есть перевод речи в титры? По моему у них только голосовое общение с чат-ботами
источник

NS

Nikolay Shmyrev in Natural Language Processing
Sergey Bilenko
Приветствую всех! Подскажите, пожалуйста, какую сейчас систему распознавания русской речи лучше использовать, так чтобы была бесплатная и ей хватало ресурсов для работе на среднестатистическогом десктопе? Пока нашел информацию, что русскую речь приемлемо распознаёт Sphinx. Ещё есть Kaldi с русской речевой моделью от мая 2018 года, но вроде она похуже будет.
PS Хочу заняться сугубо социальным проектом - компьютерный сурдопереводчик для слабослышащих людей.
Kaldi нужно использовать. "Вроде похуже" на самом деле "гораздо лучше".
источник

V

Vlad in Natural Language Processing
Кстати да, причем если выбирать так же по скорости работы и простоте развертывания - то тоже остаётся только Kaldi
источник

SB

Sergey Bilenko in Natural Language Processing
Nikolay Shmyrev
Kaldi нужно использовать. "Вроде похуже" на самом деле "гораздо лучше".
Для Kaldi есть более новая модель, чем kaldi-ru-0.6.tar.gz, не знаете?
источник

V

Vlad in Natural Language Processing
Есть решения, что работают качественнее (ESPnet, DeepSpeech), но им нужна мощная видеокарта для быстрой работы, и всё равно не факт, что получится в реалтайм запустить. Ну и знания в мл желательны
источник

SB

Sergey Bilenko in Natural Language Processing
Vlad
Есть решения, что работают качественнее (ESPnet, DeepSpeech), но им нужна мощная видеокарта для быстрой работы, и всё равно не факт, что получится в реалтайм запустить. Ну и знания в мл желательны
Карта GTX 1080 Titan, опыт обучения сеток в PyTorch/Tensorflow есть
источник

NS

Nikolay Shmyrev in Natural Language Processing
Sergey Bilenko
Для Kaldi есть более новая модель, чем kaldi-ru-0.6.tar.gz, не знаете?
Нет.
источник

SP

Sebastian Pereira in Natural Language Processing
Коллеги, а кто-то уже использовал мультиязычный XML от huggingface? Не могу понять как получить вектора для русских слов.  https://huggingface.co/transformers/v2.1.1/model_doc/xlm.html
источник