Size: a a a

Natural Language Processing

2021 August 14

SK

Sergey Kamenshchikov in Natural Language Processing
При крауленге веб страницы часто два слова сливаются в одно н выходе
источник
2021 August 15

M

Max in Natural Language Processing
Спасибо за ответ, @Fant1k43 @dzhkn42  
Заметил, что изначально все написано правильно, убивает букву Й расстановка знаков препинания по репо  https://github.com/Lesha17/Punctuation
Хд воскресил вручную

Сейчас подумал, листал этот чат, но не нашел ничего лучше данного репозитория для получения интонационных знаков препинания.
Может пролистал, и кто-нибудь уже сравнивал данный репо с другими имеющимися? (именно, где расставляются ?!.,- на необработанном тексте из asr)
Есть ли лучше?
источник

M

Max in Natural Language Processing
Я правильно понял, что данная модель: https://github.com/sviperm/neuro-comma , - расставляет только точки и запятые? (Судя по статье)
Причем точки только если массив предложений подать на вход? (Судя по примеру в репо)
источник

M

Max in Natural Language Processing
Просто https://github.com/Lesha17/Punctuation не слишком точно, мне показалось, расставляет запятые. Про скобки - вообще никак, но скобки не важно.
Может есть модель для проверки и исправления пунктуации? Или правильно будет подключить https://github.com/sviperm/neuro-comma (раз она вроде лучшая в плане расстановки запятых) и если первая модель выдаст предложение, где нет "!?", то очистить текст от запятых и отправить на проверку(расстановку) запятых neiro-comma?

При этом, конечно, качество распознанного текста не всегда хорошее. Иногда частицы пропущены или склонение слова неверное. Сможет neiro-comma разобраться, как думаете?...
источник

d

dePuff in Natural Language Processing
Не заменять спецсимвол неразрывного пробела на ничего, а заменять его на пробел.

Или между кусками текстов из разных тегов не забывать пробел добавлять, а потом заменить пачкой повторяющиеся пробелы на один.

Короче, косяки типовые в парсере страницы исправить, а не ломать им и потом чинить
источник

AK

Anton Kolonin in Natural Language Processing
Нужно ли NLP для AGI и есть ли AGI в GPT и если есть, то - как?
Будем ли обсуждать на очередном семинаре?
P.S. По ходу, можно ли считать рекурсию по Хомскому и разрешения анафор критериями NLP уровня HLAI?
Анонимный опрос
3%
Готов выступить!
19%
NLP к AGI отношения не имеет!
38%
Хочу послушать!
40%
О чем это вы?
Проголосовало: 108
источник

AW

Alex Wortega in Natural Language Processing
Можно ли считать AGI multitask transformer? 🤡
источник

GP

Grigoriy Polyanitsin in Natural Language Processing
подскажите либы с синонимами для заданного русского слова?
источник

SancheZz Мов in Natural Language Processing
А нужна либа прям иди свой лесапед?)
источник

SancheZz Мов in Natural Language Processing
Можно попробовать ru wordnet
источник

GP

Grigoriy Polyanitsin in Natural Language Processing
а вот не нашёл такого
источник

SancheZz Мов in Natural Language Processing
Я например беру словарь русских синонимов там их 40к пар
источник

GP

Grigoriy Polyanitsin in Natural Language Processing
а можно ссылку или как гуглить? не могу найти =(
источник

SancheZz Мов in Natural Language Processing
И сначала пайморфи в норм форму, метчу и инфлект делаю по сопряжению
источник

SancheZz Мов in Natural Language Processing
На словарь?
источник

GP

Grigoriy Polyanitsin in Natural Language Processing
источник

GP

Grigoriy Polyanitsin in Natural Language Processing
мне показалось тут мало синонимов
источник

SancheZz Мов in Natural Language Processing
источник

SancheZz Мов in Natural Language Processing
Одно и тоже?
источник

GP

Grigoriy Polyanitsin in Natural Language Processing
вроде да
источник