Size: a a a

Natural Language Processing

2020 August 07

I

I Апрельский... in Natural Language Processing
А кто пулленти разрабатывает?
источник

YB

Yuri Baburov in Natural Language Processing
I Апрельский
А кто пулленти разрабатывает?
@ksmith разрабатывает в одиночку. Есть и канал https://t.me/Pullenti
источник

I

I Апрельский... in Natural Language Processing
спасибо!

забавно. со слова выше Констатина создалось впечатление, что он просто им успешно воспользовался)) а на самом деле это Константин не случайный юзер, а лидер проекта)
источник

KS

Konstantin Smith in Natural Language Processing
I Апрельский
спасибо!

забавно. со слова выше Констатина создалось впечатление, что он просто им успешно воспользовался)) а на самом деле это Константин не случайный юзер, а лидер проекта)
Случайных юзеров не бывает, да и нет ничего случайного...
источник

D

Dmitry in Natural Language Processing
I Апрельский
спасибо!

забавно. со слова выше Констатина создалось впечатление, что он просто им успешно воспользовался)) а на самом деле это Константин не случайный юзер, а лидер проекта)
Константин им действительно успешно воспользовался.
источник

D

Dmitry in Natural Language Processing
Правда в начале создал))
источник

IR

Ivan Ryndin in Natural Language Processing
Dmitry
Правда в начале создал))
😁😁👍👍
источник
2020 August 08

V

Vladimir in Natural Language Processing
Alexander Serechenko
проблема в том, что нужна нормализация всевозможных видов записи моделей (слитно буквы+цифры, через дефис, тире, через пробел) и учет модификаций полного написания моделей (перестановка любых составный частей местами, слитность)
Нечеткий поиск такое может
источник

AS

Alexander Serechenko in Natural Language Processing
Vladimir
Нечеткий поиск такое может
Думал об эластиксерч в эту сторону
источник

V

Vladimir in Natural Language Processing
Alexander Serechenko
Думал об эластиксерч в эту сторону
Можно просто специальным запросом к базе данных https://infostart.ru/public/440033/
источник

C

Constantin in Natural Language Processing
Неделю назад я спрашивал про наличие библиотеки для выделения морфологических корней для русских слов. Её не оказалось. Я написал её сам - морфологический токенизатор. Если кому нужно будет, то его можно найти тут https://github.com/constantin50/morphological_tokenizer
источник

AI

Andrew Ishutin in Natural Language Processing
источник

AI

Andrew Ishutin in Natural Language Processing
Constantin
Неделю назад я спрашивал про наличие библиотеки для выделения морфологических корней для русских слов. Её не оказалось. Я написал её сам - морфологический токенизатор. Если кому нужно будет, то его можно найти тут https://github.com/constantin50/morphological_tokenizer
*torken -> token
источник

OS

Oleg Serikov in Natural Language Processing
Andrew Ishutin
*torken -> token
тот день, когда пулреквесты переместились в мессенджеры
источник

OS

Oleg Serikov in Natural Language Processing
Constantin
Неделю назад я спрашивал про наличие библиотеки для выделения морфологических корней для русских слов. Её не оказалось. Я написал её сам - морфологический токенизатор. Если кому нужно будет, то его можно найти тут https://github.com/constantin50/morphological_tokenizer
а что в мап.пикле лежит? боюсь незнакомые пиклы на рабочем компе, но очень интересно
источник
2020 August 09

b

boryan in Natural Language Processing
здравствуйте. есть небольшие тексты. их можно разделить на 2 категории, и ещё одна категория могут быть мусорные тексты, не нужные. Мне нужно из всех текстов выбрать одну категорию. т.е. я так понимаю эта задача классификации текста? что лучше всего подойдет для этой задачи? fasttext подойдет?
источник

I

I Апрельский... in Natural Language Processing
1) звучит как классификация
2) fasttext может дать быстрое и весьма хорошее решение
источник

b

boryan in Natural Language Processing
I Апрельский
1) звучит как классификация
2) fasttext может дать быстрое и весьма хорошее решение
спасибо) сильно вникать в nlp пока не хочу, и задача не очень сложная, как мне видится
источник

C

Constantin in Natural Language Processing
Oleg Serikov
а что в мап.пикле лежит? боюсь незнакомые пиклы на рабочем компе, но очень интересно
Морфемы для нормальной формы слов (93 тыс). Сам токенизатор работает с произвольной формой слова.
источник

I

I Апрельский... in Natural Language Processing
Constantin
Морфемы для нормальной формы слов (93 тыс). Сам токенизатор работает с произвольной формой слова.
А где взял морфемы?
источник