Size: a a a

Natural Language Processing

2018 March 15

ML

Michael Lobanov in Natural Language Processing
Хз, томитой точно можно
источник

IA

Ivan Antonov in Natural Language Processing
да, томитой спокойно
источник

AK

Alexander Kukushkin in Natural Language Processing
Андрей amber4eg
Да.
Мне вот интересно стало, можно ли Наташей выдёргивать из текста названия софта, например. Т.е. есть текст, есть длинный список специфичных названий и надо из текста вычленить названия из этого списка. Вот пытаюсь разобраться по документации, пока не очень.
Можете посмотреть раздел про газеттир http://yargy.readthedocs.io/ru/latest/#id3
источник

Аa

Андрей amber4eg in Natural Language Processing
Alexander Kukushkin
Можете посмотреть раздел про газеттир http://yargy.readthedocs.io/ru/latest/#id3
Спасибо, посмотрю. В примерах к томита-парсеру тоже нашёл что-то похожее на то, что мне надо.
источник

VO

Vashchukov Oleg in Natural Language Processing
Вопрос от дизайнера, так что я без технических подробностей вопрос опишу :-) И не по теме Наташи (крутое демо, кстати), но про анализ текста.

Есть сервис https://istio.com/rus/text/analyz/ Он помогает анализировать текст, на предмет важных слов. У меня есть много цитат из книг, к которым я хочу присвоить авто-теги.

Есть две проблемы:
1. Делать это вручную утомительно. Может кто знает, какой библиотекой можно такой анализ реализовать? Спросил владельца istio.com через форму обратной связи, ответа нет

2. Условно, в книге под сотню цитат. Каждая из них часто имеет свои уникальные слова, хотя речь примерно об одном и том же. Каким образом можно привести схожие слова к обобщающим словам/тегам? На ум приходит некий словарь синонимов. Хочу что-то вроде связанного графа (связанные теги) построить. Если не приводить к обещающим тегам, то граф получается разорванный, цитаты почти не пересекаются.
источник

G

G in Natural Language Processing
Наташа не парсит Алешу... не пойму в чем проблема
источник

DV

Dima Veselov in Natural Language Processing
Привет. Одиночные имена не разбираются, из-за большого кол-ва ложных срабатываний, если я правильно помню. Алёшу Иванова - распарсит.
источник

G

G in Natural Language Processing
Аааа, вот в чем дело
Спасибо
источник

cu

custom username in Natural Language Processing
Санкт-Петербург не парсит, вот это прикол
источник

cu

custom username in Natural Language Processing
(На самом деле, правило «Петербург», судя по всему, перекрывает общую регулярку, и первая часть не ловится)
источник

AK

Alexander Kukushkin in Natural Language Processing
В демо  https://natasha.github.io/demo/ не разбираются имена вне контекста. Если вы напишите просто "Алёша" оно не разберётся, а если напишите предложение с именем "Алёша", то есть шанс что разберётся.

В демо разбираются адреса. Адрес в Наташе это улица + дом. Один город это не адрес. Если Санкт-Петербург  часть адреса он разбирается
источник

AK

Alexander Kukushkin in Natural Language Processing
источник
2018 March 17

PJ

Paul Jones in Natural Language Processing
Приветствую! Вопрос такой, есть какие годные статьи или может даже книженции по NLP алгоритмам? Может кто встречал, желательно без воды.
источник

AB

Arcady Balandin in Natural Language Processing
Народ, а какую либу использовать для извлечения фактов в формате предикат+аргументы из. скажем, новостных статей на английском языке?
источник

in Natural Language Processing
Paul Jones
Приветствую! Вопрос такой, есть какие годные статьи или может даже книженции по NLP алгоритмам? Может кто встречал, желательно без воды.
источник

PJ

Paul Jones in Natural Language Processing
О! Спасибо, годно 👍
источник

in Natural Language Processing
Классика )
источник

PJ

Paul Jones in Natural Language Processing
😊
источник
2018 March 21

CT

Cookie Thief in Natural Language Processing
Господа, не покидаете информации по анализу тональности текста?
заранее спасибо :3
источник

MA

Mark Adamenko in Natural Language Processing
Господа и дамы - а есть ли решение или алгороритмы, нигде не могу найти, постобработки текста? Интересует в первую очередь исправление ошибок, удаление переносов, слов в р а з р я д к у...
источник