Size: a a a

Natural Language Processing

2017 January 31

NT

Nick Turusin in Natural Language Processing
источник

NT

Nick Turusin in Natural Language Processing
лукап такой само собой

ner_lookup_table = {
   Person: 'PER'
}
источник

DV

Dima Veselov in Natural Language Processing
источник

NT

Nick Turusin in Natural Language Processing
Воспроизводится?  При прогоне Евстигнеева первая, хотя первое совпадение по Мироновой валидно
источник

DV

Dima Veselov in Natural Language Processing
Сейчас попробую с вторым питоном.
источник

NT

Nick Turusin in Natural Language Processing
источник

NT

Nick Turusin in Natural Language Processing
output:

<enum 'Person'>
VAL:  Евстигнеевой
VAL:  Р
VAL:  .
VAL:  Н
VAL:  .
<enum 'Person'>
VAL:  Миронова
VAL:  Татьяна
VAL:  Ивановна
<enum 'Person'>
VAL:  Миронова
VAL:  Т
VAL:  .
<enum 'Person'>
VAL:  Золотова
VAL:  Юлия
источник

DV

Dima Veselov in Natural Language Processing
А...
источник

DV

Dima Veselov in Natural Language Processing
resolve_matches сортирует результаты по кол-ву пойманных токенов, чтобы отсечь неправильные разборы
источник

NT

Nick Turusin in Natural Language Processing
А, вот оно что
источник

DV

Dima Veselov in Natural Language Processing
А вот то, что Миронова Т.И. не распарсилось, это баг, кажется.
источник

DV

Dima Veselov in Natural Language Processing
Кстати, если нужно будет (в дальнейшем) извлекать имена / фамилии по отдельности, можно делать так - https://github.com/bureaucratic-labs/natasha/blob/master/natasha/grammars/person/tests.py#L133 (не самый лучший пример, но лучше пока нету)
источник

DV

Dima Veselov in Natural Language Processing
т.е. там на выходе из парсера - объект с атрибутами, типа person.firstname
источник

NT

Nick Turusin in Natural Language Processing
Ага, вижу. Спасиб
источник
2017 February 02

NT

Nick Turusin in Natural Language Processing
Дим, там обширные импрувменты выкатились в мастере, даже видимо по горячим следам нашей беседы, круто, но перестало инсталлироваться
       from natasha.commands import BuildDictionariesCommand
     File "natasha/__init__.py", line 3, in <module>
       from natasha.grammars import (
     File "natasha/grammars/__init__.py", line 1, in <module>
       from natasha.grammars.person import Person
     File "natasha/grammars/person/__init__.py", line 1, in <module>
       from natasha.grammars.person.grammars import Person, ProbabilisticPerson
     File "natasha/grammars/person/grammars.py", line 22, in <module>
       from natasha.grammars.person.interpretation import PersonObject
     File "natasha/grammars/person/interpretation.py", line 7, in <module>
       from yargy.interpretation import InterpretationObject
   ImportError: No module named interpretation
источник

NT

Nick Turusin in Natural Language Processing
Возможно конечно, что-то у меня снова
источник

NT

Nick Turusin in Natural Language Processing
но день назад все работало
источник

NT

Nick Turusin in Natural Language Processing
Хотя да, откатился и скачал исходники с того коммита, тоже не могу
источник

NT

Nick Turusin in Natural Language Processing
видимо на моей стороне
источник

DV

Dima Veselov in Natural Language Processing
Попробуй так:
pip uninstall yargy natasha
pip install git+https://github.com/bureaucratic-labs/yargy.git
pip install git+https://github.com/bureaucratic-labs/natasha.git
источник