Size: a a a

Natural Language Processing

2017 September 13

dr

darya rodionova in Natural Language Processing
Снова привет!
А как в токенайзер пробросить граммемы изopencorpora?
источник

AK

Alexander Kukushkin in Natural Language Processing
Можно пример чего вы хотите сделать?
источник

AK

Alexander Kukushkin in Natural Language Processing
Токенайзер оперирует граммемами из opencorpa
источник

AK

Alexander Kukushkin in Natural Language Processing
источник

dr

darya rodionova in Natural Language Processing
Когда я создаю свой токенайзер (я взяла полностью пример про DOMAIN), то у меня при токенизации все слова получили граммему 'DOMAIN', но мне это не нужно. Мне надо иметь 'DOMAIN'лишь для конкретных токенов, для которых написана функция normalize.
источник

AK

Alexander Kukushkin in Natural Language Processing
Покажите код
источник

DV

Dima Veselov in Natural Language Processing
Ужас. Уже и сюда добрались.
источник
2017 September 14

AB

Artur Bekerov in Natural Language Processing
Привет. а ктото уже делал относительные даты (завтра, через неделю и т.п.)? например как тут https://github.com/nltk/nltk_contrib/blob/master/nltk_contrib/timex.py
источник

t2

tonko 22 in Natural Language Processing
Уу, праавила
источник
2017 September 18

D

D in Natural Language Processing
Организации планируется возвращать в экстракторы?
источник

DV

Dima Veselov in Natural Language Processing
Да, обязательно.
источник
2017 September 20

MB

Michael Baranov in Natural Language Processing
Привет всем! Вопрос, наверно, тупой, но разобраться пока не смог: у natasha поменялся API? после установки через pip получаю ImportError: cannot import name 'NamesExtractor'. Посмотрел сам модуль, ни одного экстрактора в нем нет, только классы Person, PersonPipeline. Если поменялось API, то в какой версии оно совпадает с документацией? сейчас нужно относительно быстро проверить 1 гипотезу, потом буду разбираться глубже
источник

AK

Alexander Kukushkin in Natural Language Processing
Да, поменялось АПИ. Вы можете просто воспользоваться документацией для старой версии http://natasha.readthedocs.io/ru/0.7.0/quickstart/
источник

MB

Michael Baranov in Natural Language Processing
Огромное спасибо!!!
источник

D

D in Natural Language Processing
Попытка перейти на 0.8.0 не удалась :
~/py/lib/python3.5/site-packages/natasha/utils.py in <module😠)
     1
     2
—--> 3 from yargy.utils import Record

ImportError: cannot import name 'Record'
источник

AK

Alexander Kukushkin in Natural Language Processing
Нужно обновить yargy
источник

D

D in Natural Language Processing
В упор не вижу где в yargy utils что либо похожее
источник

D

D in Natural Language Processing
Все, увидел, ОК. natasha/yargy надо, правильно
источник
2017 September 25

AK

Alexander Kukushkin in Natural Language Processing
источник

AK

Alexander Kukushkin in Natural Language Processing
А также бенчмарк, сравнение с Томитой http://nbviewer.jupyter.org/github/natasha/natasha/blob/master/benchmark/tomita/notes.ipynb
источник