Size: a a a

Natural Language Processing

2017 December 05

СТ

Сергей Тихонов in Natural Language Processing
Тут обсуждали https://spacy.io хотели для него русскую модель написать, а чем он лучши Наташки? ))
источник

TY

Timofey Yefimov in Natural Language Processing
Оно обучаемое
источник

PK

Polina Kazakova in Natural Language Processing
оно не на правилах
источник

PK

Polina Kazakova in Natural Language Processing
кажется ?
источник

PK

Polina Kazakova in Natural Language Processing
Timophey Molchanov
Просто он очень мощно развивается, удобен и в нем есть сразу много инструмнтов. Ну и потом мне нужен хороший NER, а в Spacy под это целая инфраструктура - хочешь грамматики пиши, хочешь нейронки прикручивай
ну и вот
источник

СТ

Сергей Тихонов in Natural Language Processing
Ага, интересно
источник

СТ

Сергей Тихонов in Natural Language Processing
А можно как-то в правилах задать длину строки? Я на гитхаб задавал вопрос https://github.com/natasha/natasha/issues/41 может кто помочь?
источник

NT

Nick Turusin in Natural Language Processing
А разве не будет удобнее постфактом проверить длину, когда ты найдешь все matches в строке? В Yargy ты можешь проверять длины только отдельных токенов, насколько я понимаю
источник

СТ

Сергей Тихонов in Natural Language Processing
Стоит такая задача, что в фрагменте текста: 253-14, или 21-3456 и т.д. т.е. в наборе цифр есть тире, но количество цифр должно быть от 5 до 7 например – это мне что-бы отделить данный набор от такого выражения "2-3"
источник

t2

tonko 22 in Natural Language Processing
Regex
источник

AZ

Andrey Zakharov in Natural Language Processing
да, он тут как раз
источник

NT

Nick Turusin in Natural Language Processing
Количество всех цифр если между ними убрать тире должно быть от 5 до 7 или каждый Х должен быть от 5 до 7? Пример Х-Х-Х-Х-Х
источник

СТ

Сергей Тихонов in Natural Language Processing
Нужно определить количество цифр в X-X-X-XXX-X-X
источник

NT

Nick Turusin in Natural Language Processing
Блин ну можно конечно регулярку написать, но если твоё правило на yargy находит все примеры такого формата, не вижу ничего более логичного, чем во всех найденных экземплярах удалить тире str.split('-') и проверить len() списка
источник

СТ

Сергей Тихонов in Natural Language Processing
Я пытался описать такие правила:
def range_int(ot, do):
   return and_(
       INT,
       gte(ot),
       lte(do)
   )

rule(
       range_int(10, 999),
      eq('-'),
       range_int(1000, 999999)
   )

Тогда он поймет выражение написанное 11-1233 но если написать 11-0321 то естественно не поймет
источник
2017 December 07

NT

Nick Turusin in Natural Language Processing
Ребят, я пытаюсь сделать pickle для парсера yargy (потому что он хранит в своим газетире много значений и долго инициализируется), но валюсь на ошибке
источник

NT

Nick Turusin in Natural Language Processing
_pickle.PicklingError: Can't pickle <class 'yargy.interpretation.fact.AccountName'>: it's not found as yargy.interpretation.fact.AccountName
источник

NT

Nick Turusin in Natural Language Processing
AccountName мой тип само собой
источник

NT

Nick Turusin in Natural Language Processing
Из-за такой вложенности классов он не может сохранить, что можно сделать?
источник

NT

Nick Turusin in Natural Language Processing
Вопрос скорее про питон в общем
источник