Телеграмм чат группы natural_language

10:22пожаловаться #5

СТ

Ага, интересно

10:44пожаловаться #6

СТ

Длина строки · Issue #41 · natasha/natasha

А можно как-то в правилах задать длину строки? Я на гитхаб задавал вопрос https://github.com/natasha/natasha/issues/41 может кто помочь?

GitHub

Как то можно задать в правилах чтоб длина строки была от x до y?
Например правило ниже поймет такое выражение: 123-321-432-234
SEP = eq('-')
INT = gram('INT')
rule(INT, rule(SEP, INT, SEP.optional(...

13:02пожаловаться #7

А разве не будет удобнее постфактом проверить длину, когда ты найдешь все matches в строке? В Yargy ты можешь проверять длины только отдельных токенов, насколько я понимаю

13:46пожаловаться #8

СТ

Стоит такая задача, что в фрагменте текста: 253-14, или 21-3456 и т.д. т.е. в наборе цифр есть тире, но количество цифр должно быть от 5 до 7 например – это мне что-бы отделить данный набор от такого выражения "2-3"

13:58пожаловаться #9

tonko 22 in Natural Language Processing

Regex

Andrey Zakharov in Natural Language Processing

13:58пожаловаться #10

tonko 22

Regex

да, он тут как раз

13:59пожаловаться #11

Количество всех цифр если между ними убрать тире должно быть от 5 до 7 или каждый Х должен быть от 5 до 7? Пример Х-Х-Х-Х-Х

14:02пожаловаться #12

СТ

Нужно определить количество цифр в X-X-X-XXX-X-X

14:03пожаловаться #13

Блин ну можно конечно регулярку написать, но если твоё правило на yargy находит все примеры такого формата, не вижу ничего более логичного, чем во всех найденных экземплярах удалить тире str.split('-') и проверить len() списка

14:06пожаловаться #14

СТ

Я пытался описать такие правила:
def range_int(ot, do):
return and_(
INT,
gte(ot),
lte(do)
)

rule(
range_int(10, 999),
eq('-'),
range_int(1000, 999999)
)

Тогда он поймет выражение написанное 11-1233 но если написать 11-0321 то естественно не поймет

14:06пожаловаться #15

2017 December 07

Ребят, я пытаюсь сделать pickle для парсера yargy (потому что он хранит в своим газетире много значений и долго инициализируется), но валюсь на ошибке

11:44пожаловаться #16

_pickle.PicklingError: Can't pickle <class 'yargy.interpretation.fact.AccountName'>: it's not found as yargy.interpretation.fact.AccountName

11:44пожаловаться #17

AccountName мой тип само собой

11:44пожаловаться #18

Из-за такой вложенности классов он не может сохранить, что можно сделать?

11:45пожаловаться #19

Вопрос скорее про питон в общем