Просто он очень мощно развивается, удобен и в нем есть сразу много инструмнтов. Ну и потом мне нужен хороший NER, а в Spacy под это целая инфраструктура - хочешь грамматики пиши, хочешь нейронки прикручивай
А разве не будет удобнее постфактом проверить длину, когда ты найдешь все matches в строке? В Yargy ты можешь проверять длины только отдельных токенов, насколько я понимаю
Стоит такая задача, что в фрагменте текста: 253-14, или 21-3456 и т.д. т.е. в наборе цифр есть тире, но количество цифр должно быть от 5 до 7 например – это мне что-бы отделить данный набор от такого выражения "2-3"
Блин ну можно конечно регулярку написать, но если твоё правило на yargy находит все примеры такого формата, не вижу ничего более логичного, чем во всех найденных экземплярах удалить тире str.split('-') и проверить len() списка