NT
Size: a a a
NT
NT
DV
Python 2.7.12+ (default, Sep 17 2016, 12:08:02)
>>> xrange(int('1433'), int('40817810505751201174'))
OverflowError: Python int too large to convert to C long
Python 3.5.2+ (default, Sep 22 2016, 12:18:14)
>>> range(int('1433'), int('40817810505751201174'))
range(1433, 40817810505751201174)
NT
NT
NT
DV
NT
DV
EV
EV
AK
DV
gnc_match(0)
- проверяет согласование по роду, числу и падежу с словом, пойманным первым правилом грамматики (ну, нумерация же начинается с нуля), т.е. в лейбл передается стек грамматики (список токенов), который содержит уже найденные слова (и который потом возвращается в качестве результата разбора, если словосочетание пройдет все проверки), некоторые лейблы принимают аргумент solve_disambiguation
- который снимает неоднозначность (неоднозначность это, например, когда pymorphy
возвращает несколько результатов разбора слова стали
- сущ. и глагол, и это правильно), и для имен людей (скорее всего) будет найден верный вариант разбора (саше ивановой
- существительные женского рода, сашу иванова
- существительные мужского рода) - т.е. при solve_disambiguation=True
уменьшается кол-во разборов отдельно взятых токенов в конечном результате (что очень помогает при нормализации, например)opencorpora
- словаря, который использует pymorphy
- http://opencorpora.org/dict.php?act=gram , за исключением, по моему, Abbr
- pymorphy
добавляет эту граммему для слов похожих на инициалы (одна буква в заглавном регистре, кроме мягкого знака и т.д.)DV
EV
DV
EV
DV
EV