Доброе )
Посмотрел Наташу, классно сделали!
UPD:
Ещё есть пара вопросов:
1) Я прогоняю ner-ом Наташи книгу, страниц на 300-500. Хотелось бы, чтобы в match.facts была строка вхождения и возможность "цеплять" объекты книжной разметки - главы, номера страниц.
Сделал всё, кроме глав - тут нужно парсер писать: {'fact_class': 'organisation', 'page': 11, 'line': 985, 'position': 31, 'fact_name': 'Пензенская научная школа'}
2) LocationExtractor - работает очень специфично )) много ложных срабатываний
3) Есть желание сделать удобный экспорт в Elastic? Я бы помог