Друзья, у кого есть опыт работы со spaCy? На сколько сложно написать свою модель, чтобы потом выдёргивать из текста объявления район, город, улицу, проспект, деревню? Может есть какие-то инструкции в сети для новичков?
Тебя интересует именно функциональность NER? В таком случае, для семи языков, включая русский, должно работать из коробки с мультиязычной моделью.
С другими языками придётся поработать. Может, даже, придётся обучать что-то вроде CNN.
Впрочем, spacy я гонял только на английском, вполне возможно, что можно быстро настроить vocab по размеченному списку географических объектов с использованием кастомных атрибутов token.