SpaCy работает таким образом что у тебя есть текст на входе, токенизатор (внешний или внутренний), морфология или вектора на входе, ULMFiT, а на выходе некая разметка (Golden) - и дальнейшая задача решается путем предоставления датасета и обучения по этому датасету
можно так же использовать трансформер и делать Fine-Tune, при этом есть поддержка Xlnet, Bert и так далее