Я думаю pymorphy2 будет получше для русского, чем текущие модели spaCy. Кстати, судя по всему, недавно в spaCy как раз и прикрутили использование pymorphy2 для работы с русским языком, он есть в списке зависимостей для русского и украинского языков https://spacy.io/usage/models#languages
на банках.вру в принципе есть раздел "отзывы", причем с оценками в адрес кфо - так если есть что-то типа такого обработанного дата сета - так вообще хорошо