вектора или что для русского есть? целевая модель говорю на 4 мб, вектора 0 весят https://github.com/buriy/spacy-ru/tree/v2.1/notebooks/training а вот тут есть тренировка своих моделей разных типов (в бранче 2.1) но да, лучше взять квантизованные вектора из navec.
я предполагаю следующее - из фразы выцепить сначала интент, потом через таггер выделить параметры для этого интента. И еще параллельно выяснить sentiment, который там тоже может быть