1) вообще, лучше про это спрашивать в группу комп. лингвистики — там многие DL 4 NLP занимаются.
2) я делаю сейчас большое исследование про word2vec для русского языка, надеюсь через месяц или раньше опубликую на хабре, и предоставлю возможно более качественные модели чем word2vec для русского в опен-сорс.