Коллеги, какая лингвистическая модель в итоге подходит для построения эмбеддингов нескольких предложений на русском языке?
Да любая, кому-то нужно косинусное расстояние -- тем подойдёт w2v, кому-то нужна точность -- более глубокие нейросети, кому-то нормированная близость биграмм уже норм, кто-то нормированную точность только ключевых слов возьмёт