Друзья, а можете поделиться вашим любимым способом майнить синонимы для [преимущественно русских] слов?
Что пока пришло мне в голову:
1) Воспользоваться готовым тезаурусом. По точности - идеально, но заметно не хватает полноты.
2) Брать ближайших соседей по словным эмбеддингам из языковой модели. Тут, наоборот, с полнотой всё ок, но точность плохая: для "можно" ближайшие соседи "невозможно" и "нельзя".
3) Тоже соседи по эмбеддингам, но не из языковой модели (которая не отличает синонимы от антонимов), а из какой-нибудь модели-переводчика. Кажется, должно быть лучше. Вопрос: какую предобученную модель для русского языка посоветуете?
4) Ваши варианты?