Ну в идеале перефразер должен уметь не просто искать синонимы, а менять конструкцию предложения, сохраняя смысл
Так повышается уникальность и лучше сохраняется стиль предложения
Косинусная метрика найдет максимально близкое предложение
Когда из N результатов от модели только несколько реально хороших перефразов, то симилярити - самое то, сам в начале использовал
Когда уже бОльшая доля - хорошие перефразы, начинаются проблемы, действительно уникальные варианты уезжают вниз