В целом, мне тоже обучение USE с нуля кажется очень дорогостоящей и сомнительной задачей.
Я бы рекомендовал использовать готовые sentence encoders: USE, Laser, LaBSE (это берт, пофайнтюненный на translation ranking).
Если очень-очень хочется на собственных неразмеченных данных потюниться, то я бы взял тот же LaBSE, и пофайнтюнил бы его на задачу типа next sentence prediction с hard negatives.