Привет! Про трансформеры.
Вопрос такой, мне нужно скрытое состояние моего корпуса (то есть эмбеддинги), чтобы потом их подавать как фичи в модели второго уровня (классификаторы например), есть много данных, надо обучать на своём корпусе, соответственно мне нужно скрытое состояние, полученное с помощью encoder, decoder по идее не нужен, но чтобы обучить это скрытое состояние, полученное через encoder, мне нужно обучать весь трансформер (вместе с decoder), правильно?