И допущение, что ты понимаешь, что человеку нужно, лучше, чем он сам - довольно героическое
Я имел ввиду именно то, что выгоды от ансамбля и стейкинга не будет так как предполагается, что они уже заложены в архитектуру, которая рассматривается...
Проверял на суммаризации, что-то очень плохо вышло Хм, поресерчу ещё, может я где-то ошибся Спасибо
Не особо ошибся. Если вчитаться в статью по mT5, то они НЕ дообучали эту модель на специфичных задачах. Так или иначе чтобы получить качество, то требуется finetuning модели. После этого результаты получаются отличные. Попробуй добавить перед текстом 'summarize:'