так, ну во-первых, прежде чем изобретать велосипед, есть смысл ознакомиться с существующими практиками
во-вторых, подобные сообщества (как мне кажется) существуют для обмена опытом, на хабре Вы не платите за прочтение статьи, когда кто-то "за так" делится опытом решения коммерческих задач
а нам medium еще частенько и код прикладывает
в-третьих, я никого не просила решать за меня задачу, поинтересовалась, есть ли у кого-то аналогичный опыт, буду благодарна и за ссылки типа paperswithcode с примерами работы с большими текстами, так как ранее видела только обучение на датасетах по типу CNN news