В любом случае, тут надо от задачи отталкиваться. Для суммаризации книг, например, совершенно точно нужно разные варианты иерархий использовать. Ну то есть условно "страница -> глава -> книга". Для страниц какая-нибудь supervised суммаризация, для остальных уровней unsupervised из того, что получилось на предыдущем уровне. Либо end-to-end иерерхическая модель, если данных прям много.