Обычно это не очень нужно внешним пользователям, кроме того в большинстве случаев (кроме Spark сейчас) расчет CTRов это не совсем препроцессинг перед обучением, потому что расчет может идти не только по одинарным признакам, но по комбинациям признаков уже входящих в текущее дерево, соответственно это нельзя заранее предрассчитать, кроме того может делаться для нескольких перестановок исходного датасета.