Запускаю параллельно через треды, два теста. Один логрегрессию обучает и делает предикт.
Размеры входных датасетов
rows X columns X partitions
(896, 3, 5) и длинна векторов фичей внутри фрейма 16340
Второй тест делает кастомный процессинг, с джойнами и подсчетом статистик. На входе
rows X columns X partitions
(14652288, 3, 8) и (14640640, 3, 10)
Я понимаю что без кода это гадание, но мне интересны общие практики.