Я так делал, если правильно понял Вас. Что под этим "И обучим NGBoost на кастомном распределении, которым в нашем случае будет смесь. "
понимается?
мой ответ вам не понравится, поскольку пейпер по NGBoost я, признаться честно, не читал. Только хайлайты. Идея была такая, что в NGB можно специфицировать распределение таргета. Из коробки там доступны Нормальное, Пуассона, логнормальное. А в задачке у нас бимодальный таргет и стандартные модели с этим, конечно, не справляются (если ооф предикты отрисовать, то это будет хорошо заметно). Вот поэтому подумал, что спецификация распределения может помочь