Если нужно для тестовой выборки построить интервалы, то можно использовать что-то в духе RepeatedKFold. А дальше уже квантили считать для каждой точки. Но это дорого, надо фитить много моделей (сколько достаточно, 100?). Проще доверительный интервал строить для метрики - считать скоры на бутстрапированной выборке предсказаний и таргета.
туплю и стыжусь, но спрошу - это значит берем тест, генерим из него бутстрепом кучу выборок и предиктим, и потом дов. интервал для метрики (допустим rmse), и уже от нее - можно сделать разброс конкретного предсказания, так? мозг говорит что я не так все понял