А надо ли для вероятностей балансировать классы? Дисбаланс это свойство данных если собраны верно то с дисбалансом ничего делать не нужно.
Насколько я понимаю: за время обучения, если классы не сбалансированны, то модель модель научится определять один из классов лучше чем другой, ТК сдвиг градиента будет чаще происходить в сторону одного из классов