есть, да. Но она влияет на результат не настолько сильно на _маленьких_ dataset, насколько сам дисбаланс на него влияет. Верно? :-)
я не совсем понял посыл. если есть значитальный дисбаланс классов, его нужно исправлять, чтобы при обучении и потом при предикте не было перекоса в какую-либо сторону. каким именно образом это делать (сэмплинг, веса cost function) — зависит от задачи и не играет больщой роли, как я понимаю