он выбирает вероятностно лучший результат, в предположении, что у вас еще train распределен так же, как test. Потому в принципе могут быть любые соотношения.
А еще лучше делать несколько разных cv разбиений.
но тут еще полезно посмотреть на std, т.к скорее всего в вашем случае разница двух критериев статистически отличаться не будет