Еще такой вопрос, при обучении модели на цпу, выбивается лучший скор и значение лос функции ниже, чем на гпу, но так как датасет большой, все это медленно. Я нашел не стек оверфлоу, что можно выставить border_count на 255 для гпу, но особого прироста я не получил. В чем еще может бть разница? Можно ли как нибудь выставить цпушные настройки для гпу?