Егор Овчинников
Подскажите пожалуйста, когда нужно делать get_dummies(), а когда это очень вредит?
Когда категориальный признак порядковый (холодно, тепло, горячо), их можно закодировать одним признаком (-1, 0, 1), так как значения можно поставить по порядку.
Если значений немного, то не страшно использовать get_dummies. Если значений очень много, то get_dummies создаст и много фич, что приведет к большой размерности: тут уже можно как-то группировать фичи (к примеру, редкие значения кодировать одним битом)