Всем привет! Я только вкатываюсь в DS. Прошу совета как можно решить задачу?
Есть датасет, очень несбалансированный, 18400 записей всего, три класса, первого- 13000, второй-4200, третий- 1200 примерно.
Нужно классифицировать на три объекта, вся проблема как очистить данные и сделать их пригодными для обучения.
Все данные для каждого класса лежат примерно в одних и тех же диапазонах, гистограммы с длинными хвостами, скаттер плот, тоже ничего не показывает, всего 259 обезличенных признаков