Итаг, я решил попуститься сегодня и ничего не делать после вчерашнего фейла. Там на самом деле осталось сравнить датасеты на ошибки, привести поля к единому виду. Пол, рождение, доход можно регекспами выпарсить, но это скучно.
Конкурс от am@opendata.by (@ushchent) - до сегодняшнего вечера нужно прислать PR со своими вариантами - кто пройдёт и кто нет из кандидатов 2019го года в CSV на https://github.com/ushchent/el_machina Формат, допустим data/predict-{user}.csv, присутствовать должны только кандидаты 2019го, как минимум идентификатор кандидата и булевый флаг прошёл/или нет. Вероятность желательна. Датасеты по кандидатам 2019го ещё есть в opendata/vybary2019