Здорова, проказники
Как ваше ничего? Пришло время подвести итоги
соревнования. Хочется сразу сказать, что паблике кернел, как и 0.901 никому пробить не удалось. Это не беда, ведь мы здесь, чтоб учиться и узнавать что-то новое, а какие-то локальные неудачи, это просто часть пути, который нужно мужественно пройти. Но дядя Саша без подарков не оставит. За over9000 попыток и гипотез
@HitMIss получает Кингу Николенко «Глубокое обучение».
Но давайте все же разберем, что пошло не так. В чем же суть этого ебаного соревнования. Проведем так скажем ML тренировку на минималках. Думаю, с условием соревнования ты ознакомился, если нет, то
вот. 200 фичей, предсказываем вероятность.
Что нужно было сделать, чтоб залезть в бронзу, в самую нижнюю границу? Так сказать вариант для бомжей. Все очень просто, нужно было сблендить результаты свои + общедоступные, кластерным блендингом, его кстати отлично описали в паблике кернеле
https://www.kaggle.com/darbin/clustering-blender-of-0-901-solutionsНо! Этот вариант достижения цели не несет никакой интеллектуальный нагрузки и так делают реально бомжары, которые не хотят учиться, а хотят просто медали. Но для общего развития знать будешь.
Где же была dog зарыта? Участники соревнования заметили, что у фичей очень странная частотность, частоты отличались трейна от теста, в итоге суть соревнования сводилась к тому, чтобы догадаться применить Frequency encoding ко всем фичам и заменить 200 стандартных на 200 закодированных. Не каждый день применяешь Frequency encoding к флоат фичам в этом и pizdec. Что такое Frequency encoding? Frequency encoding - это частотное кодирование, короче говоря, замена значения на частоту встречаемости этого значения. Если у нас есть фича Животные, и там 3 строчки: Собака, Кошка, Собака. Frequency encoding преобразует это в 2, 1, 2. Думаю вы поняли. Вот ребята, кто нашел этот прикол отправлялись прямиком в топ лидборда. Хорошую реализацию можно глянуть тут
https://www.kaggle.com/zfturbo/magic-feature-generatorА что касается тебя, мой юный(или не очень) друг, не стоит расстраиваться из-за одного соревнования. Главное, что ты учишься и получаешь опыт. А медали и звания каггл это все дело наживное и приходящее со временем, у тебя еще все впереди, мамкин дата сайнтист.
Если понравилась наша ML тренировка на минималках, нажимай на лицо своей девушки, когда она увидела твоего python-а в первый раз, будем проводить такие иногда.
Работаем, братва