Size: a a a

Data Science Kazakhstan (DS/ML kz)

2020 June 18

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Kamalkhan Artykbayev
Всем салем

Каким путем CatBoost аггрегирует категориальными данными?

Под капотом он все переводит используя свой label encoder или же в one hot encoding??
Могу ошибаться, но кажется там это настраиваемо. Можно и mean encoding сделать
источник

RA

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)
The main advantage of catboost is a smart preprocessing of categorical data. You don’t have to preprocess data on your own. Some of the most popular practices to encode categorical data are:
One-hot encoding
Label encoding
Hashing encoding
Target encoding
and etc..
источник

RA

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)
источник

KA

Kamalkhan Artykbayev in Data Science Kazakhstan (DS/ML kz)
Rauan Akylzhanov
The main advantage of catboost is a smart preprocessing of categorical data. You don’t have to preprocess data on your own. Some of the most popular practices to encode categorical data are:
One-hot encoding
Label encoding
Hashing encoding
Target encoding
and etc..
а, все хорошо рахмет)

просто задумался в переводе в one hot encoding вручную
источник

RA

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)
Kamalkhan Artykbayev
а, все хорошо рахмет)

просто задумался в переводе в one hot encoding вручную
Коротко, настраиваемо. Как, смотри в статье. Удачи!
источник

R

Roman in Data Science Kazakhstan (DS/ML kz)
Никто не тестил artxp?Или документации/статьи с подробным разбором может кто встречал, подскажите пжлста)
источник

S

Sneddy in Data Science Kazakhstan (DS/ML kz)
Kamalkhan Artykbayev
Всем салем

Каким путем CatBoost аггрегирует категориальными данными?

Под капотом он все переводит используя свой label encoder или же в one hot encoding??
Кажется там таргет энкодинг, зависящий от последовательности данных
источник

KA

Kamalkhan Artykbayev in Data Science Kazakhstan (DS/ML kz)
Sneddy
Кажется там таргет энкодинг, зависящий от последовательности данных
хорошо рахмет 👍🏽
источник

S

Sneddy in Data Science Kazakhstan (DS/ML kz)
Временная зависимость в основном от того, что в яндексе его используют для click through rate
источник

S

Sneddy in Data Science Kazakhstan (DS/ML kz)
В курсе про как выигрывать каггл соревнование на курсере это был 3 вид таргет энкодинга
источник

S

Sneddy in Data Science Kazakhstan (DS/ML kz)
В общем точно не ohe
источник

YA

Yerdaulet Alibayev in Data Science Kazakhstan (DS/ML kz)
Думаю от камер в школах, можно уменьшить риски по безопасности на самом деле. Не думаю, что в таком возрасте там будут подавляться какие то диссидентские настроения. Ntechlab вродe крутые ребята там, не думаю что у них проблемы с этикой. Да и название системы Orwell, как бы намекает то что технологии будут использоваться по назначению.

К примеру, если в базу данных добавить фото всех наркобарыг и педофилов, расставить камеры по периметру школы, и кидать уведомление в полицию когда они рядом будут отшиваться. Я бы как родитель, за такую фичу и доплачивал бы школе.
источник

I

Iv in Data Science Kazakhstan (DS/ML kz)
А ещё выгоднее кидать уведомление барыгам, когда на горизонте полиция.
источник

📒

📒 in Data Science Kazakhstan (DS/ML kz)
надо сразу как в черном зеркале, камеру в зрачек, от педофилов 👍
источник

TM

Telegram Messenger in Data Science Kazakhstan (DS/ML kz)
источник

NK

ID:0 in Data Science Kazakhstan (DS/ML kz)
Завершилось соревнование Twitter Sentiment Extraction на kaggle.

Его цель была научиться выделять имеено ту часть твита, которая объясняет его настроение: положительное или отрицательное.

Казалось бы, задача очень интересная, данных более чем достаточно, однако организатор предоставил довольно шумную разметку. Многие слова обрываются в непонятных местах, а также иногда два практически одинаковых твита были размечены абсолютно по разному.  

Среди участников сообщества серебряной медалью отметился
39 место — Каймульденов Жанибек @zzZhanibek -> 1335 rank

Поздравляем @zzZhanibek со второй медалью и рангом эксперта

Если кого-то забыл пишите в лс @alimbekovkz
источник

Z

Z in Data Science Kazakhstan (DS/ML kz)
ID:0
Завершилось соревнование Twitter Sentiment Extraction на kaggle.

Его цель была научиться выделять имеено ту часть твита, которая объясняет его настроение: положительное или отрицательное.

Казалось бы, задача очень интересная, данных более чем достаточно, однако организатор предоставил довольно шумную разметку. Многие слова обрываются в непонятных местах, а также иногда два практически одинаковых твита были размечены абсолютно по разному.  

Среди участников сообщества серебряной медалью отметился
39 место — Каймульденов Жанибек @zzZhanibek -> 1335 rank

Поздравляем @zzZhanibek со второй медалью и рангом эксперта

Если кого-то забыл пишите в лс @alimbekovkz
👍👍
источник

К

Кir in Data Science Kazakhstan (DS/ML kz)
Yerdaulet Alibayev
Думаю от камер в школах, можно уменьшить риски по безопасности на самом деле. Не думаю, что в таком возрасте там будут подавляться какие то диссидентские настроения. Ntechlab вродe крутые ребята там, не думаю что у них проблемы с этикой. Да и название системы Orwell, как бы намекает то что технологии будут использоваться по назначению.

К примеру, если в базу данных добавить фото всех наркобарыг и педофилов, расставить камеры по периметру школы, и кидать уведомление в полицию когда они рядом будут отшиваться. Я бы как родитель, за такую фичу и доплачивал бы школе.
Вы отстали в технологиях :))) нынче онлайн. Закладки и онлайн игры
источник

е

ер п in Data Science Kazakhstan (DS/ML kz)
в казах Телеком у кого опыт работы был? что скажете?
источник

BT

Berl Tuspayev in Data Science Kazakhstan (DS/ML kz)
я тут работаю
источник