Телеграмм чат группы datasciencechat страница 7148

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Science Chat

5162 membersпожаловаться на группу

2021 October 23

NC

Nikita Chepurenko in Data Science Chat

А еще возможно, я могу ошибаться, может быть вам не надо сравнивать тип с bytes, но я лично так вижу это

источник

21:16пожаловаться #1

АА

Абстрактный Аутист... in Data Science Chat

Спасибо большое!

источник

21:16пожаловаться #2

NC

Nikita Chepurenko in Data Science Chat

Не за что, надеюсь это помогло

источник

21:17пожаловаться #3

АА

Абстрактный Аутист... in Data Science Chat

с одной стороны попыталось скомпилиться, с другой ошибку выдает

источник

21:17пожаловаться #4

NC

Nikita Chepurenko in Data Science Chat

что за ошибка?

источник

21:18пожаловаться #5

АА

Абстрактный Аутист... in Data Science Chat

да она не к этому относится, а к тому, что я дебил

источник

21:28пожаловаться #6

АА

Абстрактный Аутист... in Data Science Chat

Поэтому еще раз спасибо)

источник

21:29пожаловаться #7

s

sasha in Data Science Chat

ну очевидно попробуйте вытянуть фичи из него площадь колво комнат и тд

источник

21:37пожаловаться #8

NC

Nikita Chepurenko in Data Science Chat

👍

источник

21:37пожаловаться #9

DA

Daniil Agniashvili in Data Science Chat

окц

источник

21:49пожаловаться #10

ОН

Олег Новицкий... in Data Science Chat

Если я кодирую категориальные признаки в числовые, то лучше ноль не использовать и лучше подряд идущие числа, чем случайные?

источник

22:19пожаловаться #11

ДС

Дмитрий Симаков... in Data Science Chat

Смотря что за модель. Случайные могут случайно оказаться лучше.

источник

22:26пожаловаться #12

RN

Roman Nm in Data Science Chat

Ну то есть, в деревянных моделях важен только порядок, а в линейных надо пробовать. Использовать ноль или нет - пофигу даже в линейных моделях: минимальное значение даёт всем моделям одинаковую прибавку

источник

22:30пожаловаться #13

ОН

Олег Новицкий... in Data Science Chat

Сори за спам.
если у меня задача бинарной классификации. Признаки у меня все категориальные. Признаков 7, при OneHotEncoding'e я получил 48 признаков, записей у меня ~5000 тысяч. Какой алгоритм мне лучше использовать? Подойдёт ли лог рег или XGBoost, может что-то ещё? Ещё стоит ли мне понижать размерность на разбитых фичах? И стоит ли мне удалять признаки, у которых распределение таргета близко к 50 на 50?

источник

23:21пожаловаться #14

DS

Denis Stadnik in Data Science Chat

А почему потестить не хочешь?

источник

23:41пожаловаться #15

ОН

Олег Новицкий... in Data Science Chat

уже

источник

23:42пожаловаться #16

ОН

Олег Новицкий... in Data Science Chat

xgboost лучше на 0,08

источник

23:42пожаловаться #17

ДС

Дмитрий Симаков... in Data Science Chat

А если ты возьмёшь lightgbm… А если не будешь кодировать категории OHE. А может потом запустишь какой-нибудь автомл…

источник

23:43пожаловаться #18

DS

Denis Stadnik in Data Science Chat

Какой датасет мучаешь?

источник

23:43пожаловаться #19

ОН

Олег Новицкий... in Data Science Chat

да там решаю контест

источник

23:44пожаловаться #20