Телеграмм чат группы catboost_ru страница 97

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

catboost_ru

553 membersпожаловаться на группу

1
«
…
‹
92
93
94
95
96
97
98
›
…
»

2019 April 18

AD

Anna Veronika Dorogush in catboost_ru

вот так: simple_ctr='Borders:TargetBorderCount=2'

источник

22:39пожаловаться #1

SZ

Sasha Zhu in catboost_ru

Anna Veronika Dorogush

вот так: simple_ctr='Borders:TargetBorderCount=2'

Ещё раз спасибо)

источник

22:39пожаловаться #2

Аa

Андрей amber4eg in catboost_ru

Из занимательных наблюдений: у меня на одной задаче довольно быстро нарастает датасет для обучения. И вот чем он больше, тем бОльший lr хорошо заходит. на примерно 4М строк ставлю lr=0.6 и отлично всё. а на маленьких наборах приходится ставить на порядок меньшие значения, чтобы не было оверфита.

источник

22:41пожаловаться #3

AD

Anna Veronika Dorogush in catboost_ru

Ну да, на маленьких датасетах переобучение больше. Кроме того, чем больше датасет, тем больше итераций нужно с тем же лернинг рейтом.

источник

22:58пожаловаться #4

AD

Anna Veronika Dorogush in catboost_ru

Ещё раз спасибо)

Еще можно one_hot_max_size немного повысить, он 2 по умолчанию

источник

22:58пожаловаться #5

2019 April 19

IP

Igor Petrov in catboost_ru

По catboost_evaluation нету документации?

источник

08:10пожаловаться #6

AE

Alex Ello in catboost_ru

Доброго времени суток. Может ли кто-то подсказать где почитать про подготовку данных? Сет от 20мл, ворочать с помощью pandas боль

источник

11:29пожаловаться #7

AK

Anton Kiselëv in catboost_ru

Доброго времени суток. Может ли кто-то подсказать где почитать про подготовку данных? Сет от 20мл, ворочать с помощью pandas боль

Привет, у тебя какие фичи в датасете? Текст? Категории?

источник

11:34пожаловаться #8

A

Andrey in catboost_ru

SQL, r::data.table

источник

11:34пожаловаться #9

ИБ

Иван Брагин in catboost_ru

Доброго времени суток. Может ли кто-то подсказать где почитать про подготовку данных? Сет от 20мл, ворочать с помощью pandas боль

https://spark.apache.org/docs/latest/sql-getting-started.html

источник

11:45пожаловаться #10

AE

Alex Ello in catboost_ru

Спасибо, пока изучу предложенные варианты

источник

11:48пожаловаться #11

AE

Alex Ello in catboost_ru

Привет, у тебя какие фичи в датасете? Текст? Категории?

Дата сет скорее категории

источник

11:48пожаловаться #12

AS

Alexander Sychikov in catboost_ru

Тогда приведи к типу category. Датасет сожмется по весу в несколько раз

источник

11:49пожаловаться #13

AK

Anton Kiselëv in catboost_ru

Спасибо, пока изучу предложенные варианты

Попробуй ещё vaex и dask

источник

11:50пожаловаться #14

AE

Alex Ello in catboost_ru

Может кто в падаваны взять? 😅 есть вопросы по подготовке данных, не хочу в группу флудить

источник

12:29пожаловаться #15

AG

Artyom Gruzdev in catboost_ru

я бы тебя взял, но на эксперименты

источник

14:00пожаловаться #16

AS

Artem Seleznev in catboost_ru

Еще один ☝️ плюс к использованию категорий в dataframe. Можно сокращать размер данных в frame

источник

16:06пожаловаться #17

AS

Artem Seleznev in catboost_ru

источник

16:06пожаловаться #18

AS

Artem Seleznev in catboost_ru

источник

16:07пожаловаться #19

MK

Maxim Khrisanfov in catboost_ru

ну да, потому что заменяются числами)

источник

16:07пожаловаться #20

1
«
…
‹
92
93
94
95
96
97
98
›
…
»