Телеграмм чат группы trainmydata страница 27

Представьте, что у вас есть набор значений и вы хотите знать среднее не обсчитывая все. В каком случае результат будет надёжнее, если вы возьмёте случайные значения или несколько подряд?

источник

18:49пожаловаться

Sviatoslav Iguana in Train My Data

Что, если порядок значений не случайный и подряд попадутся только все малые числа?

источник

18:50пожаловаться

Sviatoslav Iguana in Train My Data

Кстати, когда примерно планируется выкатить обновление?

источник

18:58пожаловаться

Сергей in Train My Data

Я надеюсь, что в начале следующей недели уже будет доступен список)

источник

18:59пожаловаться

Sviatoslav Iguana in Train My Data

Шик.

источник

19:00пожаловаться

Pavel Filatov in Train My Data

Sviatoslav Iguana

Что, если порядок значений не случайный и подряд попадутся только все малые числа?

Конечно же не случайный

источник

19:04пожаловаться

Pavel Filatov in Train My Data

Предполагается, что в рядах нынешнее значение зависит от предыдущих

источник

19:04пожаловаться

Pavel Filatov in Train My Data

Поэтому разрывать таким образом связь между значениями не стоит

источник

19:05пожаловаться

Sviatoslav Iguana in Train My Data

Если вы умеете предсказывать эти шальные пики на 5000000 единиц товара, то конечно не стоит.

источник

19:05пожаловаться

Andrei Babenko in Train My Data

Определённо надо мешать случайно. Может быть стратифаем по номеру филиала, канала, етц

источник

19:07пожаловаться

Nikolay in Train My Data

Так связь и не разрывается.
Ты предсказываешь ряд целиком, потом из него берутся значения и рандомно бьются на паблик/прайват.
Это влияет только на отображение результатов

источник

19:07пожаловаться

Nikolay in Train My Data

И если ты в целом збс предсказал, то и значения в рандомных точках этого ряда будут близки к истине

источник

19:09пожаловаться

Sviatoslav Iguana in Train My Data

Если у нас идут значения подряд, то варианты такие:
1. в паблик попадает пара шальных пиков продаж, локальная валидация говорит одно, лидерборд что-то совсем другое.
2. в паблике самый предсказуемый период, а в прайвате ещё несколько шальных пиков, все радуются адекватному лидерборду, а потом получают результаты лотереи
3. всё тихо спокойно в обеих частях, все молодцы.

источник

19:10пожаловаться

Sviatoslav Iguana in Train My Data

Ну ещё вариант с пиками в обеих частях, тогда вообще все оценки не сходятся.

источник

19:10пожаловаться