Size: a a a

2017 November 11

С

Сергей in Train My Data
Алексей, можете конкретнее, пожалуйста)
источник

AT

Alexey Tikhonov in Train My Data
беру файл по дням, из его даты делаю исошный год
исошную неделю
группирую по комбинациям (как в недельном трейне, канал-точка-группа товаром) и полученной неделе. суммирую продажи, джойню к недельным
смотрю глазами и вижу, что часть совпадает один в один
а часть совсем нет
и самое главное моя агрегация гораздо красивее по неделям, более стационарный ряд, у вас же в недельках то +100000, то 100, потом опять 5000
хотя если смотреть по дням там все гладенько
источник

С

Сергей in Train My Data
Да, я вас понял.
Номер недели проставляется сквозной. то есть первая неделя 2014 года - это первая сквозная неделя (поле N wk)
Соответственно в тестовых данных, недели начинаются аж со 184. Хотя в году недель всего около 50. Надеюсь, понятно привел пример)
Чтобы сравнивать дни, ориентируйтесь на поле wk, а не n wk.
источник

С

Сергей in Train My Data
Либо я не очень понял проблему
источник

AT

Alexey Tikhonov in Train My Data
нет
источник

AT

Alexey Tikhonov in Train My Data
я про трейн говорю
источник

AT

Alexey Tikhonov in Train My Data
train_set_days.csv
источник

AT

Alexey Tikhonov in Train My Data
из дней недели не собираются
источник

С

Сергей in Train My Data
ага, понял кажется. Уточню у аскотт, спасибо!
источник

AT

Alexey Tikhonov in Train My Data
соответтвенно вопрос, какие же недельки в тесте
корректно собранные из дней (тогда почему в трейне, не ровно)
или же какие то непонятные недельки
источник

С

Сергей in Train My Data
В тесте недели, идущие за трейном,  на поле wk точно можно положиться
источник

AT

Alexey Tikhonov in Train My Data
так если там такая же ошибка аггрегации, то нет смысла считать по дням
источник

С

Сергей in Train My Data
что считать? Имеете ввиду предсказывать по дням, потом собирать в недели?
источник

AT

Alexey Tikhonov in Train My Data
да
источник

С

Сергей in Train My Data
Мы постараемся как можно быстрее уточнить у аскотт и все проверить
источник

AT

Alexey Tikhonov in Train My Data
спасибо, и еще достаточно много пустот
то есть для комбинации в файле недели есть какое то значение
а в файле дней вообще дня из этой недели нет
источник

С

Сергей in Train My Data
Про дни поняли, будем проверять и узнавать, спасибо!
источник

AT

Alexey Tikhonov in Train My Data
вот простой пример
филиал==11, канал==2,сабгрп=1
в файле неделек ихз очень много, с 10 по 17 год
а в файле дней всего лишь 4 дня
2 из них одной неделе
1 вне недель
и 1 в неделе
суммы совпадают
источник

AT

Alexey Tikhonov in Train My Data
но откуда взялись еще 68 значений неделек??
источник

С

Сергей in Train My Data
Да, я понял.
Сейчас есть предположение. В файле train_days есть еще idItem, то есть конкретный товар. В неделях такого нет, соответственно там данные агрегированы по всем товарам группы. Возможно в days просто не все товары группы представлены.
Мы уточним в ближайшее время, прошу прощения!
источник