Size: a a a

R language and Statistical data analysis

2019 December 22

A

Artyom in R language and Statistical data analysis
всем привет! подскажите пожалуйста, как работать с временным рядом от многих переменных? допустим есть колонки время,тип товара, и прочие характеристики. Можно сгруппировать данные допустим помесячно, посчитать сумму продаж, построить график и строить модель, описывающую этот временной ряд, но он же уже будет от одной переменной, как учесть первоначальный датасет?
источник

IM

I M in R language and Statistical data analysis
Artyom
всем привет! подскажите пожалуйста, как работать с временным рядом от многих переменных? допустим есть колонки время,тип товара, и прочие характеристики. Можно сгруппировать данные допустим помесячно, посчитать сумму продаж, построить график и строить модель, описывающую этот временной ряд, но он же уже будет от одной переменной, как учесть первоначальный датасет?
Какая задача стоит? Вопрос 'как работать' не вполне понятен
источник

A

Artyom in R language and Statistical data analysis
задача регрессии, предсказать сумму продаж
источник

IM

I M in R language and Statistical data analysis
Ну надо сразу простой lm() попробовать
источник

A

Artyom in R language and Statistical data analysis
это в исходном датасете? а как там сумму тогда посчитать для всех товаров?
источник

IM

I M in R language and Statistical data analysis
Сложно ответить на такие вопросы, не зная, как у вас организованы данные и какими пакетами пользуетесь
источник

A

Artyom in R language and Statistical data analysis
источник

A

Artyom in R language and Statistical data analysis
исходные данные
источник

A

Artyom in R language and Statistical data analysis
источник

A

Artyom in R language and Statistical data analysis
сгруппированные по неделям, сумма продаж и просмотров
источник

A

Artyom in R language and Statistical data analysis
нужно предсказать unit count допустим на неделю вперед, то есть разбить исходный ряд на трейн и тест, обучить модель и сделать предскзазание
источник

A

Andrey in R language and Statistical data analysis
Ну а фичи там какие? Только число просмотров?
источник

A

Andrey in R language and Statistical data analysis
короче, берешь профет, туда сам временной ряд unit_count и как доп. фичу product_views с лагом 1 добавляешь.
источник

A

Artyom in R language and Statistical data analysis
фичи- impressions, checkouts, views. но если раскрыть product id, то там тоже фичи можно взять- например бренд, цвет, категория, сезон
источник

A

Andrey in R language and Statistical data analysis
тогда тут большое пространство для фичеинжениринга. Что-то агрегатами по неделям считается, что-то дает сразу несколько фич (количество продаж по отдельным брендам). Какие-то фичи будут идти с лагом в 1 неделю, а какие-то нужно брать за ту неделю, для которой предикт нужен. И из даты-времени еще десяток фич можно намутить.
источник

A

Andrey in R language and Statistical data analysis
профет не обязателен, можно как обычную "табличную" задачу регресии переформулировать (без временных рядов как таковых) и тюнить бустинг в свое удовольствие
источник

A

Andrey in R language and Statistical data analysis
я прям на 100% такую задачу не решал, но на некоторых похожих понял, что свойства товаров являются не слишком хорошими предикторами. Гораздо важнее признаковое описание клиентов (которое обычно очень скудное) и потребительские настроения. А вот их можно учесть путем добавления правильных временнЫх фич и м.б. докидыванием внешних данных типа курса валют
источник

ВК

Владимир Калинин in R language and Statistical data analysis
источник

ВК

Владимир Калинин in R language and Statistical data analysis
Караул. ggplot рисует такой график
источник

ВК

Владимир Калинин in R language and Statistical data analysis
а rmarkdown этот же самый код превращает
источник