Size: a a a

Data Science Chat

2021 October 14

M*

Marina *Одуванчик*... in Data Science Chat
я пробовала дату разбить на (дата, месяц, год) лаги, средние и закинула в бустинг. но мне кажется это не верное решение
источник

А

Андрей in Data Science Chat
Откуда скрин?
источник

ЯН

Ярослав Н in Data Science Chat
изучаю NER, может кто подсказать что это за тип разметки

West NNP I-NP I-MISC
Indian NNP I-NP I-MISC
all-rounder NN I-NP O
Phil NNP I-NP I-PER
Simmons NNP I-NP I-PER

а еще лучше пожет кто подсказать датасеты с такой разметкой на русском
источник

J

Jaa in Data Science Chat
источник

V_

Vadzim _B in Data Science Chat
Для комфортной - rtx 3090 бери, а вообще 10Гб минимум
источник

M*

Marina *Одуванчик*... in Data Science Chat
подскажите. использовала LinearRegression. и у меня прогнозные значения как-будто смещены вправо и вниз. в чем ошибка может быть?
источник

ЕГ

Евгений Глотов... in Data Science Chat
А обучение и предикт с одним и тем же интервалом в будущее делаешь?
источник

M*

Marina *Одуванчик*... in Data Science Chat
источник

M*

Marina *Одуванчик*... in Data Science Chat
источник
2021 October 15

ДС

Дмитрий Симаков... in Data Science Chat
Но ты понимаешь, что лаговые признаки определяют у тебя то, на сколько дней вперед ты способна предсказывать? В твоем случае - на lag_start. Все остальное для будущего тебе не известно. Попробуй все же сначала поделить выборку на трейн и тест. Есть ощущение, что ты не улавливаешь этот нюанс. И по тесту ты не можешь никакие признаки строить. Не можешь на нем предикт делать (ну кроме колонки даты). Он нужен, только чтобы посчитать метрику и графики глянуть.
источник

M*

Marina *Одуванчик*... in Data Science Chat
Я же разделила на трейн и тест. По тесту я не строю признаки. Скользящее среднее используется к тесту
источник

M*

Marina *Одуванчик*... in Data Science Chat
Ошибка в лагах. Буду смотреть на этот пункт
источник

M*

Marina *Одуванчик*... in Data Science Chat
Там выше среднего я нашла индекс до какого момента будет трейн. Потом разделила датасет по индексу до и после
источник

ДС

Дмитрий Симаков... in Data Science Chat
Важно понимание, что есть одно наблюдение, которое ты подаешь в модель. Какая у этого наблюдения текущая дата. Какие признаки на эту дату доступны (без заглядывания в будущее), какой таргет идёт после этой даты и на какой горизонт. Как построить эти же признаки для даты, от которой ты хочешь предсказать.
источник

M*

Marina *Одуванчик*... in Data Science Chat
Так что я не правильно сделала? Вроде выше определила границу. На трейне сделала средние. Потом по границе разделила на трейн и тест
источник

M*

Marina *Одуванчик*... in Data Science Chat
источник

d

deewee in Data Science Chat
а titan rtx хуже? у меня titan
источник

АК

Алексей Крапивницкий... in Data Science Chat
3060 12Gb норм тянет, если с размером батча не грубить )))
источник

АК

Алексей Крапивницкий... in Data Science Chat
Титана 24-гигового вообще за глаза
источник

d

deewee in Data Science Chat
да, я поэтому её и купил. а rtx 3090 лучше?
источник