Size: a a a

R language and Statistical data analysis

2020 January 18

DN

Denis Naumov in R language and Statistical data analysis
Александр [capsula]
v1 = v0[1:10]
v2 = v0[11:20]
так я пробовал в самом начале, не работает
источник

А[

Александр [capsula] in R language and Statistical data analysis
Denis Naumov
так я пробовал в самом начале, не работает
Вы хотите по отдельности выдернуть месяц и дату, например, или нарезать вектор на куски поменьше?
источник

DN

Denis Naumov in R language and Statistical data analysis
Хочу выдернуть каждый отдельно, посмотреть влияет ли это на предсказание модели, так как даныне по электро потреблению, то должно вроде как
источник

А[

Александр [capsula] in R language and Statistical data analysis
Denis Naumov
Хочу выдернуть каждый отдельно, посмотреть влияет ли это на предсказание модели, так как даныне по электро потреблению, то должно вроде как
Выдернуть что?
источник

DN

Denis Naumov in R language and Statistical data analysis
в отдин столбец - год, в другой - месяц, в третий - день, в четвертый час и т.д.
источник

А[

Александр [capsula] in R language and Statistical data analysis
А, тогда смотрите ответ Филиппа
источник

О

Оля in R language and Statistical data analysis
есть такая классная штука как lubridate
источник

О

Оля in R language and Statistical data analysis
источник

PD

Pavel Demin in R language and Statistical data analysis
Ну или
lubridate::year(x)
И так далее
источник

PD

Pavel Demin in R language and Statistical data analysis
+
источник

DN

Denis Naumov in R language and Statistical data analysis
друзья подскажите, я не опытен в анализе данных.  У меня выборка тренировочная из 200 000 примеров, 84 признака, все числовые, есть признаки в которых из  200 000 нет значений для 199000 примеров, 180 000, что лучше с ними сделать? попытаться предсказать их пропущенные значения на основании остальных данных или просто удалить?
источник

DN

Denis Naumov in R language and Statistical data analysis
где то из 200 000 етсь только 300 примеров
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
выбросить данные?
вам не на чем учиться
источник

DN

Denis Naumov in R language and Statistical data analysis
Philipp Upravitelev
выбросить данные?
вам не на чем учиться
Данные еще есть. Просто 400 из 200 000 это понятно что слишком мало, но не понятно где это черта, если есть данные для 30% примеров их лучше попытаться предсказать или выкинуть, а 50% ? Вот этот вопрос меня волнует
источник

V

Violet in R language and Statistical data analysis
Зависит от значений, возможно еще как-то можно трансформировать переменную
источник

V

Violet in R language and Statistical data analysis
Предсказывать самое последнее что стоит делать
источник

DN

Denis Naumov in R language and Statistical data analysis
Violet
Зависит от значений, возможно еще как-то можно трансформировать переменную
В смысле трансформировать?
источник

V

Violet in R language and Statistical data analysis
Возможно, вам что-то даст категория "данные отсутствуют"
источник

V

Violet in R language and Statistical data analysis
Заполнять пропуски очень сомнительное занятие, так как бывает плохое качество оставшихся данных и вы будете множить ошибки
источник

DN

Denis Naumov in R language and Statistical data analysis
Violet
Возможно, вам что-то даст категория "данные отсутствуют"
Ok i google it
источник