Size: a a a

R language and Statistical data analysis

2020 January 22

А[

Александр [capsula] in R language and Statistical data analysis
Denis Naumov
А что делать если модель предсказала na для некоторых значений? при подсчете MSE эти же значения не учитываются
А в данных для предсказания na не было?
источник

DN

Denis Naumov in R language and Statistical data analysis
Александр [capsula]
А в данных для предсказания na не было?
таргет значение было 4 пропуска
источник

DN

Denis Naumov in R language and Statistical data analysis
ну и в признаках были только данные у которых меньше 30% пропусков
источник

А[

Александр [capsula] in R language and Statistical data analysis
Denis Naumov
ну и в признаках были только данные у которых меньше 30% пропусков
Но если в модель засунуть na, его она и вернёт (наверное, если не упадёт)
источник

V

Violet in R language and Statistical data analysis
У меня такое было при нечисловых данных, какая-нибудь неформатная запятая и все.
источник

Y

Yevheny Shyma in R language and Statistical data analysis
Всем доброе! Сори за оффтоп, долго думаю на счет изучения R. Не решаюсь. На сейчас у меня стоит задача "свприть" около 1,3-1,5 млн строк. Exсel долго... В каком направлении лучше гуглить, в Python или в R? Понимаю что спрашиваю у сообщества работающих с R. Но тут больше вопрос к целесообразности решения подобных задач
источник

AP

Anton Pysanka in R language and Statistical data analysis
Yevheny Shyma
Всем доброе! Сори за оффтоп, долго думаю на счет изучения R. Не решаюсь. На сейчас у меня стоит задача "свприть" около 1,3-1,5 млн строк. Exсel долго... В каком направлении лучше гуглить, в Python или в R? Понимаю что спрашиваю у сообщества работающих с R. Но тут больше вопрос к целесообразности решения подобных задач
data.table::merge
источник

AS

Alexey Seleznev in R language and Statistical data analysis
Yevheny Shyma
Всем доброе! Сори за оффтоп, долго думаю на счет изучения R. Не решаюсь. На сейчас у меня стоит задача "свприть" около 1,3-1,5 млн строк. Exсel долго... В каком направлении лучше гуглить, в Python или в R? Понимаю что спрашиваю у сообщества работающих с R. Но тут больше вопрос к целесообразности решения подобных задач
Да это и в R и в питоне легко, и там и там функция merge, в питоне она в библиотеке pandas, в R прямо в базе идёт
источник

ВL

Владислав Lazycat in R language and Statistical data analysis
Yevheny Shyma
Всем доброе! Сори за оффтоп, долго думаю на счет изучения R. Не решаюсь. На сейчас у меня стоит задача "свприть" около 1,3-1,5 млн строк. Exсel долго... В каком направлении лучше гуглить, в Python или в R? Понимаю что спрашиваю у сообщества работающих с R. Но тут больше вопрос к целесообразности решения подобных задач
БД. Любая БД
источник

А[

Александр [capsula] in R language and Statistical data analysis
Под линупсом можно и штатными средствами склеить
источник

A

Alexander (AlexR) in R language and Statistical data analysis
@Shymkovych , Посмотрите в сторону awk
источник

A

Andrey in R language and Statistical data analysis
Yevheny Shyma
Всем доброе! Сори за оффтоп, долго думаю на счет изучения R. Не решаюсь. На сейчас у меня стоит задача "свприть" около 1,3-1,5 млн строк. Exсel долго... В каком направлении лучше гуглить, в Python или в R? Понимаю что спрашиваю у сообщества работающих с R. Но тут больше вопрос к целесообразности решения подобных задач
надо бы уточнить, что скрывается за шифром "свприть"
источник

A

Andrey in R language and Statistical data analysis
"сварить"? А конкретнее? Где эти строки сейчас хранятся, что с ними делать предстоит?
источник

Y

Yevheny Shyma in R language and Statistical data analysis
Andrey
"сварить"? А конкретнее? Где эти строки сейчас хранятся, что с ними делать предстоит?
2 таблицы с данными. Склеить их нужно по url
источник

Y

Yevheny Shyma in R language and Statistical data analysis
Владислав Lazycat
БД. Любая БД
Кстати как вариант, потом джоинить и дальше работать с данными
источник

A

Andrey in R language and Statistical data analysis
Yevheny Shyma
2 таблицы с данными. Склеить их нужно по url
источник

A

Andrey in R language and Statistical data analysis
если там уникальные ключи, итоговую таблицу не растаращит. И отработает за секунду
источник

IT

Inip Tyig in R language and Statistical data analysis
Александр [capsula]
Под линупсом можно и штатными средствами склеить
а для линуксистов, пересаженных на винду всегда есть два варианта: cygwin — олдфагам и LSfW для любителей свежанины
источник

IT

Inip Tyig in R language and Statistical data analysis
Yevheny Shyma
Кстати как вариант, потом джоинить и дальше работать с данными
плюсую. даже аксесс тут вполне сгодится, а у него импорты из экселя в два клика, практически
источник

А[

Александр [capsula] in R language and Statistical data analysis
Inip Tyig
а для линуксистов, пересаженных на винду всегда есть два варианта: cygwin — олдфагам и LSfW для любителей свежанины
Последнее это что? Гугл предлагает less suitable for work
источник