Size: a a a

R language and Statistical data analysis

2020 April 29

АК

Артём Клевцов... in R language and Statistical data analysis
fread(cmd = "gunzip -c data.zip") - вообще классика и вроде даже в доках есть.
источник

A

Andrey in R language and Statistical data analysis
да, и еще по строкам на лету фильтрует. Но я не помню, что BEGIN{OFS=\"|\";} делает.
источник

A

Andrey in R language and Statistical data analysis
awk - это как brainfuck, только на нем иногда получается написать что-то полезное
источник

A

Andrey in R language and Statistical data analysis
https://www.marktechpost.com/free-ai-ml-deep-learning-video-lectures/ мегаподборка курсов, есть и по R
источник

Ю

Юрий 🐙💻🤖📊📈🚬... in R language and Statistical data analysis
Переслано от Andrey
https://www.marktechpost.com/free-ai-ml-deep-learning-video-lectures/ мегаподборка курсов, есть и по R
источник
2020 April 30

EK

Eugene Kasatkin in R language and Statistical data analysis
кто-нибудь сталкивался с ошибков в пакете googlesheets4 "no encoding supplied defaulting to utf-8"? раньше такого не возникало
источник

AS

Alexey Seleznev in R language and Statistical data analysis
Eugene Kasatkin
кто-нибудь сталкивался с ошибков в пакете googlesheets4 "no encoding supplied defaulting to utf-8"? раньше такого не возникало
попробуйте установить dev версию gargle  из github
источник

AS

Alexey Seleznev in R language and Statistical data analysis
devtools::install_github('r-lib/gargle')
источник

AS

Alexey Seleznev in R language and Statistical data analysis
Друзья, снял ещё один обзор посвящённый пререлизу dplyr 1.0.0.

В этом видео рассмотрена обновлённая функция summirise().

Оригинал статьи по которой снят обзор - https://www.tidyverse.org/blog/2020/03/dplyr-1-0-0-summarise/

Кому понравилось подписывайтесь - https://www.youtube.com/R4marketing/?sub_confirmation=1
источник

ЕТ

Евгений Томилов... in R language and Statistical data analysis
Я чего-то не понимаю, наверное? Можете объяснить, почему у меня доступно 32Гб оперативки, но он не может разместить вектор в 4Гб?
источник

ЕТ

Евгений Томилов... in R language and Statistical data analysis
При этом Питон считает эту матрицу без проблем...
источник

EK

Evgenii Kalenkovich in R language and Statistical data analysis
Возможно, у вас 32-битный R. Попробуйте Sys.getenv("R_ARCH").
источник

ЕТ

Евгений Томилов... in R language and Statistical data analysis
Evgenii Kalenkovich
Возможно, у вас 32-битный R. Попробуйте Sys.getenv("R_ARCH").
Нет, он 64, я проверял и это тоже...
источник

ГД

Григорий Демин... in R language and Statistical data analysis
Евгений Томилов
Я чего-то не понимаю, наверное? Можете объяснить, почему у меня доступно 32Гб оперативки, но он не может разместить вектор в 4Гб?
daisy - это вроде кластеризация? Наверное, попарные расстояния считает. Матрица дистанций для 32593 строк около 8 гигов будет занимать, если считать наивно. попбробуйте запустить matr = matrix(0.5, nrow = 32593, ncol = 32593) - пройдет по памяти?
источник

ЕТ

Евгений Томилов... in R language and Statistical data analysis
Григорий Демин
daisy - это вроде кластеризация? Наверное, попарные расстояния считает. Матрица дистанций для 32593 строк около 8 гигов будет занимать, если считать наивно. попбробуйте запустить matr = matrix(0.5, nrow = 32593, ncol = 32593) - пройдет по памяти?
Да, она за секунду делается и проходит. У меня доступно 32Гб оперативки.
источник

ЕТ

Евгений Томилов... in R language and Statistical data analysis
источник

ГД

Григорий Демин... in R language and Statistical data analysis
хмм... тогда могу только предположить, что daisy делает что-то крайне неоптимальное
источник

ЕТ

Евгений Томилов... in R language and Statistical data analysis
Григорий Демин
хмм... тогда могу только предположить, что daisy делает что-то крайне неоптимальное
Угу, видимо, да. Это странно просто очень.
источник

ГД

Григорий Демин... in R language and Statistical data analysis
А в питоне какую функцию используете?
источник

ЕТ

Евгений Томилов... in R language and Statistical data analysis
Григорий Демин
А в питоне какую функцию используете?
Импортирую непосредственно пакет gower. И через неё. Считает долго, но считает.
источник