Size: a a a

R language and Statistical data analysis

2020 March 30

AS

Alexey Seleznev in R language and Statistical data analysis
Неделю назад, т.е. в прошлый понедельник я написал о запуске бесплатного курса по языку R, направленного на пользователей Excel. И обещал публиковать каждую неделю новый урок из этого курса.

Сегодня открываю второй урок данного курса об основных структура данных в R.

Видео второго урока: https://youtu.be/GwqoGHa8wjQ

Материалы: https://github.com/selesnow/publications/tree/master/code_example/from_excel_to_r/lesson_2

Полный плейлист курса: https://www.youtube.com/playlist?list=PLD2LDq8edf4pgGg16wYMobvIYy_0MI0kF

Подписка на youtube канал: https://www.youtube.com/R4marketing/?sub_confirmation=1

Программа курса на GitHub: https://github.com/selesnow/r4excel_users

#курс_R #урок02
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Артём Клевцов
И в результате:
> microbenchmark(
+   d[, .(v = sum(f)), by = .(g)],
+   d[, .(v = sum(!f)), by = .(g)]
+ )
Unit: milliseconds
                          expr      min       lq     mean   median       uq      max neval cld
 d[, .(v = sum(f)), by = .(g)] 15.67586 19.76153 26.77643 23.38175 25.29258 158.5116   100   b
d[, .(v = sum(!f)), by = .(g)] 10.70103 11.57647 14.76190 12.19055 14.69412 128.3662   100  a
спасибо. Интересно посмотреть логи, да! Во втором случае, вроде бы, не включилась оптимизация.
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Alexey Burnakov
спасибо. Интересно посмотреть логи, да! Во втором случае, вроде бы, не включилась оптимизация.
Но результат бенчмарка у меня другой. В обоих случаях результаты почти точно равны.
источник

АК

Артём Клевцов in R language and Statistical data analysis
Alexey Burnakov
Но результат бенчмарка у меня другой. В обоих случаях результаты почти точно равны.
У меня была дев-версия data.table. Может в этом дело.
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Артём Клевцов
У меня была дев-версия data.table. Может в этом дело.
Все может быть. у меня 1_10_4
источник

Y

Yevheny Shyma in R language and Statistical data analysis
Alexey Seleznev
Неделю назад, т.е. в прошлый понедельник я написал о запуске бесплатного курса по языку R, направленного на пользователей Excel. И обещал публиковать каждую неделю новый урок из этого курса.

Сегодня открываю второй урок данного курса об основных структура данных в R.

Видео второго урока: https://youtu.be/GwqoGHa8wjQ

Материалы: https://github.com/selesnow/publications/tree/master/code_example/from_excel_to_r/lesson_2

Полный плейлист курса: https://www.youtube.com/playlist?list=PLD2LDq8edf4pgGg16wYMobvIYy_0MI0kF

Подписка на youtube канал: https://www.youtube.com/R4marketing/?sub_confirmation=1

Программа курса на GitHub: https://github.com/selesnow/r4excel_users

#курс_R #урок02
Спасибо!)
источник

PD

Pavel Demin in R language and Statistical data analysis
уважаемые, подскажите, пожалуйста!
у меня есть массив в SPSS, там есть переменная веса.
В самом SPSS я бы пошел в data -> weight cases и выбрал бы там эту переменную. Сама процедура спорная, поскольку это де-факто frequency wight, но тем не менее.
Вопрос в том, как мне сделать нечто подобное в R? Прочитал что-то про пакет survey, но в него надо погружаться, с ходу мне сложно. Может есть какой-то тупой (простой) способ сделать взвешивание?
Был бы благодарен, может быть, за какую-нибудь ссылку по взвешиванию данных в целом, так как я в этой теме сильно плаваю. Возможно даже, что по формулировке вопроса стало понятно, что я не очень понимаю, о чем говорю
источник

AS

Alexander Semenov in R language and Statistical data analysis
На мою сильно замыленную голову это выглядит как умножение значений в столбцах на константы.
источник

PD

Pavel Demin in R language and Statistical data analysis
Alexander Semenov
На мою сильно замыленную голову это выглядит как умножение значений в столбцах на константы.
А если номинальные переменные?
источник

А[

Александр [capsula] in R language and Statistical data analysis
Pavel Demin
А если номинальные переменные?
Любая номинальная переменная может стать нумериком
источник

AS

Alexander Semenov in R language and Statistical data analysis
Это мы куда-то не туда пошли.
источник

AS

Alexander Semenov in R language and Statistical data analysis
При взвешивании обычно умножают результаты представителей "взвешиваемых" групп на веса, т.е. на константы. Как при этом поступают с номинальными шкалами я, честно говоря, не в курсе, т.к. подобную бесовщину не практиковал в реальной жизни.
источник

YS

Yuriy Saraikin in R language and Statistical data analysis
Pavel Demin
уважаемые, подскажите, пожалуйста!
у меня есть массив в SPSS, там есть переменная веса.
В самом SPSS я бы пошел в data -> weight cases и выбрал бы там эту переменную. Сама процедура спорная, поскольку это де-факто frequency wight, но тем не менее.
Вопрос в том, как мне сделать нечто подобное в R? Прочитал что-то про пакет survey, но в него надо погружаться, с ходу мне сложно. Может есть какой-то тупой (простой) способ сделать взвешивание?
Был бы благодарен, может быть, за какую-нибудь ссылку по взвешиванию данных в целом, так как я в этой теме сильно плаваю. Возможно даже, что по формулировке вопроса стало понятно, что я не очень понимаю, о чем говорю
expss попробуйте. survey немного не про то. А лучше содержательно задачу опишите. Может более понятно станет.
источник

MM

Mikle Mikle in R language and Statistical data analysis
Pavel Demin
уважаемые, подскажите, пожалуйста!
у меня есть массив в SPSS, там есть переменная веса.
В самом SPSS я бы пошел в data -> weight cases и выбрал бы там эту переменную. Сама процедура спорная, поскольку это де-факто frequency wight, но тем не менее.
Вопрос в том, как мне сделать нечто подобное в R? Прочитал что-то про пакет survey, но в него надо погружаться, с ходу мне сложно. Может есть какой-то тупой (простой) способ сделать взвешивание?
Был бы благодарен, может быть, за какую-нибудь ссылку по взвешиванию данных в целом, так как я в этой теме сильно плаваю. Возможно даже, что по формулировке вопроса стало понятно, что я не очень понимаю, о чем говорю
В пакете tabyl есть аргумент wt. Вообще много где есть аргумент для весов, но хз как они работают. Survey это про опросные веса, где задаётся дизайн эффект, стратификационные веса и тп
источник

MM

Mikle Mikle in R language and Statistical data analysis
Через survey тоже можно решить вашу задачу, но да, наверное, придётся копаться
источник
2020 March 31

ЕТ

Евгений Томилов in R language and Statistical data analysis
Кажется, вы ошиблись чатом.
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Евгений Томилов
Кажется, вы ошиблись чатом.
зачем вы разговариваете со спамером %)
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Philipp Upravitelev
зачем вы разговариваете со спамером %)
Да он просто ещё в двух чатиках есть, где я сижу. Вот у меня и выдал ложно-отрицательный результат классификатор.
источник

AS

Alexey Seleznev in R language and Statistical data analysis
друзья, я тут виньетку Викхема "Rectagling" перевёл, может кому интересно будет.

Там про разворачивание вложенных столбцов, т.е. tidyr::unnest_*()

https://habr.com/ru/post/491726/

#туториалы #полезные_ссылки
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
👍
источник