Телеграмм чат группы rlang_ru страница 1726

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

R language and Statistical data analysis

1000 membersпожаловаться на группу

2019 December 23

C

Cocos in R language and Statistical data analysis

😁

источник

22:47пожаловаться #1

PU

Philipp Upravitelev in R language and Statistical data analysis

да, кстати. коллеги, подскажите какой-нибудь простой набор операций (допустим, на пяток строк)
на котором можно было бы продемонстрировать профилирование?
а то обычно используют для этого графики ggplot (агрегация + визуализация), но я что-то не хочу их брать %(

источник

22:54пожаловаться #2

Л

Леона in R language and Statistical data analysis

AnimatedSticker.tgs

источник

23:09пожаловаться #3

Л

Леона in R language and Statistical data analysis

AnimatedSticker.tgs

источник

23:18пожаловаться #4

2019 December 24

ГД

Григорий Демин in R language and Statistical data analysis

Philipp Upravitelev

да, кстати. коллеги, подскажите какой-нибудь простой набор операций (допустим, на пяток строк)
на котором можно было бы продемонстрировать профилирование?
а то обычно используют для этого графики ggplot (агрегация + визуализация), но я что-то не хочу их брать %(

Попробуйте сабсет обычного data.frame с именами строк. Там обычно make.unique вылезает в первые ряды

источник

01:00пожаловаться #5

PU

Philipp Upravitelev in R language and Statistical data analysis

о. интересно, спасибо

источник

01:01пожаловаться #6

C

Cocos in R language and Statistical data analysis

у меня десятки миллионов строк джойнятся, фильтруются, группируются и присваются через := очень даже быстро

opl<-list(rep("",1000000))
system.time(for(i in 1:1000000) opl[[1]][i]<-paste0("vn",i))
пользователь система прошло
8.53 0.11 8.73
opl<-data.table(rep("",1000000))
system.time(for(i in 1:1000000) opl[i,V1:=paste0("vn",i)])
пользователь система прошло
693.02 66.59 747.53

источник

07:26пожаловаться #7

C

Cocos in R language and Statistical data analysis

в 81 раз медленнее!!!!

источник

07:28пожаловаться #8

⌨

⌨️ in R language and Statistical data analysis

Я не спец по data.table, но вот тут написано, что loop-friendly функция это set

www.rdocumentation.org

:= function | R Documentation

Fast add, remove and update subsets of columns, by reference. := operator can be used in two ways: LHS := RHS form, and Functional form. See Usage.
set is a low-overhead loop-able version of :=. It is particularly useful for repetitively updating rows of certain columns by reference (using a for-loop). See Examples. It can not perform grouping operations.

источник

07:38пожаловаться #9

A

Andrey in R language and Statistical data analysis

opl[1:1e6, V1 := paste0("vn", 1:1e6)] цикл не нужен

источник

08:42пожаловаться #10

АК

Артём Клевцов in R language and Statistical data analysis

opl[1:1e6, V1 := paste0("vn", 1:1e6)] цикл не нужен

paste0("vn", .I)

источник

08:45пожаловаться #11

A

Andrey in R language and Statistical data analysis

Артём Клевцов

paste0("vn", .I)

Я пишу для общего случая

источник

08:46пожаловаться #12

A

Andrey in R language and Statistical data analysis

Когда что-то полезное добавляется, а не номера строк

источник

08:46пожаловаться #13

АК

Артём Клевцов in R language and Statistical data analysis

Cocos

opl<-list(rep("",1000000))
system.time(for(i in 1:1000000) opl[[1]][i]<-paste0("vn",i))
пользователь система прошло
8.53 0.11 8.73
opl<-data.table(rep("",1000000))
system.time(for(i in 1:1000000) opl[i,V1:=paste0("vn",i)])
пользователь система прошло
693.02 66.59 747.53

Дело не в data.table, а в твоём непонимании векторизованных функций в R (по моему предолпожению).
Фильтровать 100500 раз таблицу никакой ЯП быстро не сможет, даже если индекс построить.

источник

08:47пожаловаться #14

A

Andrey in R language and Statistical data analysis

opl[1:1e6, V1 := paste0("vn", 1:1e6)] цикл не нужен

Этот вариант 3.8 сек на старом офисном кудахтере с 2 ядрами

источник

08:49пожаловаться #15

A

Andrey in R language and Statistical data analysis

Цикл к обеду досчитается

источник

08:49пожаловаться #16

АК

Артём Клевцов in R language and Statistical data analysis

Cocos

по сравнению со списком присваивание строк замедляется в десятки раз

Первоначальный тезис выглядит довольно абстрактно. Приведённый пример для воспроизведения «проблемы» неадекватен по отношению к data.table.
Изначально заход выглядил как вброс, но теперь понятно почему.

источник

08:51пожаловаться #17

АК

Артём Клевцов in R language and Statistical data analysis

Ох уж эти «разоблачители» 😁
Начать надо с ревью своего же кода...

источник

08:53пожаловаться #18

C

Cocos in R language and Statistical data analysis

for(l in 1:lc_max) for(pcease in 1:cease) for(nOnMinI in cycles$n-1){
p<-p+1; outcome[p,cname:=paste0(pcluster1[[pcease]]["cname"],"l",l,"n",nOnMinI,"vn")]
for(vergeI in cycles$v-1){
p<-p+1; outcome[p,cname:=paste0(pcluster1[[pcease]]["cname"],"l",l,"n",nOnMinI,"v",vergeI)]
p<-p+1; outcome[p,cname:=paste0(pcluster1[[pcease]]["cname"],"l",l,"n",nOnMinII,"vd",vergeI)]
p<-p+1; outcome[p,cname:=paste0(pcluster1[[pcease]]["cname"],"l",l,"n",nOnMinI,"vm",vergeI)]
}
циклов несколько

источник

08:56пожаловаться #19

АК

Артём Клевцов in R language and Statistical data analysis

Всё ещё хуже, чем предполагал изначально.

источник

08:59пожаловаться #20