Телеграмм чат группы rlang

2020 February 19

PU

Philipp Upravitelev in R language and Statistical data analysis

источник

17:42пожаловаться #1

a

aGricolaMZ in R language and Statistical data analysis

Philipp Upravitelev

вопрос не совсем про R, скорее про визуализацию
допустим, я хочу сделать интерактивную карту России. где количество населения города задает размер точки на карте (москва тогда половину центральной России займет, это нормально), при клике на город - окно с какой-нибудь информацией
как бы вы такое делали? инструментарий вторичен, мне надо понять, куда искать и что гуглить

я бы делал в ggplot2 + ggiraph (если он поддерживает карты) или leaflet

источник

18:21пожаловаться #2

PU

Philipp Upravitelev in R language and Statistical data analysis

хорошо, посмотрю

источник

18:23пожаловаться #3

АК

Артём Клевцов in R language and Statistical data analysis

aGricolaMZ

я бы делал в ggplot2 + ggiraph (если он поддерживает карты) или leaflet

Жираф довольно куцый.

источник

18:23пожаловаться #4

KF

Konstantin Firsov in R language and Statistical data analysis

Philipp Upravitelev

вопрос не совсем про R, скорее про визуализацию
допустим, я хочу сделать интерактивную карту России. где количество населения города задает размер точки на карте (москва тогда половину центральной России займет, это нормально), при клике на город - окно с какой-нибудь информацией
как бы вы такое делали? инструментарий вторичен, мне надо понять, куда искать и что гуглить

А в сторону http://jkunst.com/highcharter/ смотрели?

Jkunst

Highcharter

highcharter and R wrapper for highcharts

источник

18:26пожаловаться #5

2020 February 20

АК

Артём Клевцов in R language and Statistical data analysis

Уважаемые, подскажите элегантное решение на data.table для следующей задачи.
Из таблицы вида:

   col_1 col_2 group
1:     1    NA     1
2:    NA     2     1
3:     1    NA     2
4:    NA     2     2

Надо получить таблицу следующего вида:

   col_1 col_2 group
1:     1     2     1
2:     1     2     2

Код для воспроизведения таблицы:

DT <- data.table(
  col_1 = c(1, NA, 1, NA),
  col_2 = c(NA, 2, NA, 2),
  group = c(1, 1, 2, 2)
)

Это странный разреженный формат, которые надо каким-то образом агрегировать по группам. Возможно есть вариант с сортировкой и хитрым фильтром.
Количество столбцов может быть произвольным.

источник

12:07пожаловаться #6

PU

Philipp Upravitelev in R language and Statistical data analysis

Артём Клевцов

Уважаемые, подскажите элегантное решение на data.table для следующей задачи.
Из таблицы вида:

   col_1 col_2 group
1:     1    NA     1
2:    NA     2     1
3:     1    NA     2
4:    NA     2     2

Надо получить таблицу следующего вида:

   col_1 col_2 group
1:     1     2     1
2:     1     2     2

Код для воспроизведения таблицы:

DT <- data.table(
  col_1 = c(1, NA, 1, NA),
  col_2 = c(NA, 2, NA, 2),
  group = c(1, 1, 2, 2)
)

Это странный разреженный формат, которые надо каким-то образом агрегировать по группам. Возможно есть вариант с сортировкой и хитрым фильтром.
Количество столбцов может быть произвольным.

не?

> tg_cols <- names(DT)[names(DT) != 'group']
> DT[, lapply(.SD, function(x) unique(na.omit(x))), by = group, .SDcols = tg_cols]
   group col_1 col_2
1:     1     1     2
2:     2     1     2

источник

12:15пожаловаться #7

АК

Артём Клевцов in R language and Statistical data analysis

Philipp Upravitelev

не?

> tg_cols <- names(DT)[names(DT) != 'group']
> DT[, lapply(.SD, function(x) unique(na.omit(x))), by = group, .SDcols = tg_cols]
   group col_1 col_2
1:     1     1     2
2:     2     1     2

Ты не считаешься, ибо моя школа и моё решение почти такое же, только чуть короче 😁

источник

12:16пожаловаться #8

PU

Philipp Upravitelev in R language and Statistical data analysis

слышь, учитель, показывай свое решение тогда

источник

12:17пожаловаться #9

PU

Philipp Upravitelev in R language and Statistical data analysis

и вообще, мы это в DSM уже делали

источник

12:17пожаловаться #10

АК

Артём Клевцов in R language and Statistical data analysis

Да? Я вытеснил скорее всего. Болезненно шибко.

источник

12:18пожаловаться #11

АК

Артём Клевцов in R language and Statistical data analysis

grp_col <- "group"
to_fix <- names(DT1)[colSums(is.na(DT1)) > 0L]
to_fix <- setdiff(to_fix, grp_col)
DT1[, lapply(.SD, na.omit), by = "group", .SDcols = to_fix]

источник

12:18пожаловаться #12

АК

Артём Клевцов in R language and Statistical data analysis

Пришлось нагородить, т.к. в реальном датасете не все столбцы содержали пропуски, что приводит к появления дублирующихся строк.

источник

12:19пожаловаться #13

АК

Артём Клевцов in R language and Statistical data analysis

Philipp Upravitelev

не?

> tg_cols <- names(DT)[names(DT) != 'group']
> DT[, lapply(.SD, function(x) unique(na.omit(x))), by = group, .SDcols = tg_cols]
   group col_1 col_2
1:     1     1     2
2:     2     1     2

Вместо unique можно first.

источник

12:25пожаловаться #14

PU

Philipp Upravitelev in R language and Statistical data analysis

я бы предпочел [1], пожалуй

источник

12:26пожаловаться #15

АК

Артём Клевцов in R language and Statistical data analysis

Да, что-то в first наворотили внутри проверок.

источник

12:27пожаловаться #16

ГД

Григорий Демин in R language and Statistical data analysis

Артём Клевцов

grp_col <- "group"
to_fix <- names(DT1)[colSums(is.na(DT1)) > 0L]
to_fix <- setdiff(to_fix, grp_col)
DT1[, lapply(.SD, na.omit), by = "group", .SDcols = to_fix]

а разве в .SD входят группирующие колонки? Можно оставить
```

to_fix <- names(DT1)[colSums(is.na(DT1)) > 0L]
DT1[, lapply(.SD, na.omit), by = "group", .SDcols = to_fix]

```

источник

12:55пожаловаться #17

АК

Артём Клевцов in R language and Statistical data analysis

Григорий Демин

а разве в .SD входят группирующие колонки? Можно оставить
```

to_fix <- names(DT1)[colSums(is.na(DT1)) > 0L]
DT1[, lapply(.SD, na.omit), by = "group", .SDcols = to_fix]

```

Хм, по идее не должна, но если она явно будет в .SDcols указана не понятно.

источник

13:00пожаловаться #18

ИП

Иван Поздняков in R language and Statistical data analysis

я бы попробовал перевести в длинный, дропнуть NA, потом обратно в широкий

источник

13:05пожаловаться #19

АК

Артём Клевцов in R language and Statistical data analysis

Принято, спасибо. Потом сравню 2 варианта.

источник

13:06пожаловаться #20