Size: a a a

R language and Statistical data analysis

2020 January 23

ЕТ

Евгений Томилов in R language and Statistical data analysis
Sergey Motorniy
Коллеги, привет
У вас последняя строка не до конца заполнена.
источник

SM

Sergey Motorniy in R language and Statistical data analysis
Евгений Томилов
У вас последняя строка не до конца заполнена.
Я эт понимаю, а что делать то? Как заполнить?
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Sergey Motorniy
Я эт понимаю, а что делать то? Как заполнить?
Для начала попробуйте скинуть код. Если он большой, то на pastebin, а потом сюда ссылкой или отдельным файлом в R. 😄
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
И опишите подробнее, что делаете с какими данными.
источник

SM

Sergey Motorniy in R language and Statistical data analysis
Евгений Томилов
И опишите подробнее, что делаете с какими данными.
Я получаю данные из Гугл рекламы по api через radwords
источник

DN

Denis Naumov in R language and Statistical data analysis
Друзья, хочу разделить на train, validate и test
### Train, validate, test
set.seed(145)
sample = sample.split(train_data, SplitRatio = 0.60)
target1_train =subset(train_data,sample ==TRUE)
target1_val_test =subset(train_data,sample ==FALSE)
sample2 = sample.split(target1_val_test, SplitRatio = 0.50)
target1_val =subset(target1_val_test,sample ==TRUE)
target1_test =subset(target1_val_test,sample ==FALSE)

такая запись имеет место на существование?
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Denis Naumov
Друзья, хочу разделить на train, validate и test
### Train, validate, test
set.seed(145)
sample = sample.split(train_data, SplitRatio = 0.60)
target1_train =subset(train_data,sample ==TRUE)
target1_val_test =subset(train_data,sample ==FALSE)
sample2 = sample.split(target1_val_test, SplitRatio = 0.50)
target1_val =subset(target1_val_test,sample ==TRUE)
target1_test =subset(target1_val_test,sample ==FALSE)

такая запись имеет место на существование?
Попробуйте лучше из caret функцию. Или из rsample.
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
или руками...
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Philipp Upravitelev
или руками...
Ой, мы тут низкоуровневые программисты, что ли.
источник

DN

Denis Naumov in R language and Statistical data analysis
Philipp Upravitelev
или руками...
200 000 стро
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Denis Naumov
200 000 стро
ну ну само собой не каждуб строку
просто sample(N, N*.15) как индекс и тд
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Евгений Томилов
Ой, мы тут низкоуровневые программисты, что ли.
зачем использовать пакеты, когда все решается базой, не?
источник

DN

Denis Naumov in R language and Statistical data analysis
Philipp Upravitelev
ну ну само собой не каждуб строку
просто sample(N, N*.15) как индекс и тд
не понял
источник

A

Andrey in R language and Statistical data analysis
Philipp Upravitelev
зачем использовать пакеты, когда все решается базой, не?
А потом захочется стратификацию или еще чего...
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
++
источник

А[

Александр [capsula] in R language and Statistical data analysis
Sergey Motorniy
Коллеги, привет
Я бы сказал, что какой-то символ паразитарный есть, юникод или что-то там ещё, построчно попробуйте прочитать
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Andrey
А потом захочется стратификацию или еще чего...
чем плохо? аналогично по группам можно
> library(data.table)
> my_dt <- data.table(
+   var1 = sample(c('a', 'b'), 2000, replace = TRUE),
+   var2 = rnorm(2000)
+ )
>
> my_dt[, tg := sample(c('train', 'test', 'validate'), .N, TRUE, c(.7, .15, .15))]
> my_dt[, .N / my_dt[, .N], by = tg]
        tg     V1
1:    train 0.6975
2: validate 0.1610
3:     test 0.1415
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Опять адепты дататейбла набигают со своим колдовством.
источник

SM

Sergey Motorniy in R language and Statistical data analysis
Александр [capsula]
Я бы сказал, что какой-то символ паразитарный есть, юникод или что-то там ещё, построчно попробуйте прочитать
Оу, благодарю, попробую
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Евгений Томилов
Опять адепты дататейбла набигают со своим колдовством.
тут просто sample() с вероятностями, ничего от data.table
источник