Size: a a a

ML Boot Camp Official

2021 May 28

JS

Jury Sergeev in ML Boot Camp Official
ну это был раньше MonetDBLite
источник

JS

Jury Sergeev in ML Boot Camp Official
форкнули в duckdb,
источник

JS

Jury Sergeev in ML Boot Camp Official
ибо MonetDBLite вендор забросил
источник

JS

Jury Sergeev in ML Boot Camp Official
хаха, смешно вышло
источник

AT

Alexey Tikhonov in ML Boot Camp Official
Ааа, утка?
источник

AT

Alexey Tikhonov in ML Boot Camp Official
Я думал правда dick, думаю что, неужели такая х. вая СУБД 😂
источник

A

Alex in ML Boot Camp Official
) 0)))
источник

JS

Jury Sergeev in ML Boot Camp Official
😂
источник

IC

Igor Chepelev in ML Boot Camp Official
у меня 5 файлов выполнятся :)
ничего изящного пока не нашел :)
источник

IC

Igor Chepelev in ML Boot Camp Official
5 файлов и два акцеса
(большие CSV получились по 65 ГБ - вот бью их теперь частями )
источник

IC

Igor Chepelev in ML Boot Camp Official
О! у меня вышло примерно 200 ГБ данных
наджойнилось :)
источник

AT

Alexey Tikhonov in ML Boot Camp Official
Имена файлов кириллицей 😳
источник

JS

Jury Sergeev in ML Boot Camp Official
ну у тебя уже решение, я пока просто бейз сделал
источник

AT

Alexey Tikhonov in ML Boot Camp Official
И результат тот-же??
источник

IC

Igor Chepelev in ML Boot Camp Official
мой подход такой
беру файл без лайна - читаю его по строчно
и если встречаю Идентификатор который предсказан - его меняю :)
если не смог предсказать этому человеку что то - то оставляю из безлайна
источник

JS

Jury Sergeev in ML Boot Camp Official
вариант... я придумал как для модельки данные набрать, но времени мало уже ) так то можно на future.apply все сделать, только мудрить-хитрить надо
источник

JS

Jury Sergeev in ML Boot Camp Official
но времени мало на это
источник

IC

Igor Chepelev in ML Boot Camp Official
короче я сначла обираю только тех кого надо предсказывать
деление на 8 и нечетные


# оставляем только тех кого можно предсказать

library(readr)
train <- read_csv("VK_Chalenge/train.csv")
# View(train)




# Отбираем тех кого надо предсказать
target_train <- unique(train[ train$u %% 8 == 1  ,c("u")  ])


# Отбираем тех кого можно предсказaть (все нечетные)
candidate_train_u <- unique(train[ train$u %% 2 == 1  , c("u") ])
candidate_train_v <- unique(train[ train$v %% 2 == 1  , c("v") ])

names (candidate_train_u) <- c("v")
names (candidate_train_v) <- c("v")

candidate_train <-  unique(rbind( candidate_train_u , candidate_train_v ))
источник

IC

Igor Chepelev in ML Boot Camp Official
потом результат моего супер дерева :)
только для тех кого надо предсказать

# Деф результ это предскзания по всем (результат модели )
df_result <- df_result[df_result$from %in% candidate_train$v, ]
источник

IC

Igor Chepelev in ML Boot Camp Official
и потом формирую сабмит
через замену имеющихся в файле
источник