Size: a a a

R language and Statistical data analysis

2020 January 27

PU

Philipp Upravitelev in R language and Statistical data analysis
ну так заполни пропуски значением типа none и сджойни
а из дублей он сделает картезианское произведение и все
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
ну или отсортируй по своим ключам и создай переменную-индекс
и сджойни уже по индексу
источник

AS

Alexander Semenov in R language and Statistical data analysis
Первое пробую, второе пока не понял.
источник

AS

Alexander Semenov in R language and Statistical data analysis
Так-с. По первому способу получилось на 1 строчку больше.
источник

ГД

Григорий Демин in R language and Statistical data analysis
Alexander Semenov
Как выяснилось, сджойниться нужно было ровно так же, как это делает Excel: "пропуски к пропускам, дубли к дублям", т.е. чтобы порядок и кол-во строк были идентичными тому, что приходит во входящем файле.
Насколько помню, эксель не джойнит дубли к дублям, а просто всегда берет первое встреченое
источник

AS

Alexander Semenov in R language and Statistical data analysis
Что-то мне подсказывает, что заказчики данного файла об этом не подозревают. А я слишком dead inside, чтобы об этом сообщать.
источник

AS

Alexander Semenov in R language and Statistical data analysis
"Главное, чтобы порядок айдишников и пропусков совпадал. Так удобнее копировать в другой файл".
источник

AS

Alexander Semenov in R language and Statistical data analysis
Alexander Semenov
Так-с. По первому способу получилось на 1 строчку больше.
Реально одной строчкой файлы отличаются, но как её найти я не пойму.
источник

AS

Alexander Semenov in R language and Statistical data analysis
head() и tail() идентичные.
источник

V

Violet in R language and Statistical data analysis
Все дело в шаблонах
источник

V

Violet in R language and Statistical data analysis
У них там шаблонный файл, куда они копипастят данные с большим колвом пропусков
источник

V

Violet in R language and Statistical data analysis
В R я бы это не стала делать
источник

AS

Alexander Semenov in R language and Statistical data analysis
Да, ну тут такое дело... В Excel это "джойнится" минут 40 и комп при этом висит наглухо.
источник

A

Andrey in R language and Statistical data analysis
К счастью, не знаю, как это делает ехель. Но в data.table есть mult = "first"
источник

A

Andrey in R language and Statistical data analysis
... и allow.cartesian = TRUE для того, чтобы разрешить растаращивание таблицы в случае неуникальных ключей
источник

AS

Alexander Semenov in R language and Statistical data analysis
Спасибо. Если не найду строчку, которой различаются датафреймы, попробую данный способ.
источник

V

Violet in R language and Statistical data analysis
Зачем в экселе? В Access
источник

AS

Alexander Semenov in R language and Statistical data analysis
Не вижу его в корп. наборе офисного софта.
источник

V

Violet in R language and Statistical data analysis
Мб на компе включить надо что-то?
источник

AS

Alexander Semenov in R language and Statistical data analysis
Я хочу исключить максимально возможно MS Office из работы моего направления, а вы предлагаете наоборот добавить их продуктов =)
источник