Size: a a a

R language and Statistical data analysis

2020 January 20

AS

Alexander Semenov in R language and Statistical data analysis
Спасибо.
источник

AS

Alexander Semenov in R language and Statistical data analysis
Неожиданно нарисовался вопрос, который, скорее всего объясниться моим послеобеденным тупняком, но я всё равно его задам.

Есть 2 датафрейма, которые по смыслу должны описывать одну и ту же совокупность айдишников. Кол-во строк в них одинаково. Если взять из обоих айдишники следующим способом (df - select(id) - arrange(desc(id)) - unlist() - unique()) и сравнить через identical(), то получаем TRUE.

Однако при попытке объединения этих датафреймов через left_join по этим айдишникам у меня получается датафрейм, длина которого практически равна 2Х любого из датафреймов.

Где тут может быть косяк?
источник

АК

Артём Клевцов in R language and Statistical data analysis
Alexander Semenov
Неожиданно нарисовался вопрос, который, скорее всего объясниться моим послеобеденным тупняком, но я всё равно его задам.

Есть 2 датафрейма, которые по смыслу должны описывать одну и ту же совокупность айдишников. Кол-во строк в них одинаково. Если взять из обоих айдишники следующим способом (df - select(id) - arrange(desc(id)) - unlist() - unique()) и сравнить через identical(), то получаем TRUE.

Однако при попытке объединения этих датафреймов через left_join по этим айдишникам у меня получается датафрейм, длина которого практически равна 2Х любого из датафреймов.

Где тут может быть косяк?
Ключ не уникальный.
источник

AS

Alexander Semenov in R language and Statistical data analysis
Почему тогда identical() возвращает TRUE?
источник

АК

Артём Клевцов in R language and Statistical data analysis
Значит в обеих таблицах не уникальный.
источник

АК

Артём Клевцов in R language and Statistical data analysis
anyDuplicated попробуй.
источник

AS

Alexander Semenov in R language and Statistical data analysis
Действительно, 42 550 айдишников из 2 033 568 оказались дублями.
источник

AS

Alexander Semenov in R language and Statistical data analysis
Спасибо.
источник

VY

VIKTORIYA YUKHINA in R language and Statistical data analysis
Добрый вечер, профессионалы! Я только приступила к изучению R, поэтому мой вопрос может оказаться простым для вас, но я на нем встала((( есть вектор из букв латинского алфавита. Буквы не по порядку и в разных регистрах. Как создать логический вектор, чтобы TRUE было только там где заглавные буквы? Предлагаются в помощь встроеные векторы litters и LITTERS. Но как их использовать все вместе не соображу.  Помогите, пожалуйста🙏
источник

ИП

Иван Поздняков in R language and Statistical data analysis
v %in% LETTERS
источник

DN

Denis Naumov in R language and Statistical data analysis
Друзья, подскажите как удалить коррелирующие значения использовал WHICH удалил все признаки, которые между собой коррелируют, а хочется удалить только часть признаков чтобы удалить только корреляции
источник

A

Alеx 🤼‍♂️ in R language and Statistical data analysis
VIKTORIYA YUKHINA
Добрый вечер, профессионалы! Я только приступила к изучению R, поэтому мой вопрос может оказаться простым для вас, но я на нем встала((( есть вектор из букв латинского алфавита. Буквы не по порядку и в разных регистрах. Как создать логический вектор, чтобы TRUE было только там где заглавные буквы? Предлагаются в помощь встроеные векторы litters и LITTERS. Но как их использовать все вместе не соображу.  Помогите, пожалуйста🙏
https://stackoverflow.com/questions/39775133/r-grep-remove-upper-case-rows

в первом комментарии  функция grepl
источник

ВК

Владимир Калинин in R language and Statistical data analysis
интересно, какой % из группы начинают знакомство с R через  тройку курсов stepik😂
источник

ВК

Владимир Калинин in R language and Statistical data analysis
или начинали*
источник

AP

Anton Pysanka in R language and Statistical data analysis
Владимир Калинин
интересно, какой % из группы начинают знакомство с R через  тройку курсов stepik😂
там не тройка, там пятерка, по-моему))
источник

ВК

Владимир Калинин in R language and Statistical data analysis
если считать статистику
источник

a

aGricolaMZ in R language and Statistical data analysis
Коллеги тут поделились ссылкой. Может быть кто будет свободен 14 - 19 июня

https://compsocialscience.github.io/summer-institute/2020/hse/

Если вы хотите помочь как ментор, то вот другая гуглформа
https://docs.google.com/forms/d/e/1FAIpQLSf2IQlw3di4A33rbhM_JWf9r2UMRaseFA8gyr4H6BH3C2SR2w/viewform?fbclid=IwAR1Q4-2nBhpAkPk76nFSFgLPYvinmI5wlsy6qLpDfye6tkXRY1pjzlhtK7Q
источник

A

Andrey in R language and Statistical data analysis
Владимир Калинин
интересно, какой % из группы начинают знакомство с R через  тройку курсов stepik😂
когда я начинал, курс по R был всего один
источник

A

Andrey in R language and Statistical data analysis
который от Хасти и Тибширани
источник

ВК

Владимир Калинин in R language and Statistical data analysis
это сколько лет назад?
источник