Size: a a a

R language and Statistical data analysis

2020 March 12

БА

Байкулов Антон in R language and Statistical data analysis
Желательно в какой-то plot, завязанный с кучей инпутов
источник

A

Andrey in R language and Statistical data analysis
Байкулов Антон
И теперь нубский вопрос: где найти пример кода из файла с server.R где данные аутоматически подтягиваются из, например, SQL БД
Там вроде никаких особенностей
источник

A

Andrey in R language and Statistical data analysis
Если можешь подгрузить данные вне шайни, то и в нем загрузишь тем же кодом
источник

A

Andrey in R language and Statistical data analysis
У меня приложение .fst в несколько гигов на старте читает:)
источник

EP

Ed P in R language and Statistical data analysis
Евгений Томилов
Подскажите, пожалуйста, как сделать наиболее кратко, пожалуйста. Есть два вектора соответствий названий. Я хочу красиво взять и сделать str_replace из, например, BB_ALP в "Щелочная фосфатаза" со всеми элементами вектора.  Суть в том, что, как в векторе example множественные сочетания. Делать последовательно несколько str_replace_all выход, конечно. Можно через цикл, но наверняка можно поинтереснее сделать? То есть, все BB_AST должны стать АСТ, а все BB_ALT должны стать "Щелочная фосфатаза".
В подобных случаях я в датасетах всегда короткие названия держу для универсальности.

Перевод текста делал обычно только перед печатью отчета с помощью metadata: в экселевскую таблицу руками забивал все возможные варианты и потом делал поиск по названию показателя. Н-р для BB_ALP нужный текст может быть "Щелочная фосфатаза", а м.б. "щелочной фосфатазы" или где-то "ЩФ" или с единицами измерений и т.п. В metadata все эти случаи как раз перечислены
источник

A

Andrey in R language and Statistical data analysis
Ed P
В подобных случаях я в датасетах всегда короткие названия держу для универсальности.

Перевод текста делал обычно только перед печатью отчета с помощью metadata: в экселевскую таблицу руками забивал все возможные варианты и потом делал поиск по названию показателя. Н-р для BB_ALP нужный текст может быть "Щелочная фосфатаза", а м.б. "щелочной фосфатазы" или где-то "ЩФ" или с единицами измерений и т.п. В metadata все эти случаи как раз перечислены
Лишние движения, в R можно сколь угодно сложные имена иметь в таблицах. А это означает корректные подписи на графиках и пр.
источник

EP

Ed P in R language and Statistical data analysis
Так я же и говорю, что перевод текста делал только перед печатью (графики туда же входят).

Т.е. в итоге пришел к выводу, что весь подобный текст держать в R-скриптах нерационально. Тем более отчет не обязательно на русском может быть, в разных исследованиях разные требования бывают. проще нужную метадату подсовывать и минимизировать изменения программ.

Сейчас в скриптах остались только стандартные аббревиатуры, н-р "BB_", чтобы отфильтровать лабораторные показатели.
источник

А[

Александр [capsula] in R language and Statistical data analysis
Ed P
В подобных случаях я в датасетах всегда короткие названия держу для универсальности.

Перевод текста делал обычно только перед печатью отчета с помощью metadata: в экселевскую таблицу руками забивал все возможные варианты и потом делал поиск по названию показателя. Н-р для BB_ALP нужный текст может быть "Щелочная фосфатаза", а м.б. "щелочной фосфатазы" или где-то "ЩФ" или с единицами измерений и т.п. В metadata все эти случаи как раз перечислены
К слову, а можно ли хранить те же единицы измерения, ммм, например в чем-то похожем на атрибут дата фрейма?
источник

A

Andrey in R language and Statistical data analysis
Зачем?! Называешь столбец "Глюкоза, ммоль/л", и все
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Ed P
В подобных случаях я в датасетах всегда короткие названия держу для универсальности.

Перевод текста делал обычно только перед печатью отчета с помощью metadata: в экселевскую таблицу руками забивал все возможные варианты и потом делал поиск по названию показателя. Н-р для BB_ALP нужный текст может быть "Щелочная фосфатаза", а м.б. "щелочной фосфатазы" или где-то "ЩФ" или с единицами измерений и т.п. В metadata все эти случаи как раз перечислены
Я через stri_replace_all_regex().
источник

EP

Ed P in R language and Statistical data analysis
не знаю :) если это локальная, а не центральная лаборатория, то лучше в отдельной переменной держать единицы, а в отельной - название показателя
источник

A

Andrey in R language and Statistical data analysis
Ed P
не знаю :) если это локальная, а не центральная лаборатория, то лучше в отдельной переменной держать единицы, а в отельной - название показателя
Нет!!!111
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Правда, я немного не понял, почему as.data.frame удаляет % и `( `из названий переменных. Как бы нет такого правила в правилах приведения.
источник

EP

Ed P in R language and Statistical data analysis
Andrey
Нет!!!111
в стандартах CDISC же так делается повсеместно :)
источник

A

Andrey in R language and Statistical data analysis
Ed P
не знаю :) если это локальная, а не центральная лаборатория, то лучше в отдельной переменной держать единицы, а в отельной - название показателя
Это верный путь к ошибкам. Лучше отдельные переменные на каждый вариант
источник

A

Andrey in R language and Statistical data analysis
Ed P
в стандартах CDISC же так делается повсеместно :)
Я тоже так делал, на практике это идиотизм
источник

EP

Ed P in R language and Statistical data analysis
Andrey
Это верный путь к ошибкам. Лучше отдельные переменные на каждый вариант
вы хотите сказать, что если глюкоза в двух единицах записана, то можно случайно это все в кучу свалить, если не будет уникального названия "показатель - единица изм."?
источник

A

Andrey in R language and Statistical data analysis
Евгений Томилов
Правда, я немного не понял, почему as.data.frame удаляет % и `( `из названий переменных. Как бы нет такого правила в правилах приведения.
Из чего таблицы делаются? К меня все на местах
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Andrey
Из чего таблицы делаются? К меня все на местах
Из матрицы списков.
источник

A

Andrey in R language and Statistical data analysis
Евгений Томилов
Из матрицы списков.
Такого не бывает, бывают списки матриц
источник