Size: a a a

R language and Statistical data analysis

2020 February 03

А[

Александр [capsula] in R language and Statistical data analysis
⌨️
Почитал ответы и понял, что, видимо, использую проекты совсем как-то не так
А для чего используете?
источник

⌨️ in R language and Statistical data analysis
Александр [capsula]
А для чего используете?
Ну я к тому что у меня замороченная система, где есть скрипт а-ля entry point, который грузит данные и либы, и сорсит все файлы в проекте, устанваливая глобальный условный флаг типа should_run <- TRUE. Затем я работаю в отдельном файле, который обычно содержит методы, решающие какую-то одну проблему. Внизу файла есть блок типа if (get0("should_run", ifnotfound = FALSE)) {}, в котором я отлаживаю/итерирую разработку.
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
⌨️
Ну я к тому что у меня замороченная система, где есть скрипт а-ля entry point, который грузит данные и либы, и сорсит все файлы в проекте, устанваливая глобальный условный флаг типа should_run <- TRUE. Затем я работаю в отдельном файле, который обычно содержит методы, решающие какую-то одну проблему. Внизу файла есть блок типа if (get0("should_run", ifnotfound = FALSE)) {}, в котором я отлаживаю/итерирую разработку.
я работал с таким форматом
но там, фактически, был сложный etl с блекджеком
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
но он сложный, имхо
и для некоторых кейсов только
источник

⌨️ in R language and Statistical data analysis
Philipp Upravitelev
но он сложный, имхо
и для некоторых кейсов только
а в чем сложность?
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
он требует контроля взаимосвязей скриптов и процессов, мне кажется
источник

⌨️ in R language and Statistical data analysis
Philipp Upravitelev
он требует контроля взаимосвязей скриптов и процессов, мне кажется
а, да, это верно, но в моем случае я это решаю именно изначальным source'ом всех файлов в проекте (обычно это не более пары десятков), которые делают доступными все глобальные функции. А дальше уже можно работать над конкретной маленькой проблемой.

Мне не очень понятно как можно более простым способом поддерживать проект, когда нужно итерировать разные способы обработки данных, разные модели, и все это еще красиво строить.
Нужно же как-то все это разделить.
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
просто, боюсь, далеко не у всех здесь есть необходимость работать в проектах такого объема :)

я, например, редко работаю с проектами, в которых больше десятка файлов. и то, это в основном барахло типа маркдауна
источник

⌨️ in R language and Statistical data analysis
Philipp Upravitelev
просто, боюсь, далеко не у всех здесь есть необходимость работать в проектах такого объема :)

я, например, редко работаю с проектами, в которых больше десятка файлов. и то, это в основном барахло типа маркдауна
Наверное вы правы. Я во всех сообществах всегда нахожусь на периферии и использую неконвенциональные методы и инструменты из-за своего бэкграуда и области.
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
да нормальные методы, просто не у всех возникает необходимость в них
вон, датасатанисты-питонисты вообще в ноутбуках работают, где выстраивать большую инфраструктуру будет очень больно
источник

⌨️ in R language and Statistical data analysis
Philipp Upravitelev
да нормальные методы, просто не у всех возникает необходимость в них
вон, датасатанисты-питонисты вообще в ноутбуках работают, где выстраивать большую инфраструктуру будет очень больно
Я из academia, тут все вокруг этим грешат)
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
хм. я через некоторое время приду к вам с вопросом, как у вас организовывают процесс %)
источник

a

aGricolaMZ in R language and Statistical data analysis
⌨️
Ну я к тому что у меня замороченная система, где есть скрипт а-ля entry point, который грузит данные и либы, и сорсит все файлы в проекте, устанваливая глобальный условный флаг типа should_run <- TRUE. Затем я работаю в отдельном файле, который обычно содержит методы, решающие какую-то одну проблему. Внизу файла есть блок типа if (get0("should_run", ifnotfound = FALSE)) {}, в котором я отлаживаю/итерирую разработку.
вау. я восхищен
источник

⌨️ in R language and Statistical data analysis
aGricolaMZ
вау. я восхищен
Чем?
источник

a

aGricolaMZ in R language and Statistical data analysis
устройством
источник

АК

Артём Клевцов in R language and Statistical data analysis
⌨️
Ну я к тому что у меня замороченная система, где есть скрипт а-ля entry point, который грузит данные и либы, и сорсит все файлы в проекте, устанваливая глобальный условный флаг типа should_run <- TRUE. Затем я работаю в отдельном файле, который обычно содержит методы, решающие какую-то одну проблему. Внизу файла есть блок типа if (get0("should_run", ifnotfound = FALSE)) {}, в котором я отлаживаю/итерирую разработку.
Звучит довольно странно.
Всё конечно же зависит от задачи и от предпочтений разработчика.
Впрочем, считаю, что организация сложного кода в R-пакеты - довольно универсальный подход. Причём в пакеты можно упаковывать данные, утилиты, а также создавать мета-пакеты, которые будут собирать весь функционал вместе. Возможно читать и писать конфиги/логи + возможность упаковать всё в контейнер приближает нас вплотную к уровню прода.
источник

⌨️ in R language and Statistical data analysis
Артём Клевцов
Звучит довольно странно.
Всё конечно же зависит от задачи и от предпочтений разработчика.
Впрочем, считаю, что организация сложного кода в R-пакеты - довольно универсальный подход. Причём в пакеты можно упаковывать данные, утилиты, а также создавать мета-пакеты, которые будут собирать весь функционал вместе. Возможно читать и писать конфиги/логи + возможность упаковать всё в контейнер приближает нас вплотную к уровню прода.
Ну проблема в том, что мне прод не нужен вообще. Какой-то функционал типа методов или красивых осей для ggplot2 я держу в пакетах, но все остальное - в таких проектах. Обычно это одноразовая задача - обработать данные, построить картинок и таблиц, опубликовать, полезные методы утащить в пакет, про остальное забыть.
источник

A

Andrey in R language and Statistical data analysis
⌨️
Ну я к тому что у меня замороченная система, где есть скрипт а-ля entry point, который грузит данные и либы, и сорсит все файлы в проекте, устанваливая глобальный условный флаг типа should_run <- TRUE. Затем я работаю в отдельном файле, который обычно содержит методы, решающие какую-то одну проблему. Внизу файла есть блок типа if (get0("should_run", ifnotfound = FALSE)) {}, в котором я отлаживаю/итерирую разработку.
какой-то велосипедный drake на минималках
источник

⌨️ in R language and Statistical data analysis
Andrey
какой-то велосипедный drake на минималках
Ну я про drake не знал, но в принципе да. За тем исключением что у меня все реально на минималках и неплохо решает все задачи. Ну и не плодит дополнительные зависимости
источник

v

vovanz in R language and Statistical data analysis
Подскажите люди добрые как в grepl  отфильтровать значения содержащие скобки?
источник