Size: a a a

R language and Statistical data analysis

2020 January 19

ЕТ

Евгений Томилов in R language and Statistical data analysis
Denis Naumov
Друзья вот такой график, мне кажется что сюда отлична подошла бы сигмоида для предсказания, и я погуглил и что-то и не нашел ничего, можете подсказать как в R использовать разные функции для предсказания, числовых значений
Можно ещё ввести спрямляющие пространства.
источник

ЭА

Эдик Амперян in R language and Statistical data analysis
Philipp Upravitelev
выглядит очень монументально %)
боюсь, полноценный фидбек я сейчас не осилю :(

кажется, у тебя не везде ссылки внутренние настроены
вот, рандомно ткнул, и в разделе 6.1 неработающая ссылка @ref{list}

ты в rvest через css-селекторы работаешь и учишь? почему?
я больше xpath предпочитаю, мне кажется, его удобнее объяснять как дерево тегов разметки - мы на занятиях сначала свой простенький html  ваяем, потом его же парсим потом уже более сложные сайты собираем. я вот бычно по сайтам ресторанных агрегаторов хожу, типа menu.ru :)
Спасибо за наводку про rvest/xpath, записал. Я когда-то при разборе XML набрел на подсказки от Хедли и какой-то его простенький тул для браузера и css селекторов. Может автор курса прошелся тем же путем...
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Эдик Амперян
Спасибо за наводку про rvest/xpath, записал. Я когда-то при разборе XML набрел на подсказки от Хедли и какой-то его простенький тул для браузера и css селекторов. Может автор курса прошелся тем же путем...
есть такой, selector gadget, расширение для хрома
я им пользовался, но мне не понравилось
источник

V

Violet in R language and Statistical data analysis
Евгений Томилов
"Математические и инструментальные методы машинного обучения"

Слушаю курс на Опенеду, пока еду готовлю.
Мне кажется, это очередное излишество из серии больше пушек по воробьям.
источник

ЭА

Эдик Амперян in R language and Statistical data analysis
А мне как раз надо было быстро, а другого не нашлось тогда
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
rvest просто оболочка над xml2, в общем-то.
источник

a

aGricolaMZ in R language and Statistical data analysis
Philipp Upravitelev
rvest просто оболочка над xml2, в общем-то.
я бы сказал над xml2 + httr
источник

R

R in R language and Statistical data analysis
Philipp Upravitelev
есть такой, selector gadget, расширение для хрома
я им пользовался, но мне не понравилось
вообще не понимаю, зачем нужен селектор гаджет, если встроенные инструменты хрома более функциональные и более удобные
источник

a

aGricolaMZ in R language and Statistical data analysis
Philipp Upravitelev
есть такой, selector gadget, расширение для хрома
я им пользовался, но мне не понравилось
мне всегда хватала встроенного в firefox
источник

PD

Pavel Demin in R language and Statistical data analysis
знаю, что кто-то будет плеваться, но для некоторых задач мне прям заходит RSelenium
особенно, когда надо распарсить сайт, элементы можно находить по id, css, xpath, class, name. в принципе, это можно и в rvest, который тоже активно юзаю,
```
page %>%
    html_node("xpath", "//*div[@class='class1'
]")
```
, но иногда бывает прям удобно...
источник

R

R in R language and Statistical data analysis
RSelenium для всего динамического, rvest для статического, не?
источник

PD

Pavel Demin in R language and Statistical data analysis
R
RSelenium для всего динамического, rvest для статического, не?
да, но вот мне надо было парсить новости с яндекса, и через rvest меня быстренько поблочили, а через RSelenium я в окне браузера один раз ввел капчу и больше меня никто не трогал
источник

R

R in R language and Statistical data analysis
а, да, есть такое. С гуглопереводчиком так было один раз
источник

АК

Артём Клевцов in R language and Statistical data analysis
Pavel Demin
знаю, что кто-то будет плеваться, но для некоторых задач мне прям заходит RSelenium
особенно, когда надо распарсить сайт, элементы можно находить по id, css, xpath, class, name. в принципе, это можно и в rvest, который тоже активно юзаю,
```
page %>%
    html_node("xpath", "//*div[@class='class1'
]")
```
, но иногда бывает прям удобно...
Он весьма медлнный и падал, когда с ним последний раз имел дело.
источник

VN

V N in R language and Statistical data analysis
источник

VN

V N in R language and Statistical data analysis
задача: необходимо сделать когортный анализ на сырых данных ЯндексМетрики. Решение выглядит как данная таблица, группируем по дате первого визита, клиентID, дате визитов и считаем метрики какие интересны...создал столбец ifelse(ym$`Первый визит посетителя`==1, ym$`Дата визита`, 0)...далее df <- ym %>% group_by(`Дата первого визита`, clientID, `Дата визита`) %>%
summarise(sum(`Полученный доход`))...в итоге мне разбился первый столбец на две группы...как сделать по приведенному скриншоту?
источник

⌨️ in R language and Statistical data analysis
V N
задача: необходимо сделать когортный анализ на сырых данных ЯндексМетрики. Решение выглядит как данная таблица, группируем по дате первого визита, клиентID, дате визитов и считаем метрики какие интересны...создал столбец ifelse(ym$`Первый визит посетителя`==1, ym$`Дата визита`, 0)...далее df <- ym %>% group_by(`Дата первого визита`, clientID, `Дата визита`) %>%
summarise(sum(`Полученный доход`))...в итоге мне разбился первый столбец на две группы...как сделать по приведенному скриншоту?
Не готов говорить за других, но мне было бы гораздо проще вам помочь, если бы вы предоставили минимальный reprex, тестовый кусочек данных и что ожидаете получить на выходе. А так понять и, главное, помочь - очень сложно
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
Друзья, в чате есть правила, ссылка в закрепе. От этого зависит, насколько точно и быстро смогут ответить. Экстрасенсов в чате не водится
источник

VN

V N in R language and Statistical data analysis
⌨️
Не готов говорить за других, но мне было бы гораздо проще вам помочь, если бы вы предоставили минимальный reprex, тестовый кусочек данных и что ожидаете получить на выходе. А так понять и, главное, помочь - очень сложно
какой должен быть результат Вы поняли? так наглядно, понятно? просто не знаю как выложить исходные данные, большой файл, может скриншот?
источник

⌨️ in R language and Statistical data analysis
V N
какой должен быть результат Вы поняли? так наглядно, понятно? просто не знаю как выложить исходные данные, большой файл, может скриншот?
Попробуйте что-то типа {reprex}
Я например не знаю как выглядят сырые данные Яндекс.Метрики, и довольно сложно понять, что вы делали, чтобы получить не тот результат, который нужен.
Вот пример reprex:
library(tidyverse)
mtcars %>% as_tibble %>% group_by(vs, am) %>% count %>% print
#> # A tibble: 4 x 3
#> # Groups:   vs, am [4]
#>      vs    am     n
#>   <dbl> <dbl> <int>
#> 1     0     0    12
#> 2     0     1     6
#> 3     1     0     7
#> 4     1     1     7

Теперь можно сказать, что результат-то ожидался другой, и не понятно, что не работает. Любой в чате может это скопировать, запустить у себя, поменять что-то и помочь вам. При этом не обязательно показывать весь дата сет или даже настоящие данные, достаточно воспроизвести вашу проблему минимальными средствами.
источник