Size: a a a

R language and Statistical data analysis

2020 January 18

AP

Anton Pysanka in R language and Statistical data analysis
посмотрите на распределение этой переменной, корреляцию с предсказываемой переменной/с другими предикторами – может оно вам что-то подскажет. попробуйте заменить пропущенные значения средним, медианой, нулем, как предлагали, сделать категориальный признак из такой переменной – посмотрите что даст лучший результат, дает ли что-то результату наличие трансформированной переменной или ее полное отсутствие
источник

DN

Denis Naumov in R language and Statistical data analysis
Anton Pysanka
посмотрите на распределение этой переменной, корреляцию с предсказываемой переменной/с другими предикторами – может оно вам что-то подскажет. попробуйте заменить пропущенные значения средним, медианой, нулем, как предлагали, сделать категориальный признак из такой переменной – посмотрите что даст лучший результат, дает ли что-то результату наличие трансформированной переменной или ее полное отсутствие
Спасибо, кажется огромный объем работы мне нужно проделать)))
источник

a

aGricolaMZ in R language and Statistical data analysis
Дорогие, курс по R в маге по DH в вышке медленно двигается к завершению. Сейчас он готов где-то лишь на 60%, но уже готовы занятия по работе с пакетами dplyr, ggplot, tidyr, со списками, строками, текстами, картами, временем, и скачиванием данных из интернета. Если у кого-то возникнет желание проглядеть первые 12 разделов и покомментировать —- я буду только рад. Если кому-то будет полезно — тоже буду рад.

Но самое главное, что там есть — это конечно задания.
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
источник

ЭА

Эдик Амперян in R language and Statistical data analysis
aGricolaMZ
Дорогие, курс по R в маге по DH в вышке медленно двигается к завершению. Сейчас он готов где-то лишь на 60%, но уже готовы занятия по работе с пакетами dplyr, ggplot, tidyr, со списками, строками, текстами, картами, временем, и скачиванием данных из интернета. Если у кого-то возникнет желание проглядеть первые 12 разделов и покомментировать —- я буду только рад. Если кому-то будет полезно — тоже буду рад.

Но самое главное, что там есть — это конечно задания.
Ничего себе там разделов! Потом наверное попробую...

Но люблю методом тыка сразу что-нибудь находить... Раздел 4.7 начало:
"Кроме того, существует способ использовать не такой рубленный график, а его сглаженную[1] вариант, который строиться при помощи функции плотности. Важное свойство, которое стоит понимать про функцию плотности — что кривая, получаемая ядерной оценкой плотности, не зависит от величины коробки[2] гистограммы (хотя есть аргумент[3], который отвечает за степень “близости” функции плотности к гистограмме)."

[1] сглаженнЫЙ вариант, который строиТСЯ при помощи метода ядерной оценки функции плотности вероятности
[2] шага квантования(?)
[3] лучше сразу указать этот аргумент adjust и дать ниже визуальный пример, как он влияет на "степень изрезанности", хотя это есть в стандартной доке, можно тогда сослаться
источник
2020 January 19

l

lp in R language and Statistical data analysis
Эдик Амперян
Ничего себе там разделов! Потом наверное попробую...

Но люблю методом тыка сразу что-нибудь находить... Раздел 4.7 начало:
"Кроме того, существует способ использовать не такой рубленный график, а его сглаженную[1] вариант, который строиться при помощи функции плотности. Важное свойство, которое стоит понимать про функцию плотности — что кривая, получаемая ядерной оценкой плотности, не зависит от величины коробки[2] гистограммы (хотя есть аргумент[3], который отвечает за степень “близости” функции плотности к гистограмме)."

[1] сглаженнЫЙ вариант, который строиТСЯ при помощи метода ядерной оценки функции плотности вероятности
[2] шага квантования(?)
[3] лучше сразу указать этот аргумент adjust и дать ниже визуальный пример, как он влияет на "степень изрезанности", хотя это есть в стандартной доке, можно тогда сослаться
👍
[2] вариант "частота дискретизации" мне кажется наиболее корректным

...пахнет гугл транслейтом
источник

a

aGricolaMZ in R language and Statistical data analysis
Эдик Амперян
Ничего себе там разделов! Потом наверное попробую...

Но люблю методом тыка сразу что-нибудь находить... Раздел 4.7 начало:
"Кроме того, существует способ использовать не такой рубленный график, а его сглаженную[1] вариант, который строиться при помощи функции плотности. Важное свойство, которое стоит понимать про функцию плотности — что кривая, получаемая ядерной оценкой плотности, не зависит от величины коробки[2] гистограммы (хотя есть аргумент[3], который отвечает за степень “близости” функции плотности к гистограмме)."

[1] сглаженнЫЙ вариант, который строиТСЯ при помощи метода ядерной оценки функции плотности вероятности
[2] шага квантования(?)
[3] лучше сразу указать этот аргумент adjust и дать ниже визуальный пример, как он влияет на "степень изрезанности", хотя это есть в стандартной доке, можно тогда сослаться
Спасибо
источник

a

aGricolaMZ in R language and Statistical data analysis
lp
👍
[2] вариант "частота дискретизации" мне кажется наиболее корректным

...пахнет гугл транслейтом
Ну нет, этого я не делал. Да и гугл-транслейт не делает орфографических ошибок, а я, дисграфик, делаю
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
aGricolaMZ
Дорогие, курс по R в маге по DH в вышке медленно двигается к завершению. Сейчас он готов где-то лишь на 60%, но уже готовы занятия по работе с пакетами dplyr, ggplot, tidyr, со списками, строками, текстами, картами, временем, и скачиванием данных из интернета. Если у кого-то возникнет желание проглядеть первые 12 разделов и покомментировать —- я буду только рад. Если кому-то будет полезно — тоже буду рад.

Но самое главное, что там есть — это конечно задания.
выглядит очень монументально %)
боюсь, полноценный фидбек я сейчас не осилю :(

кажется, у тебя не везде ссылки внутренние настроены
вот, рандомно ткнул, и в разделе 6.1 неработающая ссылка @ref{list}

ты в rvest через css-селекторы работаешь и учишь? почему?
я больше xpath предпочитаю, мне кажется, его удобнее объяснять как дерево тегов разметки - мы на занятиях сначала свой простенький html  ваяем, потом его же парсим потом уже более сложные сайты собираем. я вот бычно по сайтам ресторанных агрегаторов хожу, типа menu.ru :)
источник

a

aGricolaMZ in R language and Statistical data analysis
Philipp Upravitelev
выглядит очень монументально %)
боюсь, полноценный фидбек я сейчас не осилю :(

кажется, у тебя не везде ссылки внутренние настроены
вот, рандомно ткнул, и в разделе 6.1 неработающая ссылка @ref{list}

ты в rvest через css-селекторы работаешь и учишь? почему?
я больше xpath предпочитаю, мне кажется, его удобнее объяснять как дерево тегов разметки - мы на занятиях сначала свой простенький html  ваяем, потом его же парсим потом уже более сложные сайты собираем. я вот бычно по сайтам ресторанных агрегаторов хожу, типа menu.ru :)
Спасибо, ссылки, действительно там в какой-то момент заглючили...

я как-то привык к css селекторам, так что что умею, тому и учу...
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
ага, понял
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
скажи, а что это за магистратура, на каком факультете?
источник

a

aGricolaMZ in R language and Statistical data analysis
Факультет гуманитарных наук
источник

a

aGricolaMZ in R language and Statistical data analysis
по-моему, внутри школы лингвистики
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
ок, спасибо
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Господа и дамы статистики, а кто-нибудь в реальном анализе использовал за последние полгода коэффициент Фехнера? Тут в видео советуют сначала просто смотреть облако точек, оценивая сонаправленность переменных, а потом быстренько вычислять коэффициент Фехнера, чтобы более строго оценить, стоит ли вообще искать корреляцию. Он очень простой, но ни разу не видел, чтобы его применяли позже древности.
источник

DN

Denis Naumov in R language and Statistical data analysis
Друзья вот такой график, мне кажется что сюда отлична подошла бы сигмоида для предсказания, и я погуглил и что-то и не нашел ничего, можете подсказать как в R использовать разные функции для предсказания, числовых значений
источник

V

Violet in R language and Statistical data analysis
Регрессия
источник

V

Violet in R language and Statistical data analysis
Про Фехнера вообще не слышала и не применяла, это кто такое советует?
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Violet
Про Фехнера вообще не слышала и не применяла, это кто такое советует?
"Математические и инструментальные методы машинного обучения"

Слушаю курс на Опенеду, пока еду готовлю.
источник