Телеграмм чат группы datasciencecourse страница 4734

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Machine learning

7690 membersпожаловаться на группу

2021 January 30

SS

Sergey Salnikov in Machine learning

SGDClassifier, X: 50K x 1K, y: ~100 classes

источник

01:50пожаловаться #1

DP

Dmitry Penzar in Machine learning

Дисперсия которая мерится зависит от дисперсии от обучения классификатора и от размера датасета, на котором оценивается его качество.

Мне кажется у такой простой модели дисперсия весов очень мала, а увеличивая размер обучения вы сокращаете автоматом размер теста, что сказывается намного сильнее, чем слабенькое уменьшение дисперсии весов

Или вы это и говорили, а я пропустил?

источник

01:58пожаловаться #2

SS

Sergey Salnikov in Machine learning

проблема была такая: есть датасет, нужно тестить на нём модели, для этого нужно выбрать схему кросс-валидации с минимальной дисперсией (чтобы была больше разрешающая способность схемы). я эмпирически использую repeated Nx2 (обычно 5x2), это потом я прочитал, что это вполне себе феншуйно. но когда экспериментировал с монте-карловской схемой, заметил, что дисперсию cv можно уменьшить, если уменьшать train-долю от всего датасета. так-то понятно, что скор будет изменяться как от размера tr, так и от размера va, но тут стоит конкретная задача - какую cv выбрать для оценки моделей

источник

02:03пожаловаться #3

DP

Dmitry Penzar in Machine learning

вопрос - буудет ли такое наблюдаться для какого-нибудь бустинга

источник

02:03пожаловаться #4

SS

Sergey Salnikov in Machine learning

это важно? могу прогнать

источник

02:04пожаловаться #5

DP

Dmitry Penzar in Machine learning

ну просто интересно, если не сложно

источник

02:05пожаловаться #6

DP

Danilo Podlesniy-Sub... in Machine learning

Ребята, а никто не думал как можно закрыть ленту рекоммендаций ютуба?

источник

02:09пожаловаться #7

SS

Sergey Salnikov in Machine learning

ну просто интересно, если не сложно

источник

03:47пожаловаться #8

SS

Sergey Salnikov in Machine learning

минимальная дисперсия в районе .5

источник

03:47пожаловаться #9

DP

Dmitry Penzar in Machine learning

прикольно, спасибо)

источник

04:01пожаловаться #10

ч

чеканая-монета... in Machine learning

Новая библиотека превосходит Pandas по производительности

Pandas возникла в 2008 году и на сегодняшний день является крайне популярной, если речь идёт о Data Science. Но ничто не вечно под луной и вот, появилась новая библиотека pypolars, которая уже сейчас может конкурировать с Pandas как минимум в плане производительности.

В этой статье провели сравнительные тесты скорости отработки одних и тех же действий с помощью этих двух библиотек и результаты заставляют задуматься:

https://tprg.ru/qvjG

#datascience #pandas

источник

10:16пожаловаться #11

АК

Алексей Кравчук... in Machine learning

И для баланса курс статистика для медсестёр о и стэнфорда

Можете дать ссылку на курс?

источник

12:44пожаловаться #12

i

igor in Machine learning

https://stanford.cloud-cme.com/course/courseoverview?EID=24141&P=3000&CaseID=6

Statistics for Medical Professionals - Stanford Center for Continuing Medical Education - Continuing Education (CE)

Stanford Center for Continuing Medical Education, Statistics for Medical Professionals, 1/18/2017 12:00:00 AM - 4/1/2020 11:59:00 PM, <p>Internet Enduring Material Sponsored by the Stanford University School of Medicine. Presented by the Departments of Medical Education and Health Research at Stanford University School of Medicine.</p><p><span style="color: rgb(51, 51, 51); font-family: "Source Sans Pro", sans-serif; font-size: 16px; font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: 2; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255); text-decoration-style: initial; text-decoration-color: initial; display: inline !important; float: none;">This course seeks to fulfill the need in the clinical community to better understand medical statistics as it pertains to practicing evidence based medicine, communicating…

источник

13:31пожаловаться #13

АК

Алексей Кравчук... in Machine learning

https://stanford.cloud-cme.com/course/courseoverview?EID=24141&P=3000&CaseID=6

Statistics for Medical Professionals - Stanford Center for Continuing Medical Education - Continuing Education (CE)

Stanford Center for Continuing Medical Education, Statistics for Medical Professionals, 1/18/2017 12:00:00 AM - 4/1/2020 11:59:00 PM, <p>Internet Enduring Material Sponsored by the Stanford University School of Medicine. Presented by the Departments of Medical Education and Health Research at Stanford University School of Medicine.</p><p><span style="color: rgb(51, 51, 51); font-family: "Source Sans Pro", sans-serif; font-size: 16px; font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: 2; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255); text-decoration-style: initial; text-decoration-color: initial; display: inline !important; float: none;">This course seeks to fulfill the need in the clinical community to better understand medical statistics as it pertains to practicing evidence based medicine, communicating…

Спасибо!!!

источник

13:35пожаловаться #14

DP

Dmitry Penzar in Machine learning

Кстати, просьба дебильная, но вдруг. Есть у кого-то датасет по задаче регрессии/классификации, чтобы на нем стекинг показывал преимущество по сравнению с правильно затюненными бустингами?
Просьба дебильная, ибо в датасете не должно быть слишком много объектов. Условно 50k - потолок

источник

13:37пожаловаться #15

DP

Dmitry Penzar in Machine learning

В примерах в инете в стэкинг херачат моднли с дефолтными параметрами и понятно, откуда там повышение качества. А мне хочется студентам показать нормпльную ситуацию

источник

13:38пожаловаться #16

K

K-S in Machine learning

Кстати, просьба дебильная, но вдруг. Есть у кого-то датасет по задаче регрессии/классификации, чтобы на нем стекинг показывал преимущество по сравнению с правильно затюненными бустингами?
Просьба дебильная, ибо в датасете не должно быть слишком много объектов. Условно 50k - потолок

так просто найди любой датасет с данным ограничением на кол-во объектов. Стек в 90% случаев докинет

источник

13:43пожаловаться #17

K

K-S in Machine learning

и почему с дефолтными параметрами? Вполне себе вроде их подбирают. Либо оптимайзерами какими-то, либо руками

источник

13:44пожаловаться #18

DP

Dmitry Penzar in Machine learning

так просто найди любой датасет с данным ограничением на кол-во объектов. Стек в 90% случаев докинет

Ну вот пока не нашел хорошего. Потому и спрашиваю, может у кого есть)

источник

13:44пожаловаться #19

DP

Dmitry Penzar in Machine learning

и почему с дефолтными параметрами? Вполне себе вроде их подбирают. Либо оптимайзерами какими-то, либо руками

Я про инет и туториалы в нем

источник

13:44пожаловаться #20