Size: a a a

Data Science Chat

2021 September 07

AK

Alex K in Data Science Chat
Ещё был в чем минусы p value и какие альтернативы
источник

P

Pavel in Data Science Chat
иногда можно оценить marginal impact, как например в лин.регрессии
источник

P

Pavel in Data Science Chat
на степике есть курс от института биоинформатики. Он очень годный, рекомендую настойчиво
источник

A

Andrey in Data Science Chat
линейная модель - пожалуй, единственный класс моделей, которые интерпретируемы сами по себе (но и то лишь при соблюдении предпосылок, на которые  в мышином обучении обычно забивают). Ну одиночные деревья еще, но кто их юзает?
источник

P

Pavel in Data Science Chat
в банках для кредитного скоринга и т.п. раньше любили решающие деревья (м.б. и леса тоже) т.к. тоже интерпретироуемы
источник

АД

Антон Дорохов... in Data Science Chat
Так и ЦБ их очень любит, насколько я помню они дают рекомендации банкам на предмет какие можно использовать
источник

AK

Alex K in Data Science Chat
карпов который?
https://stepik.org/course/76/syllabus
источник

P

Pavel in Data Science Chat
да, карпов
источник

AK

Alex K in Data Science Chat
я вроде смотрел, может про альтернативы p value пропустил. Пересмотрю
источник

ГМ

Григорий Митраков... in Data Science Chat
Много полезного в курсе Карпова
источник

AK

Anatoly Kostyuk in Data Science Chat
Угусь
источник

М

Михаил in Data Science Chat
Всем привет, имеется список(к примеру 300) MRI изображений в dicom формате, при формировании 3d изображения из списка этих изображений получается изображение размером 512х512х300, боковой срез очень непропорциональный, вопрос: как восстановить пропорции у такого изображения чтоб потом получить нормальный, пропорциональный срез сбоку?
источник

A

Andrey in Data Science Chat
тебе нужно определиться с переводом вокселей в миллиметры (воксели обычно не кубические)
источник

A

Andrey in Data Science Chat
источник

AK

Anatoly Kostyuk in Data Science Chat
Про это целые тома написаны
источник

AK

Anatoly Kostyuk in Data Science Chat
Минусы пи-вэлью
- Если выборка большая обнаруженный эффект может быть тривиальным (обусловлен несистематическими или не интересующими нас факторами) поскольку нулевая гипотеза всегда (практически всегда?) строго говоря не верна (разница между двумя группами никогда в точности не равна нулю))
-Используя множественные сравнения можно получить сколь угодно низкую пи-шку
-Подсматривая в данные и останавливая их набор как только они перемахнут через заветный порог можно получить сколь угодно низкую пишку.
Первое лечится вглядыванием в размер эффекта, что тоже не без проблем поскольку мы часто не знаем какой размер эффекта нас интересует скажем в социальных науках сложно получить корреляцию выше 0.6 а физики на такие корреляции плюются. Второе и третье специальными поправками на множественное сравнение и sequential testing https://www.coursera.org/lecture/statistical-inferences/type-1-error-control-ynBVf достаточно подробно разобраны в этой лекции.
источник

A

An in Data Science Chat
гланц медико биологическая статистика
источник

МК

Максим Коротченков... in Data Science Chat
Ребят, привет
у меня есть боевая задачка нужно по данным камер сделать предсказание скорости автомобиля. дело в том, что камеры измеряют скорость не всегда корректно, поэтому обучаться на этом векторе ответов камер я не могу ( нет той скорости, которой можно доверять, по факту ее нужно найти, мб, расчетным методом, примерно как указал ниже).  может быть будут мысли как можно сдвинуть задачку с мертвой точки? были попытки рассчитать скорость по геодатчикам такси ( измерить расстояние между двумя точками и поделить на время, но частота измерения - раз в 10 секунд- это много, да и как понять, что датчик не наврал? Эталонной скорости нет)
была идея также измерить поток автомомбилей ( в плотном потоке скорость не должна отличаться от потока, если отличается, то камера скорее всего ошибается). буду рад любым гипотезам!
источник

A

Andrey in Data Science Chat
строго говоря, это все не недостатки подхода, основанного на р-значениях, а сугубо человеческий фактор (ошибки в применении метода)
источник

AK

Anatoly Kostyuk in Data Science Chat
Да я хотел взять фразу минусы в кавычки
источник