Size: a a a

Data Science Kazakhstan (DS/ML kz)

2020 April 17

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)
нейронка на одной эпохе - это реальная вещь, а на 500 оверфит
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Minhyun Kim
нейронка на одной эпохе - это реальная вещь, а на 500 оверфит
там не 500, достаточно быстро сошлась)
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Petr Ivanov
нейронка над 100 картинками - это шляпа. А над 100 000 - реальная вещь. Раз они не хотят мне говорит размер датасета, то пусть вам скажут, а вы его сами по шкале расположите.
Я могу сказать, что в Казахстане уже намного больше, чем 100 снимков с ковид
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Petr Ivanov
вот пример работы на выборке из 110 000 снимков  https://arxiv.org/pdf/1808.10858.pdf
источник

I

Iv in Data Science Kazakhstan (DS/ML kz)
Я ж писал, дядя не читает.
источник

I

Iv in Data Science Kazakhstan (DS/ML kz)
Aykhan
Хорошо)
@Aykhan_txt вы удовлетворены размером датасета?😂😂😂
источник

I

Iv in Data Science Kazakhstan (DS/ML kz)
Хотя есть мнение что не в размере дело
источник

A

Aykhan in Data Science Kazakhstan (DS/ML kz)
Iv
@Aykhan_txt вы удовлетворены размером датасета?😂😂😂
Да
источник

PI

Petr Ivanov in Data Science Kazakhstan (DS/ML kz)
Iv
Я ж писал, дядя не читает.
отличный пример. 200 000 снимков от 65 000 пациентов, соревнуется весь мир, но .99 никто не достиг. Дураки наверное.
источник

I

Iv in Data Science Kazakhstan (DS/ML kz)
Petr Ivanov
отличный пример. 200 000 снимков от 65 000 пациентов, соревнуется весь мир, но .99 никто не достиг. Дураки наверное.
Не, дядь. Просто есть разделимые данные, а есть плохо разделимые. Это не свойство алгоритмов. Это свойство данных.
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Petr Ivanov
отличный пример. 200 000 снимков от 65 000 пациентов, соревнуется весь мир, но .99 никто не достиг. Дураки наверное.
5 классов, сложно различимые часто.  разметка кривая и много другого. И мы там к слову 16 с 0.925 и 80 с 0.902
источник

I

Iv in Data Science Kazakhstan (DS/ML kz)
Например врачи могут отличить пнему от рака в 60% случаев. А пневму от здорового - в 100%.
источник

PI

Petr Ivanov in Data Science Kazakhstan (DS/ML kz)
Результаты хорошие, но между .99 и .925 - пропасть, которая объясняется только оверфитом на маленькой выборке. Возможно конечно, что covid настолько другой, что там и ворона отделить сможет, но тогда вопрос в значимости проекта.
источник

I

Iv in Data Science Kazakhstan (DS/ML kz)
действительно, желаем вам лечиться у тех ворон
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Petr Ivanov
Результаты хорошие, но между .99 и .925 - пропасть, которая объясняется только оверфитом на маленькой выборке. Возможно конечно, что covid настолько другой, что там и ворона отделить сможет, но тогда вопрос в значимости проекта.
В классике голуби и дрозофилы)
источник

I

Iv in Data Science Kazakhstan (DS/ML kz)
где там мой пост?
источник

PI

Petr Ivanov in Data Science Kazakhstan (DS/ML kz)
Renat Alimbekov
В классике голуби и дрозофилы)
возможно. помню птичек мучали.
источник

I

Iv in Data Science Kazakhstan (DS/ML kz)
По поводу машобчика для распознавания. Это 100% лоховодство и развод лохов на бабки. Без лоха жизнь плоха. Суть в том, что распознать рак на снимках может любой кабыздох с помойки https://well.blogs.nytimes.com/2014/09/10/training-dogs-to-sniff-out-cancer/ любой голубь оттуда же https://www.nytimes.com/2015/11/25/science/pigeons-detect-breast-cancer-tumors.html?_r=0 а сдетектить рак по материалу с биопсии может помойная дрозофила https://www.nature.com/articles/srep03576?WT.ec_id=SREP-20140107 все эти технологии стоят ровно 0, т.к. используют совершенно дубовые и простые как 3 копейки методы оперантного научения, разработанные Скиннером еще в 30х годах прошлого века. Для того, чтобы обучить голубя детектить рак по снимкам лучше любого врача-коновала, нужно затратить 1 пакет семок для гопников. Никаких тыщбаксов на покупку у (((Сунь Хуй Чая))) из нвидии видеокарт, никаких 300кк/сек зарплаты дегенерату за "импорт торч ас нн". Никаких дорогущих реактивов, микроскопов и опять же, зарплаты коновалу. Понимаете, в чем наебка, не? Любители заработать на лохах наживают на них миллиарды денег, впаривая свою хуйню в качестве решения остросоциальных проблем, тогда как на самом деле какие-то из этих проблем решаются на коленке говном, палками и семками.
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Petr Ivanov
Результаты хорошие, но между .99 и .925 - пропасть, которая объясняется только оверфитом на маленькой выборке. Возможно конечно, что covid настолько другой, что там и ворона отделить сможет, но тогда вопрос в значимости проекта.
Ценю ваше мнение. Что в вашем понимание маленькая, средняя и достаточная выборка?
источник

PI

Petr Ivanov in Data Science Kazakhstan (DS/ML kz)
Iv
По поводу машобчика для распознавания. Это 100% лоховодство и развод лохов на бабки. Без лоха жизнь плоха. Суть в том, что распознать рак на снимках может любой кабыздох с помойки https://well.blogs.nytimes.com/2014/09/10/training-dogs-to-sniff-out-cancer/ любой голубь оттуда же https://www.nytimes.com/2015/11/25/science/pigeons-detect-breast-cancer-tumors.html?_r=0 а сдетектить рак по материалу с биопсии может помойная дрозофила https://www.nature.com/articles/srep03576?WT.ec_id=SREP-20140107 все эти технологии стоят ровно 0, т.к. используют совершенно дубовые и простые как 3 копейки методы оперантного научения, разработанные Скиннером еще в 30х годах прошлого века. Для того, чтобы обучить голубя детектить рак по снимкам лучше любого врача-коновала, нужно затратить 1 пакет семок для гопников. Никаких тыщбаксов на покупку у (((Сунь Хуй Чая))) из нвидии видеокарт, никаких 300кк/сек зарплаты дегенерату за "импорт торч ас нн". Никаких дорогущих реактивов, микроскопов и опять же, зарплаты коновалу. Понимаете, в чем наебка, не? Любители заработать на лохах наживают на них миллиарды денег, впаривая свою хуйню в качестве решения остросоциальных проблем, тогда как на самом деле какие-то из этих проблем решаются на коленке говном, палками и семками.
проблема с животными с масштабируемостью и с локальностью.
источник