Телеграмм чат группы ds

2020 April 26

D

Darkhan in Data Science Kazakhstan (DS/ML kz)

А в плот аргумент scientific=F можно передать?

источник

11:17пожаловаться #1

RU

Rustam Uzb in Data Science Kazakhstan (DS/ML kz)

Stepan

Всем привет! Подскажите, пожалуйста. Вопрос про использование предобученных сетей, заморозку слоев и про обучение только части сети.

В задаче нужно находить точки на изображении. Использую resnet50 предобученную на ImageNet. Заменяю выход последнего слоя с 1000 классов на количество точек*2 (х и у координата)

import torchvision.models as models
...
model = models.resnet50(pretrained=True, )
model.fc = nn.Linear(model.fc.in_features, 2 * NUM_PTS, bias=True)

Для начала хотел попробовать обучить только последний fc слой

# freeze all layers
for param in model.parameters():
param.requires_grad = False

# train only head
model.fc.weight.requires_grad = True
model.fc.bias.requires_grad = True

Я рассчитывал, что обучение у такой сети будет гораздо быстрей, чем когда все слои разморожены. Но на мое удивление скорость осталась практически той же самой на эпоху 20 мин vs 17 минут

Вопрос. Правильно ли я заморозил слои? Разве сеть не должна обучаться быстрей, чем если бы все слои были разморожены?

грубо говоря, резнет_50 (или другая обученная умными людьми с большими компьютерами модель) состоит из 2 частей: 1. конволюшнл 2. классификатор. конволюшнл часть этой модели уже натренирована определять разные фичерсы на картинке ( углы, линии, и.т.д) , а классификатор уже по этим фичерсам уже находит объекты. учитывая что, любой объект который можно нарисовать на картинке состоит из углов, линий и прочих фичерсов, и смысла тренировать конволюшнл часть нет ( темболее это вычислительно дорого) так как всеравно мы получим эти фичерсы снова, достачно просто сделать собсввенный классификатор и добавить его к выходу conv части предварительно натренированной модели. Что я так понимаю и нужно сделать в Вашем случае. я хз, что за точка , допустим нужно найти на картинках шар для боулинга, делайте собственный датасет из картинок шаров и тренируйте только "последний слой" как Вы его называете. ...... насчет постепенного обучение методом поочередного подключения слоев, мне кажется так работать не будет потому что это математический не правильно. Обудение у сетей ведется за счет вычесления (частная производная) вклада в ошибку каждого нейрона в сети, тоесть, если опять грубо, один нейрон это одна фукнция, то сеть это матрешка этих функций. таким образом ( на основании правила дифиренцировании сложной функции) предыдущий слой модели оказывает влияние на велечину производной (влияние на ошибку) следующих слоев. таким образом каждый раз когда Вы активируете новый слой вы просто говорите вот вам еще один слой начинайте (еще более сложный) бакпроб занова

источник

11:19пожаловаться #2

D

Duman in Data Science Kazakhstan (DS/ML kz)

Darkhan

А в плот аргумент scientific=F можно передать?

ни plot, ни text не принимает их, выдает WarningMessage

источник

11:19пожаловаться #3

D

Darkhan in Data Science Kazakhstan (DS/ML kz)

Duman

ни plot, ни text не принимает их, выдает WarningMessage

A plot digits принимает?

источник

11:24пожаловаться #4

D

Duman in Data Science Kazakhstan (DS/ML kz)

plot тоже не принимает digits.

Я сейчас попробовал options(digits=8), и у меня числа под каждым variable показывает нормально, но верхние значения decision split-a так и остались в scientific notation

источник

11:26пожаловаться #5

D

Darkhan in Data Science Kazakhstan (DS/ML kz)

Duman

plot тоже не принимает digits.

Я сейчас попробовал options(digits=8), и у меня числа под каждым variable показывает нормально, но верхние значения decision split-a так и остались в scientific notation

Если это не rpart.plot, то мб стоит его попробовать
Попробовать диджитс отрицательный
А так хз что-то

источник

11:30пожаловаться #6

D

Duman in Data Science Kazakhstan (DS/ML kz)

о, сработало! Все это время использовал просто plot вместо rpart.plot🤦‍♂️

Рахмет!

источник

11:35пожаловаться #7

MA

Miras Amir in Data Science Kazakhstan (DS/ML kz)

Rustam Uzb

грубо говоря, резнет_50 (или другая обученная умными людьми с большими компьютерами модель) состоит из 2 частей: 1. конволюшнл 2. классификатор. конволюшнл часть этой модели уже натренирована определять разные фичерсы на картинке ( углы, линии, и.т.д) , а классификатор уже по этим фичерсам уже находит объекты. учитывая что, любой объект который можно нарисовать на картинке состоит из углов, линий и прочих фичерсов, и смысла тренировать конволюшнл часть нет ( темболее это вычислительно дорого) так как всеравно мы получим эти фичерсы снова, достачно просто сделать собсввенный классификатор и добавить его к выходу conv части предварительно натренированной модели. Что я так понимаю и нужно сделать в Вашем случае. я хз, что за точка , допустим нужно найти на картинках шар для боулинга, делайте собственный датасет из картинок шаров и тренируйте только "последний слой" как Вы его называете. ...... насчет постепенного обучение методом поочередного подключения слоев, мне кажется так работать не будет потому что это математический не правильно. Обудение у сетей ведется за счет вычесления (частная производная) вклада в ошибку каждого нейрона в сети, тоесть, если опять грубо, один нейрон это одна фукнция, то сеть это матрешка этих функций. таким образом ( на основании правила дифиренцировании сложной функции) предыдущий слой модели оказывает влияние на велечину производной (влияние на ошибку) следующих слоев. таким образом каждый раз когда Вы активируете новый слой вы просто говорите вот вам еще один слой начинайте (еще более сложный) бакпроб занова

Обучение всех слоев на практике почти всегда лучше чем обучение последнего fc слоя (может быть хуже, например, если очень мало данных).
Поэтому смысл есть всегда.

источник

11:41пожаловаться #8

RU

Rustam Uzb in Data Science Kazakhstan (DS/ML kz)

Miras Amir

Обучение всех слоев на практике почти всегда лучше чем обучение последнего fc слоя (может быть хуже, например, если очень мало данных).
Поэтому смысл есть всегда.

Да но, всех сразу а не по кусочкам

источник

11:42пожаловаться #9

MA

Miras Amir in Data Science Kazakhstan (DS/ML kz)

Rustam Uzb

Да но, всех сразу а не по кусочкам

По кусочкам тоже учат, например ulmfit так учили https://arxiv.org/abs/1801.06146.

источник

11:44пожаловаться #10

S

Sneddy in Data Science Kazakhstan (DS/ML kz)

https://www.youtube.com/watch?v=f7Dojf1j7r8

YouTube

ЧГК: Что? Где? Когда? математиков на самоизоляции | Fless #matholation

Ведущие русскоязычные математики собрались в одной видеоконференции, чтобы испытать друг друга и "кокнуть" ваш мозг на самоизоляции На фото (по часовой стрел...

источник

12:27пожаловаться #11

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)

Не по теме чата

источник

17:12пожаловаться #12

Е

Елес in Data Science Kazakhstan (DS/ML kz)

да

источник

17:25пожаловаться #13

IS

Iska Shaikh in Data Science Kazakhstan (DS/ML kz)

Всем добрый вечер, как вычислить метрики, например у меня есть модель которая распознает кошек и собак, и в одной картинке может быть собака и кот

источник

21:44пожаловаться #14

Y

Yerassyl in Data Science Kazakhstan (DS/ML kz)

Iska Shaikh

Всем добрый вечер, как вычислить метрики, например у меня есть модель которая распознает кошек и собак, и в одной картинке может быть собака и кот

Multi label classification

источник

21:46пожаловаться #15

IS

Iska Shaikh in Data Science Kazakhstan (DS/ML kz)

😊спасибо

источник

21:47пожаловаться #16

Y

Yerassyl in Data Science Kazakhstan (DS/ML kz)

Iska Shaikh

😊спасибо

https://en.m.wikipedia.org/wiki/Multi-label_classification#Statistics_and_evaluation_metrics
Тут есть секция про метрики

Wikipedia

Multi-label classification

In machine learning, multi-label classification and the strongly related problem of multi-output classification are variants of the classification problem where multiple labels may be assigned to each instance. Multi-label classification is a generalization of multiclass classification, which is the single-label problem of categorizing instances into precisely one of more than two classes; in the multi-label problem there is no constraint on how many of the classes the instance can be assigned to.

источник

21:48пожаловаться #17

IS

Iska Shaikh in Data Science Kazakhstan (DS/ML kz)

оказывается не под мою проблему

источник

22:31пожаловаться #18

S

Sunbeam✨ in Data Science Kazakhstan (DS/ML kz)

всем привет, вы не знаете, может где-то сохраняли или читали, есть ли опен-сорсный алгоритм, который определяет присутствует ли буллинг в тексте или нет? нужен именно готовый код с параметрами)

источник

23:01пожаловаться #19

Z

Z in Data Science Kazakhstan (DS/ML kz)

Sunbeam✨

всем привет, вы не знаете, может где-то сохраняли или читали, есть ли опен-сорсный алгоритм, который определяет присутствует ли буллинг в тексте или нет? нужен именно готовый код с параметрами)

https://www.kaggle.com/c/jigsaw-unintended-bias-in-toxicity-classification

Kaggle

Jigsaw Unintended Bias in Toxicity Classification

Detect toxicity across a diverse range of conversations

источник

23:35пожаловаться #20