Телеграмм чат группы ds

такая проблема: есть датасет мед картинок, задача - простая классификация, машина - 4х2080. Запускаю простой effnet-b1 показывает через tqdm, что эпоху будет 20 часов тренить. Объем датасета примерно 50к картинок в дикоме. Комп уже ребутить пытался, все процессы отключал, код распараллелил, все равно 20 часов на эпоху. Может ли формат дикома быть причиной или что то еще?

На каггле была такая проблема, что дикомы ооочень долго считывались. 3 часа если дикомы и 10 минут если джпеги на эпоху. Но те кто локально запускал было норм, что так что так

источник

19:35пожаловаться #8

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)

Aykhan

В hemmorage было норм с дикомами всё

источник

19:36пожаловаться #9

Aykhan in Data Science Kazakhstan (DS/ML kz)

Renat Alimbekov

В hemmorage было норм с дикомами всё

Ну извините меня, там кт 512 на 512. Я про кожу говорю. Там снимки большие в оригинальном датасете. Ну не знаю, может поможет может нет. Так на всякий случай сказал.

источник

19:37пожаловаться #10

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)

Miras Amir

volatile gpu-util имею в виду

источник

19:39пожаловаться #11

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)

Minhyun Kim

лол что

источник

19:40пожаловаться #12

Miras Amir in Data Science Kazakhstan (DS/ML kz)

Renat Alimbekov

лол что

наверное не успел еще батчи приготовить

источник

19:41пожаловаться #13

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)

Miras Amir

наверное не успел еще батчи приготовить

уже 2 итерации прошло

источник

19:41пожаловаться #14

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)

я помню была такая трабла на датапарарелел когда оюучение на батче было быстрее чем загузка батча

источник

19:42пожаловаться #15

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)

@myxik а размер картинок какой? что за тип исследования (КТ, рентген)?

источник

19:43пожаловаться #16

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)

Renat Alimbekov

я помню была такая трабла на датапарарелел когда оюучение на батче было быстрее чем загузка батча

только недавно тренил сегментацию на той же машине, все нормас было

источник

19:43пожаловаться #17

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)

Renat Alimbekov

@myxik а размер картинок какой? что за тип исследования (КТ, рентген)?

везде по разному по размеру

источник

19:43пожаловаться #18

Miras Amir in Data Science Kazakhstan (DS/ML kz)

Minhyun Kim

Я к тому что если утилизация норм (>90% почти постоянно), то все ок. Если нет, то скорее батчи не успевают готовиться и нужно через profiler искать боттелнеки (например, считывание картинок или какие то ауги) и ускорят

источник

19:44пожаловаться #19

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)

ну трансформ ж делаешь

источник

19:45пожаловаться #20