Size: a a a

Data Science Kazakhstan (DS/ML kz)

2020 July 23

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)
Miras Amir
какая утилизация GPU во время обучения?
около 3 gb на каждую
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Чет мало капец
источник

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)
Renat Alimbekov
Чет мало капец
вооот
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
А сайз какой?
источник

MA

Miras Amir in Data Science Kazakhstan (DS/ML kz)
Minhyun Kim
около 3 gb на каждую
volatile gpu-util имею в виду
источник

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)
сорри я нубас, сейчас напишу
источник

MA

Miras Amir in Data Science Kazakhstan (DS/ML kz)
Renat Alimbekov
Чет мало капец
+
источник

A

Aykhan in Data Science Kazakhstan (DS/ML kz)
Minhyun Kim
такая проблема: есть датасет мед картинок, задача - простая классификация, машина - 4х2080. Запускаю простой effnet-b1 показывает через tqdm, что эпоху будет 20 часов тренить. Объем датасета примерно 50к картинок в дикоме. Комп уже ребутить пытался, все процессы отключал, код распараллелил, все равно 20 часов на эпоху. Может ли формат дикома быть причиной или что то еще?
На каггле была такая проблема, что дикомы ооочень долго считывались. 3 часа если дикомы и 10 минут если джпеги на эпоху. Но те кто локально запускал было норм, что так что так
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Aykhan
На каггле была такая проблема, что дикомы ооочень долго считывались. 3 часа если дикомы и 10 минут если джпеги на эпоху. Но те кто локально запускал было норм, что так что так
В hemmorage было норм с дикомами всё
источник

A

Aykhan in Data Science Kazakhstan (DS/ML kz)
Renat Alimbekov
В hemmorage было норм с дикомами всё
Ну извините меня, там кт 512 на 512. Я про кожу говорю. Там снимки большие в оригинальном датасете. Ну не знаю, может поможет может нет. Так на всякий случай сказал.
источник

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)
Miras Amir
volatile gpu-util имею в виду
0
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
лол что
источник

MA

Miras Amir in Data Science Kazakhstan (DS/ML kz)
Renat Alimbekov
лол что
наверное не успел еще батчи приготовить
источник

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)
Miras Amir
наверное не успел еще батчи приготовить
уже 2 итерации прошло
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
я помню была такая трабла на датапарарелел когда оюучение на батче было быстрее чем загузка батча
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
@myxik а размер картинок какой? что за тип исследования (КТ, рентген)?
источник

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)
Renat Alimbekov
я помню была такая трабла на датапарарелел когда оюучение на батче было быстрее чем загузка батча
только недавно тренил сегментацию на той же машине, все нормас было
источник

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)
Renat Alimbekov
@myxik а размер картинок какой? что за тип исследования (КТ, рентген)?
везде по разному по размеру
источник

MA

Miras Amir in Data Science Kazakhstan (DS/ML kz)
Я к тому что если утилизация норм (>90% почти постоянно), то все ок. Если нет, то скорее батчи не успевают готовиться и нужно через profiler искать боттелнеки (например, считывание картинок или какие то ауги) и ускорят
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
ну трансформ ж делаешь
источник