Size: a a a

Machine learning

2021 June 19

АЗ

Антон Зубехин... in Machine learning
Ну давайте простейшую мотивацию для метода крамера хотя бы вспомним
источник

RG

Ruslan Ganeev in Machine learning
О дороу
источник

АЗ

Антон Зубехин... in Machine learning
Дратути
источник

I

Ilya in Machine learning
во многих гайдах по загрузке кастомного датасета в торч вижу, что непосредственно с диска картинка читается в getitem

по логике ведь это же очень сильно будет тормозить процесс обучения, или тут есть какой-то неочевидный скрытый смысл? логичнее же все сразу запихнуть в память в init, а в getitem просто возвращать элемент листа
источник

DP

Dmitry Penzar in Machine learning
допустим, датасет весит 200 гб. А оперативки у вас 100гб. Тогда ваш подход в лучшем случае замедлит всю работу  в разы, в худшем - просто упадет.
источник

DP

Dmitry Penzar in Machine learning
Тормоза же подхода с подгрузкой частично убиваются тем, что можно больше worker поставить
источник

I

Ilya in Machine learning
В таком случае я бы просто разбил датасет на n кусков и по очереди бы их целиком грузил в память
источник

I

Ilya in Machine learning
Ну хотя если датасет даже после трансформаций не влазит в память, то по идее разницы по времени нет
источник

DP

Dmitry Penzar in Machine learning
? в одном случае вам в памяти надо хранить условно два батча - один, который сейчас через нейросетку несется, а второй - который готовится быть подгруженным. В другом - кучу данных
источник

I

Ilya in Machine learning
Да, но просто если данные уже лежат в оперативке, то после очередной эпохи не надо будет ждать, пока они прочитаются
источник

I

Ilya in Machine learning
Или ты имеешь в виду, что можно следующий батч грузить, пока очередной проходит через сетку?
источник

DP

Dmitry Penzar in Machine learning
Да
источник

I

Ilya in Machine learning
А оно по дефолту так реализовано в торче?
источник

I

Ilya in Machine learning
Что условно пока гпу занято просчетом текущего батча, процессор занят подгрузкой следующего
источник

DP

Dmitry Penzar in Machine learning
по коду и хелпу похоже на то - https://github.com/pytorch/pytorch/blob/master/torch/utils/data/dataloader.py
источник

♠️ in Machine learning
Это файл содержит 4 разреженных матриц. Но я никак не смог считать эти матрицы. В чем может быть проблема?(((
источник

♠️ in Machine learning
источник
2021 June 20

BI

Bekezhan Issabek in Machine learning
Всем привет! У меня есть пдф файл с таблицей. Я написал скрипт который парсит(camelot) его колонку(выше пример). Но один документ не получается спарсить, выходит вот такая вот ерунда:
источник

BI

Bekezhan Issabek in Machine learning
Переслано от Bekezhan Issabek
источник

BI

Bekezhan Issabek in Machine learning
Может быть, кто то уже сталкивался с такой проблемой?
источник