Телеграмм чат группы ds_kz страница 3003

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Science Kazakhstan (DS/ML kz)

2546 membersпожаловаться на группу

2020 June 22

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)

Есть проблема: Торчевский датасет из датафрейма, в котором прописан путь к изображению, достаю изображение через getitem, iloc и получаю проблемы, когда пытаюсь заслайсить датасет, как лечить?

источник

12:43пожаловаться #1

AM

Assylbek Malibayev in Data Science Kazakhstan (DS/ML kz)

Есть проблема: Торчевский датасет из датафрейма, в котором прописан путь к изображению, достаю изображение через getitem, iloc и получаю проблемы, когда пытаюсь заслайсить датасет, как лечить?

что пишет?

источник

12:44пожаловаться #2

KA

Kamalkhan Artykbayev in Data Science Kazakhstan (DS/ML kz)

Есть проблема: Торчевский датасет из датафрейма, в котором прописан путь к изображению, достаю изображение через getitem, iloc и получаю проблемы, когда пытаюсь заслайсить датасет, как лечить?

заслайсить имеешь ввиду сделать разделение на train/val/test?

источник

12:46пожаловаться #3

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)

Kamalkhan Artykbayev

заслайсить имеешь ввиду сделать разделение на train/val/test?

ага

источник

12:46пожаловаться #4

KA

Kamalkhan Artykbayev in Data Science Kazakhstan (DS/ML kz)

а какую ты функцию выбираешь для этого?

источник

12:46пожаловаться #5

KA

Kamalkhan Artykbayev in Data Science Kazakhstan (DS/ML kz)

там кажется есть специальная функция которая может рандомно распределить, затем все в data loader.

источник

12:46пожаловаться #6

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)

Kamalkhan Artykbayev

а какую ты функцию выбираешь для этого?

train_test_split, но пытался и просто через [:int(len*0.7)]

источник

12:47пожаловаться #7

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)

Assylbek Malibayev

что пишет?

считает, что я Series передаю в функцию открытия файла

источник

12:47пожаловаться #8

KA

Kamalkhan Artykbayev in Data Science Kazakhstan (DS/ML kz)

https://pytorch.org/docs/stable/data.html#torch.utils.data.random_split

источник

12:48пожаловаться #9

KA

Kamalkhan Artykbayev in Data Science Kazakhstan (DS/ML kz)

через эту функцию не пытался?

источник

12:48пожаловаться #10

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)

Kamalkhan Artykbayev

через эту функцию не пытался?

не пытался, попробую

источник

12:50пожаловаться #11

KA

Kamalkhan Artykbayev in Data Science Kazakhstan (DS/ML kz)

import torch
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
from torch.utils.data.sampler import SubsetRandomSampler

def prepare_samplers(set, val_size,test_size, shuffle = True):
    dataset_size = len(set)
    indices = list(range(dataset_size))
    split_ts = int(np.floor(test_size *  dataset_size))
    split_val = int(np.floor(split_ts+ val_size * (dataset_size)))
    if shuffle:
        np.random.shuffle(indices)

    test_indices, val_indices, train_indices = indices[:split_ts], indices[split_ts:split_val], indices[split_val:]
    return SubsetRandomSampler(train_indices), SubsetRandomSampler(val_indices), SubsetRandomSampler(test_indices)
input_size = 28
test_size = 0.2
val_size = 0.1

dataset = SampleDataset(path, input_size)
tr_sampler, val_sampler, ts_sampler = prepare_samplers(dataset, val_size, test_size, shuffle=False)

test_loader = DataLoader(dataset = dataset, batch_size=batch_size, sampler=ts_sampler)
val_loader = DataLoader(dataset = dataset, batch_size = batch_size, sampler=val_sampler)
train_loader = DataLoader(dataset=dataset, batch_size = batch_size, sampler=tr_sampler)

источник

12:50пожаловаться #12

KA

Kamalkhan Artykbayev in Data Science Kazakhstan (DS/ML kz)

вот тут полностью код чтобы поделить на train test split

источник

12:51пожаловаться #13

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)

спасибо

источник

12:51пожаловаться #14

KA

Kamalkhan Artykbayev in Data Science Kazakhstan (DS/ML kz)

и при запуске будет всегда рандомно вытаскивать)

источник

12:51пожаловаться #15

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)

а вообще, имеет смысл не сразу все картинки в память грузить, а вытаскивать так через getitem?

источник

12:51пожаловаться #16

KA

Kamalkhan Artykbayev in Data Science Kazakhstan (DS/ML kz)

можно кажись еще прикрутить class balancing - но не делал)

источник

12:51пожаловаться #17

KA

Kamalkhan Artykbayev in Data Science Kazakhstan (DS/ML kz)

а вообще, имеет смысл не сразу все картинки в память грузить, а вытаскивать так через getitem?

имеешь ввиду не вбивать через data loader, а через цикл прогонять и вытаскивать через get item?

источник

12:52пожаловаться #18

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)

Kamalkhan Artykbayev

имеешь ввиду не вбивать через data loader, а через цикл прогонять и вытаскивать через get item?

нее, просто некоторые в датасетах прописывают в конструкторе загрузку в память картинок через луп, а некоторые в конструкторе только датафрейм забирают, а потом через гетайтем картинки закидывают

источник

12:53пожаловаться #19

KA

Kamalkhan Artykbayev in Data Science Kazakhstan (DS/ML kz)

нее, просто некоторые в датасетах прописывают в конструкторе загрузку в память картинок через луп, а некоторые в конструкторе только датафрейм забирают, а потом через гетайтем картинки закидывают

лучше да через getitem думаю будет. видел такую практику у большинства)через инициализацию датасета в память сам не закидывал)
но можно попробовать конечно(лучше не стоит)

источник

12:54пожаловаться #20