Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2021 May 11

VT

Vlad Timofeev in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
У меня опять вопрос. Про аугментацию. Допустим у меня 1000 разных картинок и я настраиваю пайплайн для аугментации. Почему во всех туториалах делают это в таком порядке?
dataset.shuffle(1000).map(augment_function).batch(32).prefetch(AUTOTUNE)
Какой смысл аугментировать набор уникальных, неповторяющихся картинок? Мы никак не увеличиваем датасет, а просто вносим разнообразие в разнообразные картинки, в этом нет смысла. Мне кажется во всех этих туториалах должен быть примерно следующий пайплайн:
dataset.shuffle(1000).repeat(10).map(augment_function).batch(32).prefetch(AUTOTUNE)
При наличие повторяющихся изображений мы должны внести разнообразие, чтоб все они стали уникальными. Но почему то этот момент везде обходят. Правильно ли я размышляю?
источник

VT

Vlad Timofeev in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
А еще лучше, сначала репит, а потом шафл. Но так конечно же выполнение будет длиться больше
источник

VT

Vlad Timofeev in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
dataset.repeat(10).shuffle(10000).map(augment_function).batch(32).prefetch(AUTOTUNE)

Вот так
источник

SL

Sergey L in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Несколько раз пытался понять, о чем вы. моя гипотеза такая, что вы все понятия в кучу мешаете, также, как и из туториала вырываете контекст, скрее всего потому что не до конца улавливаете смысл всех операций.
Аугментация это одно, а то какие вы данные аугментируете это другое.
С точки зрения туториала - вам показали, что есть удобное имплементация функций и все
источник

SL

Sergey L in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
С точки зрения репитов и прочего - это опять же, если вам надо так - вы делаете, если нет - не делаете. Все очень просто
источник

VT

Vlad Timofeev in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Аугментация означает увеличение датасета. Мое непонимание только в том, что в туториалах нет непосредственного увеличения данных, только лишь методы изменения картинок.
источник

ЕТ

Евгений Томилов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
У вас есть две картинки с котиками. Вы "аугментировали" данные, и у вас стало десять картинок с котиками, потому что вы повернули, отразили, исказили, сжали, наложили маску и так далее на две картинки с котиками.
источник

ЕТ

Евгений Томилов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Насколько я понял, это можно делать предварительно, то есть, сохранить все преобразованные картинки, а можно на лету.
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ну так ты каждую эпоху одни и те же картинки смотришь
источник

VT

Vlad Timofeev in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Все. Я понял. Спасибо🙃 каждую эпоху берется тот же сет, но он аугментируется всегда по разному. Для модели это выглядит как разные изображения каждую эпоху.
источник

A

Appa in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ребятушки, есть ли аналог LeakGAN для предтренированных трансформеров? А то в оригинальной работе я смотрю используются  LSTM. Больно идея GAN-ов для текста понравилась.
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ребят, подскажите чат про то как работать в git github
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Пожалуйста
источник

S

Scientist in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Список айтишных чатов и каналов телеграма:
https://github.com/goq/telegram-list
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Спасибо
источник

AG

Arseny Gorbunov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Схоронил
источник

SL

Sergey L in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
R2D2 на страже порядка. Круто =)
источник

D•

Dan • Captain in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
:)
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Но там новостные каналы , а не чаты
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Мне чат нужен
источник