Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2021 February 26

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Vadim Chashechnikov
Ещё могут заблокировать, если слишком часто файл читаешь
другое дело, penalty за ютилизацию и траффик )
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
другое дело, penalty за ютилизацию и траффик )
но на счет этого пока не знаю, тренирую модель с чтением батчей с смонтированного гугл драйва, пока что не убили ))
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
по-моему как раз множество мелких можно, если у гугла на то желание, так распределить, что будет эффективнее, чем один большой за раз.
Офк нет, каждый новый файл это дополнительный вызов к файловой системе
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Попробуй даже просто на диске миллион мелких файлов скопировать или один большой, и удивись
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Evgenii Zheltonozhskii🇮🇱
Офк нет, каждый новый файл это дополнительный вызов к файловой системе
но тут еще насколько я понимаю, не только файловая система трудиться,
если драйв и машина коллаба это разные машины, то есть лежать на разных серверах, в разных локациях, они контактируют через socket-ы наверное, а для юзера это виртуальная одна файловая система.

То есть запрос на перелокацию файлов, это открытие сокета, пересылка, закрытие. И тут вопрос какой оверхед больше. Ну если конечно так эта виртуальная система устроена. Если конечно у каждого юзера коллаба "его" драйв находится рядом с его локальной памятью коллаба, и там чисто по PCI еще каким-то проводным способом передача данных, как на диске, то тогда наверное да.

Поэтому я ранее написал, что хз как эта вся виртуальная система поставлена.
Но если это действительно через драйв апи, за которой сокеты и передача данных клиент-сервер, то наверное в таком случае распределить бы было эффективнее. Учитывая что гугл драйвов много, и там сеть серверов, юзеров и т.д.

не ?
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
помоему это все таки две разные файловые системы контактирующие друг с другом удаленно, даже после монтирования. Так как делая write через коллаб меняется размер файла на драйве. Ну а привязывая их физической близостью было бы трудно и неэффективно наверное. Коллаб и драйв для каждого юзера. Хотя ... кто знает. Плюсы, минусы.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
ща перетащить попробую глянем )
архивировать десяятки гигов тоже не дешевое удовольствие
источник
2021 February 27

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
ща перетащить попробую глянем )
архивировать десяятки гигов тоже не дешевое удовольствие
Это делается один раз
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Vadim Chashechnikov
Ок, сообщу результаты.
Есть что-нибудь?
источник

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Timofey Naumenko
Есть что-нибудь?
20 часов тренируется 15 эпох
источник

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Уже есть 8 эпох, стабильно падает mAP, уже 0.0261👍
источник

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Кстати, при батче 64 быстрее конвержится. Разница скорости эпохи час 10 против час 20.
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Vadim Chashechnikov
20 часов тренируется 15 эпох
tiny yolo на coco? А железо какое?
источник

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Timofey Naumenko
tiny yolo на coco? А железо какое?
colab, v100
источник

СВ

Сергей Васильев... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Переслано от Сергей Васильев...
привет ребят. Решил поиграться с рекуррентными сетками, придумал себе задачу - реализовать xor на последовательности(1й скрин). Типа y_t = xor(x_t-1, x_t). Добился запускаемости, но вот только она нифига не обучается. Думаю, где то есть структурная ошибка
источник

СВ

Сергей Васильев... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Переслано от Сергей Васильев...
источник

СВ

Сергей Васильев... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Переслано от Сергей Васильев...
источник

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Сергей Васильев
Переслано от Сергей Васильев
привет ребят. Решил поиграться с рекуррентными сетками, придумал себе задачу - реализовать xor на последовательности(1й скрин). Типа y_t = xor(x_t-1, x_t). Добился запускаемости, но вот только она нифига не обучается. Думаю, где то есть структурная ошибка
Это весь код? Я не вижу собственно обучения, т.е. model.fit()
источник

СВ

Сергей Васильев... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ivan
Это весь код? Я не вижу собственно обучения, т.е. model.fit()
прошу прощения, забыл
источник

СВ

Сергей Васильев... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
количество эпох не влияет на обучение*
источник