Телеграмм чат группы hadoopusers страница 1270

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

1724 membersпожаловаться на группу

2019 May 10

AZ

Anton Zadorozhniy in Data Engineers

я видел попытки запускать hbase внутри yarn services (и других контейнерных оркестраторов), с целью получить много регионсерверов на одной большой железной тачке - всегда было страшной поделкой из скотча и зубочисток, в продакшен не поехала

источник

10:29пожаловаться #1

DM

Daniel Matveev in Data Engineers

Anton Zadorozhniy

я видел попытки запускать hbase внутри yarn services (и других контейнерных оркестраторов), с целью получить много регионсерверов на одной большой железной тачке - всегда было страшной поделкой из скотча и зубочисток, в продакшен не поехала

а для чего на одном хосте куча регион-серверов?

источник

10:33пожаловаться #2

AZ

Anton Zadorozhniy in Data Engineers

а для чего на одном хосте куча регион-серверов?

ну обычные проблемы с одним большим JVM, если в машине десятки ядер и полтера памяти то сделать на несколько регионсерверов будет выгодно для производительности и отзывчивости hbase

источник

10:49пожаловаться #3

AZ

Anton Zadorozhniy in Data Engineers

просто как отдельностоящие RS запускать можно, а не во всяких докерах https://github.com/linehrr/hbase-multi-hosting https://community.hortonworks.com/questions/103072/installing-multiple-regionserver-on-one-host-via-a.html

linehrr/hbase-multi-hosting

this is a simple and yet hacky way to host multiple regions servers on a single host machine for hbase to solve the beefy server issue - linehrr/hbase-multi-hosting

источник

10:53пожаловаться #4

КБ

Константин Белов in Data Engineers

возможно не умный вопрос задаю, просто я почитал документацию ..и тут написано #SBATCH —nodes=2 достаточно для того, чтобы распределить вычисления по 2-м узлам.
https://cluster.vstu.ru/docs/slurm_user_guide.html
(скриншот1)

я запускаю расчет на двух узлах.
#SBATCH —nodes=2
а получается что на одном узле gn02 все 4GPU загружены, а на второй узле gn03 (скриншот №2) GPU-шки простаивают.
я выделил себе две ноды..хочу чтобы по двум нодам параллельно считало..

В коде программы я ее распаралелил (как показывал раньше, скриншот3), так что тут все норм..

как мне распараллелить вычисления теперь на 2 ноды ? на одну полностью все загружает, хочу чтобы по двум нодам параллельно вычисления шли..

P.S.
я подумал, что нужно просто прописать
# Количество процессов одного узла
#SBATCH —ntasks-per-node=4
и результат такой же, это был JobID 57044,
теперь поставил
#SBATCH —ntasks-per-node=8
это был JobID 570448

результат и там такой же (скриншот 5 и 6)

источник

15:31пожаловаться #5

КБ

Константин Белов in Data Engineers

источник

15:31пожаловаться #6

КБ

Константин Белов in Data Engineers

источник

15:31пожаловаться #7

КБ

Константин Белов in Data Engineers

источник

15:31пожаловаться #8

КБ

Константин Белов in Data Engineers

источник

15:31пожаловаться #9

КБ

Константин Белов in Data Engineers

источник

15:31пожаловаться #10

КБ

Константин Белов in Data Engineers

ну ребят

источник

16:10пожаловаться #11

UD

Uncel Duk in Data Engineers

https://slurm.schedmd.com/gres.html

источник

16:33пожаловаться #12

UD

Uncel Duk in Data Engineers

Остальное к админам твоего кластера, как они слерм настроили

источник

16:34пожаловаться #13

КБ

Константин Белов in Data Engineers

не надо ли DataParallel на DistributedDataParallel заменить? чтобы он и на другую тачку закидывал

источник

17:54пожаловаться #14

КБ

Константин Белов in Data Engineers

я пытаюсь эту обертку написать, но ..

источник

17:54пожаловаться #15

КБ

Константин Белов in Data Engineers

источник

17:54пожаловаться #16

КБ

Константин Белов in Data Engineers

я тупо копирнул весь код от сюда...https://pytorch.org/docs/stable/_modules/torch/nn/parallel/distributed.html

источник

18:04пожаловаться #17

КБ

Константин Белов in Data Engineers

и получил вот это, как прогу запустить без ошибок ..?

источник

18:04пожаловаться #18

YI

Yukari I in Data Engineers

2.0/3.0?

источник

18:19пожаловаться #19

КБ

Константин Белов in Data Engineers

python ?

источник

18:24пожаловаться #20