Телеграмм чат группы hadoopusers страница 1282

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

1724 membersпожаловаться на группу

2019 May 15

AZ

Anton Zadorozhniy in Data Engineers

Nikita Blagodarnyy

Мелкомягкая

а чего тогда без проприетарного? 😊

источник

18:25пожаловаться #1

N

Nikita Blagodarnyy in Data Engineers

Тошнит от кибернетики бдсм. Дорогой шедулер.

источник

18:26пожаловаться #2

K

KrivdaTheTriewe in Data Engineers

Можно датакапчур сделать

источник

18:26пожаловаться #3

K

KrivdaTheTriewe in Data Engineers

Но мы мелкие таблицы можем снапшотить, крупные раз в день всю переливаем

источник

18:27пожаловаться #4

N

Nikita Blagodarnyy in Data Engineers

Spark jdbc никто под это не юзал?

источник

18:28пожаловаться #5

A

Artur in Data Engineers

Nikita Blagodarnyy

Spark jdbc никто под это не юзал?

Пробовал, по моему медленнее скупа, но время не замерял

источник

18:30пожаловаться #6

K

KrivdaTheTriewe in Data Engineers

Nikita Blagodarnyy

Spark jdbc никто под это не юзал?

Его родного

источник

18:30пожаловаться #7

AZ

Anton Zadorozhniy in Data Engineers

я писал свои экстракторы (как раз для sybase/mssql, bcp хе-хе)

источник

18:31пожаловаться #8

AZ

Anton Zadorozhniy in Data Engineers

кмк если разово - проще скупом дернуть

источник

18:31пожаловаться #9

AZ

Anton Zadorozhniy in Data Engineers

если нужно грузить из большого парка баз, да еще где много мелких табличек - проще свой экстрактор написать который красивые файлы плодит

источник

18:32пожаловаться #10

AZ

Anton Zadorozhniy in Data Engineers

проблема со скупом или любым другим процессом порождающим MR - большой оверхед; когда количество таблиц идет на сотни и тысячи, и бОльшая часть из них мелкие - сложно такое обосновать

источник

18:37пожаловаться #11

K

KrivdaTheTriewe in Data Engineers

Anton Zadorozhniy

проблема со скупом или любым другим процессом порождающим MR - большой оверхед; когда количество таблиц идет на сотни и тысячи, и бОльшая часть из них мелкие - сложно такое обосновать

Мы поэтому сделали на спарке

источник

18:37пожаловаться #12

AZ

Anton Zadorozhniy in Data Engineers

эт каждому свое, я тут вообще надысь написал на го выгружалку из пг в авро (там фиксированная схема, но очень много инстансов), запускается в 256 мегабайт контейнере 😊

источник

18:39пожаловаться #13

K

KrivdaTheTriewe in Data Engineers

Anton Zadorozhniy

эт каждому свое, я тут вообще надысь написал на го выгружалку из пг в авро (там фиксированная схема, но очень много инстансов), запускается в 256 мегабайт контейнере 😊

Ну круто

источник

18:39пожаловаться #14

K

KrivdaTheTriewe in Data Engineers

Просто если сотни тысяч, можно загрузку в рамках одной джобы сделать

источник

18:39пожаловаться #15

K

KrivdaTheTriewe in Data Engineers

Нескольких таблиц

источник

18:40пожаловаться #16

N

Nikita Blagodarnyy in Data Engineers

Таблиц больше 5 тыс и многие в основном мелкие.

источник

18:41пожаловаться #17

AP

Alexander Piminov in Data Engineers

Nikita Blagodarnyy

Spark jdbc никто под это не юзал?

Он + framework поверх него для формирования и распределения загрузки, грузит много таблиц (3К+) инкрементально в много потоков, используя FAIR.

источник

18:41пожаловаться #18

K

KrivdaTheTriewe in Data Engineers

Nikita Blagodarnyy

Таблиц больше 5 тыс и многие в основном мелкие.

Сделайте спарк джобу которая умеет принимать на вход конфиг со списком таблиц

источник

18:41пожаловаться #19

K

KrivdaTheTriewe in Data Engineers

И несколько джоб можно пускать

источник

18:41пожаловаться #20