Телеграмм чат группы hadoopusers страница 1323

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

1724 membersпожаловаться на группу

2019 May 24

K

KrivdaTheTriewe in Data Engineers

они ее ТОЛЬКО заанонсили

источник

18:43пожаловаться #1

R

Renarde in Data Engineers

ну мы ей задолго до анонса пользовались внутри датабрикса - все нормально с ней)

источник

18:44пожаловаться #2

AP

Alexander Piminov in Data Engineers

Nikita Blagodarnyy

Но нужно вроде указать partition(x, y, z)

Да, dynamic позволяет не волноваться, что партиции будут созданы, но поля нужно в SQL задавать.

источник

18:44пожаловаться #3

АЖ

Андрей Жуков in Data Engineers

KrivdaTheTriewe

они ее ТОЛЬКО заанонсили

пересядь на иглу датабрикса с лица хадупа!

источник

18:44пожаловаться #4

AP

Alexander Piminov in Data Engineers

ну мы ей задолго до анонса пользовались внутри датабрикса - все нормально с ней)

Вот это интересно, неужели, никаких проблем?🙂

источник

18:45пожаловаться #5

K

KrivdaTheTriewe in Data Engineers

я хотел бы как то динамически выяснить имена партиций и заинсертить партицированно)

источник

18:45пожаловаться #6

K

KrivdaTheTriewe in Data Engineers

и чтобы это движком хайва обрабатывалось, чтобы компакшн инструкции отработали корректно

источник

18:45пожаловаться #7

AP

Alexander Piminov in Data Engineers

KrivdaTheTriewe

я хотел бы как то динамически выяснить имена партиций и заинсертить партицированно)

Поля или конкретные партиции - каталоги? Поля нужно задать (например, dt), а конкретные партиции (например, dt=<today>) уже не нужно, если dynamic включен. Поля можно из metadata вытащить, но это некоторое кода количество сбоку.

источник

18:46пожаловаться #8

R

Renarde in Data Engineers

Alexander Piminov

Вот это интересно, неужели, никаких проблем?🙂

нуууу
смотря какой ворклоад, на самом деле. функционал описанный там работает целиком, и merge into и все плюшки с time-travel
другая проблема что когда тебе нужно сделать атомарный upsert (скажем 20к апдейтов на таблицу в 400 лямов строк) она требует уж больно большой кластер держать
но если у вас on-premises свой хадуп, то это прям норм кейс

источник

18:48пожаловаться #9

K

KrivdaTheTriewe in Data Engineers

Alexander Piminov

Поля или конкретные партиции - каталоги? Поля нужно задать (например, dt), а конкретные партиции (например, dt=<today>) уже не нужно, если dynamic включен. Поля можно из metadata вытащить, но это некоторое кода количество сбоку.

ну код я знаю как писать, но я же ленивый)

источник

18:48пожаловаться #10

K

KrivdaTheTriewe in Data Engineers

нуууу
смотря какой ворклоад, на самом деле. функционал описанный там работает целиком, и merge into и все плюшки с time-travel
другая проблема что когда тебе нужно сделать атомарный upsert (скажем 20к апдейтов на таблицу в 400 лямов строк) она требует уж больно большой кластер держать
но если у вас on-premises свой хадуп, то это прям норм кейс

если в спарк добавят поддержку менедж тейблов хайва

источник

18:48пожаловаться #11

K

KrivdaTheTriewe in Data Engineers

то дельта не нужна будет

источник

18:48пожаловаться #12

K

KrivdaTheTriewe in Data Engineers

источник

18:48пожаловаться #13

N

Nikita Blagodarnyy in Data Engineers

Да ладно, там 10 строк петона, лазящего по метастору

источник

18:49пожаловаться #14

K

KrivdaTheTriewe in Data Engineers

Nikita Blagodarnyy

Да ладно, там 10 строк петона, лазящего по метастору

а тесты?

источник

18:49пожаловаться #15

K

KrivdaTheTriewe in Data Engineers

и чтобы это все в даге было

источник

18:49пожаловаться #16

A

Alex in Data Engineers

KrivdaTheTriewe

если в спарк добавят поддержку менедж тейблов хайва

менедж тейблы это которые орки свежие?

источник

18:49пожаловаться #17

K

KrivdaTheTriewe in Data Engineers

которые кислые таблички поддерживают

источник

18:49пожаловаться #18

R

Renarde in Data Engineers

KrivdaTheTriewe

если в спарк добавят поддержку менедж тейблов хайва

"если бы у бабушки..."
вообще больше всего хочется увидеть индексы на паркете наконец, но это видимо до второго пришествия

источник

18:50пожаловаться #19

N

Nikita Blagodarnyy in Data Engineers

"если бы у бабушки..."
вообще больше всего хочется увидеть индексы на паркете наконец, но это видимо до второго пришествия

Какие? Btree?

источник

18:52пожаловаться #20