Size: a a a

2019 August 01

AA

Aleksandr Aleksandrov in Data Engineers
Stanislav
либо может какой-то тарантул спасет
но по нему мало экспертизы вокруг
По тарантулу сами разработчики быстро отвечают в телеграмме. На сколько я знаю там есть индексы по Json path, но лучше уточнить.
источник

AS

Andrey Sutugin in Data Engineers
Nika
А есть ли резон какой то использовать structured streaming, и получается самому офсет не закомитить в конце?
Кто вам мешает самому коммитить офсеты и указывать их при старте джобы? Да, по дефолту за вас там все сделали, но ни кто не мешает обойти это.
источник

PK

Pavel Klemenkov in Data Engineers
Новый, твой, восьмой! https://moscowspark.timepad.ru/event/1032150/
источник

ПФ

Паша Финкельштейн in Data Engineers
Что написано на кнопке? У меня текст обрезается
источник

ЕС

Евгений Санников in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
Паша Финкельштейн
Что написано на кнопке? У меня текст обрезается
Саспенс
источник

GP

Grigory Pomadchin in Data Engineers
поправлю на чтонить короткое
источник

K

KrivdaTheTriewe in Data Engineers
Grigory Pomadchin
поправлю на чтонить короткое
Я знаю что такое CAP теорема
источник

GP

Grigory Pomadchin in Data Engineers
KrivdaTheTriewe
Я знаю что такое CAP теорема
Я знаю, что Apache Hadoop это не Apache HTTP Server
источник

AZ

Anton Zadorozhniy in Data Engineers
Как-то пропустил что метасторы разделились, может сказать автору чтобы поправили описание? По сути ведь проблема в том что Spark не умеет читать ACID таблицы Hive, все остальное это просто способ огородить пользователей и дать им адаптер..
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
Как-то пропустил что метасторы разделились, может сказать автору чтобы поправили описание? По сути ведь проблема в том что Spark не умеет читать ACID таблицы Hive, все остальное это просто способ огородить пользователей и дать им адаптер..
там коннектор к хайв 3 метастору выглядит оч ущербно
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
там коннектор к хайв 3 метастору выглядит оч ущербно
Там нет никакого конвектора к метастору, о чем это вообще?
источник

K

KrivdaTheTriewe in Data Engineers
я оговорился, прошу прощения, к вархаусу
источник

K

KrivdaTheTriewe in Data Engineers
источник

K

KrivdaTheTriewe in Data Engineers
источник

AZ

Anton Zadorozhniy in Data Engineers
Там есть HWC в девичестве Spark-LLAP который позволяет читать данные из Hive ACID таблиц, коннект к метастору остаётся такой же, если у вас нет ACID таблиц - читайте как прежде
источник

K

KrivdaTheTriewe in Data Engineers
ну вот речь про ACID а так работает как прежде, это правда
источник

AZ

Anton Zadorozhniy in Data Engineers
Там все что сделано (по-умолчанию) - это в заведён второй каталог в Hive Metastore (при этом метастор остаётся один), и в spark конфиге он подсовывается, поменяйте metastore.catalog.default со spark на hive и все сможете читать и писать
источник

AZ

Anton Zadorozhniy in Data Engineers
источник

AZ

Anton Zadorozhniy in Data Engineers
Тут бестолковая картинка, лучше вот такую приводить
источник