Size: a a a

2019 August 01

PK

Pavel Klemenkov in Data Engineers
Anton Zadorozhniy
Как-то пропустил что метасторы разделились, может сказать автору чтобы поправили описание? По сути ведь проблема в том что Spark не умеет читать ACID таблицы Hive, все остальное это просто способ огородить пользователей и дать им адаптер..
@Shishkanova_k это к тебе
источник

AP

Alexander Piminov in Data Engineers
@dartov правильно расписал, путем несложных манипуляций можно настроить нужный каталог, отключается ACID и т.п., в описании от HW некоторые формулировки отдают маркетингом.
источник

IB

Ivan Blinkov in Data Engineers
Долгожданный ClickHouse Meetup в Москве состоится 5 сентября, уже можно регистрироваться: https://yandex.ru/promo/clickhouse/moscow-2019

Обратите внимание, что в программе большой слот выделен под доклады пользователей — не стесняйтесь в него записываться при заполнении формы.
источник

AZ

Anton Zadorozhniy in Data Engineers
Alexander Piminov
@dartov правильно расписал, путем несложных манипуляций можно настроить нужный каталог, отключается ACID и т.п., в описании от HW некоторые формулировки отдают маркетингом.
точно, и доклад было бы лучше аннотировать так: в текущей версии Spark не может читать Hive ACID таблицы, если вам это очень нужно - вот HWC и использовать его можно так...
источник

ЕГ

Евгений Глотов in Data Engineers
А не кривой ли он?
источник

ЕГ

Евгений Глотов in Data Engineers
А, так про это и есть весь доклад, очень интересно послушать будет
источник

AZ

Anton Zadorozhniy in Data Engineers
Евгений Глотов
А не кривой ли он?
Начать надо с того что Hive ACID кривой, дальше пойдёт легче)
источник

ЕГ

Евгений Глотов in Data Engineers
Я на раннем этапе дёргал эту штуку, криво было всё, может за полтора года допилили что-то)
источник

ЕГ

Евгений Глотов in Data Engineers
Anton Zadorozhniy
Начать надо с того что Hive ACID кривой, дальше пойдёт легче)
Да это понятно, осталось только доказать это опытным архитекторам)
источник

AP

Alexander Piminov in Data Engineers
Евгений Глотов
Да это понятно, осталось только доказать это опытным архитекторам)
Если ты был на докладе про HDP 3.x, то там вкратце было про pain points, замеченные в новой версии. С тех пор были изменения, конечно.
источник

AZ

Anton Zadorozhniy in Data Engineers
Интересно что можно улучшить в дизайне где SI транзакции дописывают дельту в объектный сторадж, блокировки хранятся в зукипере, а компакции выполняются как yarn джобы
источник

PK

Pavel Klemenkov in Data Engineers
Anton Zadorozhniy
Интересно что можно улучшить в дизайне где SI транзакции дописывают дельту в объектный сторадж, блокировки хранятся в зукипере, а компакции выполняются как yarn джобы
Приходи на митап, похоливорить )
источник

AZ

Anton Zadorozhniy in Data Engineers
Pavel Klemenkov
Приходи на митап, похоливорить )
Я не в Москве живу, а оказии не намечается, так что сорян
источник

AZ

Anton Zadorozhniy in Data Engineers
Anton Zadorozhniy
Интересно что можно улучшить в дизайне где SI транзакции дописывают дельту в объектный сторадж, блокировки хранятся в зукипере, а компакции выполняются как yarn джобы
Забыл что сами метаданные при этом хранятся в отдельной реляционке)
источник
2019 August 02

KS

Ksu Shishkanova in Data Engineers
Anton Zadorozhniy
точно, и доклад было бы лучше аннотировать так: в текущей версии Spark не может читать Hive ACID таблицы, если вам это очень нужно - вот HWC и использовать его можно так...
Да, речь пойдет про spark +hive с acid, мы по некоторым причинам его отключать не стали и иногда используем
источник

AZ

Anton Zadorozhniy in Data Engineers
Ksu Shishkanova
Да, речь пойдет про spark +hive с acid, мы по некоторым причинам его отключать не стали и иногда используем
да я без претензий по сути темы, просто первое предложение про первый доклад попало в глаз, а там все неправильно)
источник

AZ

Anton Zadorozhniy in Data Engineers
(ACID/LLAP появились до HDP3, метастор один, настраивать нужно только в узких случаях)
источник

KS

Ksu Shishkanova in Data Engineers
Anton Zadorozhniy
(ACID/LLAP появились до HDP3, метастор один, настраивать нужно только в узких случаях)
там не написано, что ACID и LLAP появились в hdp3, метасторы(точнее каталоги) разделились, но действительно только для ACID.
источник

神風 in Data Engineers
Привет. Упражняюсь в structured streaming. Spark 2.4.3 Запускаю пример из документации spark.apache.org. Failed to find data source: kafka...
В зависимостях есть spark-streaming-kafka-0-10_2.12 version 2.4.3
источник

R

Renarde in Data Engineers
神風
Привет. Упражняюсь в structured streaming. Spark 2.4.3 Запускаю пример из документации spark.apache.org. Failed to find data source: kafka...
В зависимостях есть spark-streaming-kafka-0-10_2.12 version 2.4.3
а на чем приложение написано?
источник