Как-то пропустил что метасторы разделились, может сказать автору чтобы поправили описание? По сути ведь проблема в том что Spark не умеет читать ACID таблицы Hive, все остальное это просто способ огородить пользователей и дать им адаптер..
@dartov правильно расписал, путем несложных манипуляций можно настроить нужный каталог, отключается ACID и т.п., в описании от HW некоторые формулировки отдают маркетингом.
@dartov правильно расписал, путем несложных манипуляций можно настроить нужный каталог, отключается ACID и т.п., в описании от HW некоторые формулировки отдают маркетингом.
точно, и доклад было бы лучше аннотировать так: в текущей версии Spark не может читать Hive ACID таблицы, если вам это очень нужно - вот HWC и использовать его можно так...
Интересно что можно улучшить в дизайне где SI транзакции дописывают дельту в объектный сторадж, блокировки хранятся в зукипере, а компакции выполняются как yarn джобы
Интересно что можно улучшить в дизайне где SI транзакции дописывают дельту в объектный сторадж, блокировки хранятся в зукипере, а компакции выполняются как yarn джобы
Интересно что можно улучшить в дизайне где SI транзакции дописывают дельту в объектный сторадж, блокировки хранятся в зукипере, а компакции выполняются как yarn джобы
Забыл что сами метаданные при этом хранятся в отдельной реляционке)
точно, и доклад было бы лучше аннотировать так: в текущей версии Spark не может читать Hive ACID таблицы, если вам это очень нужно - вот HWC и использовать его можно так...
Да, речь пойдет про spark +hive с acid, мы по некоторым причинам его отключать не стали и иногда используем
Привет. Упражняюсь в structured streaming. Spark 2.4.3 Запускаю пример из документации spark.apache.org. Failed to find data source: kafka... В зависимостях есть spark-streaming-kafka-0-10_2.12 version 2.4.3
Привет. Упражняюсь в structured streaming. Spark 2.4.3 Запускаю пример из документации spark.apache.org. Failed to find data source: kafka... В зависимостях есть spark-streaming-kafka-0-10_2.12 version 2.4.3