Size: a a a

2021 February 26

YL

Yuri Lyulchenko in Data Engineers
Добрый день! Вопрос по Flink Cep:
Хочу выловить событие по определенному паттерну. Создал HelloWorld проект, но такое ощущение, что паттерн не отрабатывает. Я не могу вывести результат. Проблема как здесь: https://stackoverflow.com/questions/39575991/flink-cep-no-results-printed.
источник

YL

Yuri Lyulchenko in Data Engineers
Код:
источник

YL

Yuri Lyulchenko in Data Engineers
Не отрабатывает в части PatternProcessFunction
источник

AC

Alexander Chermenin in Data Engineers
Yuri Lyulchenko
Код:
Код скрином - это прекрасно =]
источник

YL

Yuri Lyulchenko in Data Engineers
Вывод на экран только самого стрима:
источник

YL

Yuri Lyulchenko in Data Engineers
Alexander Chermenin
Код скрином - это прекрасно =]
источник

ME

Max Efremov in Data Engineers
Слушайте, а паркет тулы уже стали депрекейтед? А что вместо них сейчас? https://github.com/apache/parquet-mr/tree/master/parquet-tools-deprecated
источник

YL

Yuri Lyulchenko in Data Engineers
Yuri Lyulchenko
Добрый день! Вопрос по Flink Cep:
Хочу выловить событие по определенному паттерну. Создал HelloWorld проект, но такое ощущение, что паттерн не отрабатывает. Я не могу вывести результат. Проблема как здесь: https://stackoverflow.com/questions/39575991/flink-cep-no-results-printed.
Если кому интересно, то решение проблемы: PatternStream<String> patternStream = CEP.pattern(stream, pattern).inProcessingTime();

В версии 1.12 TimeCharacteristic по-умолчанию теперь EventTime.
Полный ответ: http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/Flink-CEP-can-t-process-PatternStream-td41722.html
источник

AS

Andrey Sutugin in Data Engineers
Всем привет!
Такой вопрос, ни кто не сталкивался с тем, что на hive таблицах на основе orc не работает predicate push-down оптимизация когда чиешь через spark?
Если же читаешь просто, как orc файл, то все нормально, только теряется нейминг колонок, вместо нормальных имен идет _col1 и т.д.?
источник

А

Алексей in Data Engineers
насчет нейминга: hive не сохраняет названия в сам файл
источник

NN

No Name in Data Engineers
Алексей
насчет нейминга: hive не сохраняет названия в сам файл
Не, погоди. Это, если не ошибаюсь, если писать напрямую хайвом, причем первым. Если же писать спарком орк файлы и сохранять как менеджд хайв табличку, то орк файл внутри будет с неймингами колонок.
источник

А

Алексей in Data Engineers
No Name
Не, погоди. Это, если не ошибаюсь, если писать напрямую хайвом, причем первым. Если же писать спарком орк файлы и сохранять как менеджд хайв табличку, то орк файл внутри будет с неймингами колонок.
да, наверно, так. Просто написал, что у меня были такие названия колонок, когда таблицу создаешь хайвом, а читаешь спарком
источник

А

Алексей in Data Engineers
по предикат пушдауну, мне когда то отвечали, что у меня спарк старый (2.3) и он читает не нативным способом orc. В новых должно работать
источник

NN

No Name in Data Engineers
Алексей
по предикат пушдауну, мне когда то отвечали, что у меня спарк старый (2.3) и он читает не нативным способом orc. В новых должно работать
Не, в 2.3 все работает, проверено
источник

А

Алексей in Data Engineers
No Name
Не, в 2.3 все работает, проверено
тестил летом: https://gist.github.com/pihel/b83f0b09ad72cb1f4c1bf2808a00c05b
для orc в 2.3 не было пушдауна, в 2.4 - был. Parquet работал в обоих версиях
источник

NN

No Name in Data Engineers
Алексей
тестил летом: https://gist.github.com/pihel/b83f0b09ad72cb1f4c1bf2808a00c05b
для orc в 2.3 не было пушдауна, в 2.4 - был. Parquet работал в обоих версиях
А ты когда тестил 2.3, у тебя параметр spark.sql.hive.convertMetastoreOrc был подрублен?
источник

NN

No Name in Data Engineers
No Name
А ты когда тестил 2.3, у тебя параметр spark.sql.hive.convertMetastoreOrc был подрублен?
А то выглядит так, что нет, и использовался хайв серде
источник

А

Алексей in Data Engineers
No Name
А ты когда тестил 2.3, у тебя параметр spark.sql.hive.convertMetastoreOrc был подрублен?
нет, из-за него получается?
источник

NN

No Name in Data Engineers
Алексей
нет, из-за него получается?
Скорее всего. Подруби, и будет использоваться билт-ин орк ридер
источник

А

Алексей in Data Engineers
No Name
Скорее всего. Подруби, и будет использоваться билт-ин орк ридер
ок, спс, попробую попозже
источник