Size: a a a

2021 September 07

A

Alex in Data Engineers
Смотрите где разрыв между строками по времени большой :) хотя я не уверен что старт/стоп планировщика пишется
источник

A

Alex in Data Engineers
Есть риск что просто найдёте большой интервал между 2 строками и всё
источник

OI

Oleg Ilinsky in Data Engineers
в логах экзекуторов почти час ничего не происходило
источник

A

Alex in Data Engineers
Да, видно что поднялись, инициализациы, потом таски прилетели, поэтому и спросил про драйвер :)
источник

AZ

Anton Zadorozhniy in Data Engineers
Это явно кубовый сервис, а не настоящий хостнейм
источник

DR

Denis Rybak in Data Engineers
да, я в примере с кубером и нашел
источник

AB

Anton Bukreev in Data Engineers
Есть у кого дежурная ссылка на спецификацию форматов parquet и orc ? Чем полнее, тем лучше. Я гуглил, но полное описание не могу найти.
источник

ЕГ

Евгений Глотов... in Data Engineers
Это же опенсорс
источник

ЕГ

Евгений Глотов... in Data Engineers
В гите ток по коммитам читать
источник

ЕГ

Евгений Глотов... in Data Engineers
Что там в новых версиях)
источник

AZ

Anton Zadorozhniy in Data Engineers
Github/apache/parquet
источник

AZ

Anton Zadorozhniy in Data Engineers
Опять люди гуглить ленятся
источник

AZ

Anton Zadorozhniy in Data Engineers
источник

AB

Anton Bukreev in Data Engineers
Это я читал уже конечно.
источник

ЕГ

Евгений Глотов... in Data Engineers
Ну зачем так сразу, человек надеялся, что где-нибудь в закромах у сениоров найдётся заветная дока с полным и понятным описанием того, что в коде)
источник

ЕГ

Евгений Глотов... in Data Engineers
источник

AZ

Anton Zadorozhniy in Data Engineers
Так может у вас более конкретный вопрос? Там прям в репе просто лежит трифт файл со спекой, куда уж более точно?
источник

A

Alex in Data Engineers
В каком коде?

Раньше были реализации хайва, импалы, спарка

И они не само совместимы были между собой, бывало что записанное одним плохо читалось другими

Сейчас уже лучше ситуация
источник

ЕГ

Евгений Глотов... in Data Engineers
Кстати, по недавней теме - я так понял, что блум фильтры прямо внутрь спарк паркет ридер/райтера завезли только в 3.1?
источник

ЕГ

Евгений Глотов... in Data Engineers
Хайв научился читать спарк бакеты? Спарк научился читать хайв3 мэнэджд таблицы?
источник