Size: a a a

2019 August 06

ПФ

Паша Финкельштейн in Data Engineers
Штука в том, что это решается на кодогенерации и отлично работает в джаве
источник

ПФ

Паша Финкельштейн in Data Engineers
Причём существует вроде много лет - например metadata api в jpa
источник

ПФ

Паша Финкельштейн in Data Engineers
Более того, слик работает очень похоже
источник

K

KrivdaTheTriewe in Data Engineers
это не решается кодогенерацией потому что компилятор ничего не знает о том, как данные хранятся, и их сруктуре, а каталист знает
источник

ПФ

Паша Финкельштейн in Data Engineers
А датасеты по факту просто ничем не отличаются от датафреймов
источник

m

mel kaye in Data Engineers
разве они не структурированы?
источник

ПФ

Паша Финкельштейн in Data Engineers
KrivdaTheTriewe
это не решается кодогенерацией потому что компилятор ничего не знает о том, как данные хранятся, и их сруктуре, а каталист знает
Компилятор знает всё про твои case классы
источник

m

mel kaye in Data Engineers
или это я с рдд путаю?
источник

ПФ

Паша Финкельштейн in Data Engineers
mel kaye
или это я с рдд путаю?
Похоже что с rdd
источник

K

KrivdaTheTriewe in Data Engineers
Паша Финкельштейн
Компилятор знает всё про твои case классы
но он не знает ничего про вышеописанное
источник

K

KrivdaTheTriewe in Data Engineers
а спарк знает
источник

K

KrivdaTheTriewe in Data Engineers
и строит логический и физический план запроса
источник

K

KrivdaTheTriewe in Data Engineers
и оптимизирует доступ к данным
источник

ПФ

Паша Финкельштейн in Data Engineers
KrivdaTheTriewe
но он не знает ничего про вышеописанное
Поскольку любой Спарк запрос можно описать со spark sql - надо на основании данных просто сгенерировать правильную строку
источник

K

KrivdaTheTriewe in Data Engineers
кодогенерацией этот вопрос не решить
источник

ПФ

Паша Финкельштейн in Data Engineers
То есть надо нагенерировать кастомных классов поверх case, у которых будут sql методы
источник

ПФ

Паша Финкельштейн in Data Engineers
KrivdaTheTriewe
кодогенерацией этот вопрос не решить
Посмотри как работает jooq
источник

ПФ

Паша Финкельштейн in Data Engineers
Причём в джаве нет макросов, там кодогенерация генерирует и домен сразу
источник

ПФ

Паша Финкельштейн in Data Engineers
С помощью apt
источник

K

KrivdaTheTriewe in Data Engineers
jooq молодец, но мы говорим про распредленные вычисления над различными форматами данных, в различных стороджах, под разный типы вычислений
источник