Size: a a a

2019 July 30

RI

Rustam Iksanov in Data Engineers
Rustam Iksanov
Инженеры! Помогите. Настраиваю в Фениксе таблицы с Hbase. B и проблема кастинга типов. Все кроме string не кастятся нормально.
Комрады, кто-то может подсказать в чем проблема кастинга нестринговых типов при маппинге из hbase в phoenix ?
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
часто (читай всегда) есть дата продукты / дата ассеты которые не хайве определены, но которыми нужно тоже управлять
У меня сложность следущая , данные генерятся не хайвом, а читаются хайвом, поэтому наиболее логичным вижу именно фиксацию изменений вархауса хайва
источник

AZ

Anton Zadorozhniy in Data Engineers
Паша Финкельштейн
так, а ими вы как управляете?
да также, артефакт заданного формата, инсталлер/манифест для его применения, и каталог/сервис дискавери компонент где ведется учет по каждой среде
источник

ПФ

Паша Финкельштейн in Data Engineers
блин, а может вы доклад про это где делали? ну люди должны знать же
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
У меня сложность следущая , данные генерятся не хайвом, а читаются хайвом, поэтому наиболее логичным вижу именно фиксацию изменений вархауса хайва
да, все логично, мы просто стараемся думать у таблицах в хайве всегда в связке с джобом которые их порождают, поэтому в артефакте всегда и джоб и ддл
источник

AZ

Anton Zadorozhniy in Data Engineers
Паша Финкельштейн
блин, а может вы доклад про это где делали? ну люди должны знать же
нет, но вашу контору я когда-то тоже по каким-то таким темам консультировал)
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
да, все логично, мы просто стараемся думать у таблицах в хайве всегда в связке с джобом которые их порождают, поэтому в артефакте всегда и джоб и ддл
:) а если Джоба имеет схему не в create table  формате, а скажем из уже полученного датафрейма сгенерировать табличку
источник

ПФ

Паша Финкельштейн in Data Engineers
Anton Zadorozhniy
нет, но вашу контору я когда-то тоже по каким-то таким темам консультировал)
да? Прикольно. А кого?
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
:) а если Джоба имеет схему не в create table  формате, а скажем из уже полученного датафрейма сгенерировать табличку
так не может быть, есть гавернанс правило которое требует явного ддл, без такого правила у вас пропадает детерминированность, и аутком джоба может зависеть от данных, а так делать не нужно
источник

AZ

Anton Zadorozhniy in Data Engineers
Паша Финкельштейн
да? Прикольно. А кого?
дм
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
так не может быть, есть гавернанс правило которое требует явного ддл, без такого правила у вас пропадает детерминированность, и аутком джоба может зависеть от данных, а так делать не нужно
Но всегда можно отслеживать уже после результат
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
так не может быть, есть гавернанс правило которое требует явного ддл, без такого правила у вас пропадает детерминированность, и аутком джоба может зависеть от данных, а так делать не нужно
Скорее от конфигурации зависит, а не от самих данных
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Но всегда можно отслеживать уже после результат
да, но тут мы не можем рассуждать о датасете на берегу, мы зависим от результата рана джоба - наверное все это можно заставить работать, но нам оказалось проще заставить разработчиков явно писать DDL
источник

ПФ

Паша Финкельштейн in Data Engineers
Я тут пытаюсь бороться за явный DDL чтобы никакой магии больше не было
источник

AS

Andrey Star in Data Engineers
Привет! А кто-нибудь юзал Gluster FS? (на 6 версии битые файлы пишет, на 4 медленно работает) У кого-нибудь работало номарльно?
источник

AZ

Anton Zadorozhniy in Data Engineers
Паша Финкельштейн
Я тут пытаюсь бороться за явный DDL чтобы никакой магии больше не было
🤝
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
да, но тут мы не можем рассуждать о датасете на берегу, мы зависим от результата рана джоба - наверное все это можно заставить работать, но нам оказалось проще заставить разработчиков явно писать DDL
При этом данные могут по факту лежать другие , а разработчик ошибся в ддл:)
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
При этом данные могут по факту лежать другие , а разработчик ошибся в ддл:)
а тесты для чего?)
источник

АЖ

Андрей Жуков in Data Engineers
источник

AZ

Anton Zadorozhniy in Data Engineers
но вообще конечно так может случиться, это последствие разорванности метаданных и данных
источник