Size: a a a

2019 July 30

ПФ

Паша Финкельштейн in Data Engineers
Если внезапно надо добавить новую колоночку — то как теперь будет выглядеть джоба?
источник

K

KrivdaTheTriewe in Data Engineers
Daniel Matveev
пользователям искать схемы данных по проектам в гите?
мы сейчас про версионирование говорим или про текущую схему,текущую схему можно увидеть в любой тулзе которая работает с базой данных,точно также как схему postgresql
источник

DM

Daniel Matveev in Data Engineers
и запустили ли эту версию кода или пропустили и взяли другую, а следующую еще не успели...
источник

ПФ

Паша Финкельштейн in Data Engineers
Daniel Matveev
пользователям искать схемы данных по проектам в гите?
с вероятностью не найти. Потому что withColumn().withColumn().toDf
источник

DM

Daniel Matveev in Data Engineers
KrivdaTheTriewe
мы сейчас про версионирование говорим или про текущую схему,текущую схему можно увидеть в любой тулзе которая работает с базой данных,точно также как схему postgresql
пользователям даешь доступ до базы?
источник

DM

Daniel Matveev in Data Engineers
как искать где что?
источник

K

KrivdaTheTriewe in Data Engineers
Daniel Matveev
и запустили ли эту версию кода или пропустили и взяли другую, а следующую еще не успели...
а причём тут запуск не той версии джоба, если условно джоба написана так, что она орк файлы сохраняет куда-то и ее не ту версию запустили,как явных ddl поможет тут?
источник

ПФ

Паша Финкельштейн in Data Engineers
KrivdaTheTriewe
мы сейчас про версионирование говорим или про текущую схему,текущую схему можно увидеть в любой тулзе которая работает с базой данных,точно также как схему postgresql
Версионирование не так интересно, как предсказуемость имха. Нет новой колонки для твоего джоба в кейс-классике? Пускай падает к херам
источник

DM

Daniel Matveev in Data Engineers
KrivdaTheTriewe
а причём тут запуск не той версии джоба, если условно джоба написана так, что она орк файлы сохраняет куда-то и ее не ту версию запустили,как явных ddl поможет тут?
фиксация того что должно быть в действительности
ддл - это контракт
источник

DM

Daniel Matveev in Data Engineers
как типы для твоих питонячих функций
источник

K

KrivdaTheTriewe in Data Engineers
Daniel Matveev
фиксация того что должно быть в действительности
ддл - это контракт
я лишь указываю на то,что это руками написанный контракт, который  вроде как соблюдается, а по факту нет
источник

DM

Daniel Matveev in Data Engineers
KrivdaTheTriewe
я лишь указываю на то,что это руками написанный контракт, который  вроде как соблюдается, а по факту нет
но у него жирный плюс - он доступен всем участникам процесса, не требует разбирательств в коде и шерстить самостоятельно базу

актуальность и корректность - это проблемы, которые и так и так не решаются
источник

K

KrivdaTheTriewe in Data Engineers
потому что джоба может быть написана так, что по факту она не соблюдает контракт и ты никогда это не зафиксируешь, пока явно не получишь схему из результата работы джобы
источник

K

KrivdaTheTriewe in Data Engineers
Daniel Matveev
но у него жирный плюс - он доступен всем участникам процесса, не требует разбирательств в коде и шерстить самостоятельно базу

актуальность и корректность - это проблемы, которые и так и так не решаются
я про актуальность и корректность говорю
источник

K

KrivdaTheTriewe in Data Engineers
Daniel Matveev
но у него жирный плюс - он доступен всем участникам процесса, не требует разбирательств в коде и шерстить самостоятельно базу

актуальность и корректность - это проблемы, которые и так и так не решаются
схема смотрится show create table db.table
источник

DM

Daniel Matveev in Data Engineers
KrivdaTheTriewe
потому что джоба может быть написана так, что по факту она не соблюдает контракт и ты никогда это не зафиксируешь, пока явно не получишь схему из результата работы джобы
если есть контракт, то джоба не права
если контракта нет, то всё ок
источник

DM

Daniel Matveev in Data Engineers
KrivdaTheTriewe
схема смотрится show create table db.table
вот бы сейчас всех пользаков к базам пускать неограничено, чтобы они поискали что там есть
источник

K

KrivdaTheTriewe in Data Engineers
Daniel Matveev
если есть контракт, то джоба не права
если контракта нет, то всё ок
джоба не права, но данные попорчены,  ты условно хранишь всё в csv, и схему определил для хайва , потом джобу поправил, и терь там другие данные льются , а ddl никак не обновил
источник

K

KrivdaTheTriewe in Data Engineers
Daniel Matveev
вот бы сейчас всех пользаков к базам пускать неограничено, чтобы они поискали что там есть
а где это о тображать?
источник

K

KrivdaTheTriewe in Data Engineers
в гит репозитории?
источник