Size: a a a

2021 May 12

A

Alex in Data Engineers
здесь видно только 5+ минут в первичной выборке, до джойна ещё не дошло
источник

D

Dmitry in Data Engineers
я так понял что весь джоин на stage 6  запланирован выполнятся в одном единственном таске
да, вот запустилось
источник

D

Dmitry in Data Engineers
источник

A

Alex in Data Engineers
даже интересно что у вас за джойн, если после предыдущих шагов из 100гб сделали почти по 2тб шафл врайта который свалился на 1 таск для джойна
источник

AZ

Anton Zadorozhniy in Data Engineers
можно, но топик стартер стартер спрашивал "не эйрфлоу"
источник

AZ

Anton Zadorozhniy in Data Engineers
моя проблема с эйрфлоу видимо похожая, на мой вкус он везде неродной: на хадупе не умеет использовать распределенный сторадж и компьют, на кубере тоже как-то сбоку стоит, плагины подавай для самый простых вещей
источник

K

KrivdaTheTriewe in Data Engineers
какие плагины?
источник

AZ

Anton Zadorozhniy in Data Engineers
ну секреты например доставать, нормально использовать сервисные учетки на кубере
источник

K

KrivdaTheTriewe in Data Engineers
мы на волт мигрировали недавно, сейчас пытаемся сделать pv per dag run и запуск в кубере, плюс достаточно мощный шаблонизатор с бизнесспецифичными задачами
источник

K

KrivdaTheTriewe in Data Engineers
но вот @once мы не запускаем
источник

K

KrivdaTheTriewe in Data Engineers
Но у нас связка k8s+hadoop
источник

AZ

Anton Zadorozhniy in Data Engineers
у меня вот в AnalyticOps один из движков - это чисто кубер, без всяких Jenkins/Gitlab CI или Azure Pipelines, очень удобно через API оформить и запустить джоб в кубере, никакой шаблонизации или кодогенерации, все нормально программно доступно
источник

K

KrivdaTheTriewe in Data Engineers
ну запустили джоб через джоб, а скедулинг если?
источник

K

KrivdaTheTriewe in Data Engineers
А как без CI валидировать ?
источник

AZ

Anton Zadorozhniy in Data Engineers
я говорю про runOnce запуск, обучение/оценка модельки у нас
источник

AZ

Anton Zadorozhniy in Data Engineers
само приложение валидирует - забирает артефакты, метрики, показывает их пользователям
источник

K

KrivdaTheTriewe in Data Engineers
ран ванс можно шаблон в гилабе расписать с чистым апи)
источник

AZ

Anton Zadorozhniy in Data Engineers
но это получается еще одна прослойка
источник

K

KrivdaTheTriewe in Data Engineers
аналитику куб изучать?
источник

AZ

Anton Zadorozhniy in Data Engineers
у нас так и есть, training engine это подключаемая штука, можно на gitlab ci/jenkins через шаблоны, либо в кубер напрямую
источник