Size: a a a

2021 September 13

VS

Vladislav 👻 Shishkov... in Data Engineers
Отвечу с опсовой точки зрения, еще какой подарок, да, надо ковырять, понять что и как работает, но вот у меня стенды airflow уже года 2 и проблем из-за airflow не было практически
источник

AZ

Anton Zadorozhniy in Data Engineers
это не прям что высокая планка
источник

РД

Роман Друзык... in Data Engineers
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Планка чего? Если брать какой-нибудь крон, то боли вагон. Брать альтернативные шедулеры - то они не заточены на обработку данных.
источник

РД

Роман Друзык... in Data Engineers
Это все логи, логов контейнеров нет, там пусто, так как они не стартанули
источник

ЕГ

Евгений Глотов... in Data Engineers
Блин чёт сложно кстати
источник

ЕГ

Евгений Глотов... in Data Engineers
Я не увидел ничего такого в логе, может кто-то ещё подскажет
источник

ЕГ

Евгений Глотов... in Data Engineers
Там где-то doAs, может что-то с юзерами на датанодах
источник

РД

Роман Друзык... in Data Engineers
спасибо
источник

РД

Роман Друзык... in Data Engineers
в конфигах hdfs-site.xml имеешь ввиду?
источник

ЕГ

Евгений Глотов... in Data Engineers
Из-под кого запускаешь?
источник

ЕГ

Евгений Глотов... in Data Engineers
И из-под кого должно в кластер-моде запускаться
источник

ЕГ

Евгений Глотов... in Data Engineers
Может там такого юзера нет
источник

ЕГ

Евгений Глотов... in Data Engineers
На тачке, на которую драйвер попадает
источник

РД

Роман Друзык... in Data Engineers
dfs.permissions.superusergroup вот сюда добавил группу в котрой есть юзер - но не помогло
источник

ЕГ

Евгений Глотов... in Data Engineers
Там ещё hadoop.proxyuser или типа того
источник

ЕГ

Евгений Глотов... in Data Engineers
Надо настроить
источник

РД

Роман Друзык... in Data Engineers
так, я проверю ща
источник

AZ

Anton Zadorozhniy in Data Engineers
чего я поел с airflow за последнюю пару недель:
- OAuth провайдеры через одно место сделаны, по клеймам нормально роли давать невозможо
- API версии 1 вообще можно за таковое не считать, в версии два получше но все равно огромные пробелы, никакого изменения самих дагов (его все еще предлагается через модную файловую систему менять), апишка логов например так сделано от обстукивания ему плохо становится
- безопасность API сделана тоже, эм странно (свои пользователи, имперсонацию нормально сделать невозможно, просто UI не использует эту апишку)
- даги задаются только через ФС, это нормально вообще?
- масштабирование все также блестяще сделано
источник

AZ

Anton Zadorozhniy in Data Engineers
после Argo просто жесть, как будто чей-то диплом выдали в продакшен запустить
источник