Size: a a a

2019 July 30

AZ

Anton Zadorozhniy in Data Engineers
вообще даже добавление колонки с бэкфилом редкий кейс в продакшен джобах
источник

K

KrivdaTheTriewe in Data Engineers
спасибо
источник

ПФ

Паша Финкельштейн in Data Engineers
Anton Zadorozhniy
мы автоматично поддерживаем два варианта: добавить колонку только для следующих партиций, либо сделать бэкфил с какой-то старой партиции, все остальное руками
А технически как реализовали?
источник

AZ

Anton Zadorozhniy in Data Engineers
Паша Финкельштейн
А технически как реализовали?
Что конкретно? Там очень незатейливая реализация: 1. Тормозим воркфлу в планировщике 2. Деплоим новую версию джоба и ддл 3. Запускаем воркфлу или с нового места или с бэкфила
источник
2019 July 31

C

Combot in Data Engineers
Adrian veidt Lopez has been banned! Reason: CAS ban.
источник

AR

Andrey RRR in Data Engineers
говно этот ваш комбот, из 18 попыток только раз сработал
источник

AR

Andrey RRR in Data Engineers
на помойку
источник

GP

Grigory Pomadchin in Data Engineers
Andrey RRR
говно этот ваш комбот, из 18 попыток только раз сработал
то что сверху это бан кросс чатов, аккаунт был замечен не первый раз за этим делом
источник

GP

Grigory Pomadchin in Data Engineers
Для новоприбывших капча и бан если не пройдут ее
источник

GP

Grigory Pomadchin in Data Engineers
судя по логам вся эта толпа в бане вошедшая
источник

GP

Grigory Pomadchin in Data Engineers
Если у тебя есть идея лучше чем бот с капчей и который трёт за собой почти все, буду рад узнать
источник

NT

Nikolay Troshnev in Data Engineers
Nikolay Troshnev
Не поделитесь опытом про датакаталоги - из чего стоит выбирать и по каким критериям?
Уточню.  Внедрял и пользовался Alation, представляю что не умеет Atlas, смотрел на материалы по Waterline и Collibra.
Alation нравится почти всем кроме цены. Бюджетный вариант - крутиться с Atlas или есть ещё альтернативы?
источник

NT

Nikolay Troshnev in Data Engineers
Ещё нашёл Lyft Amundsen - интересно выглядит, никто не пробовал?
источник

AZ

Anton Zadorozhniy in Data Engineers
Nikolay Troshnev
Ещё нашёл Lyft Amundsen - интересно выглядит, никто не пробовал?
я такой не видел еще, спасибо! netflix metacat можете не смотреть - довольно убогая реализация
источник

АЖ

Андрей Жуков in Data Engineers
Nikolay Troshnev
Уточню.  Внедрял и пользовался Alation, представляю что не умеет Atlas, смотрел на материалы по Waterline и Collibra.
Alation нравится почти всем кроме цены. Бюджетный вариант - крутиться с Atlas или есть ещё альтернативы?
Нам Alation как дата каталог показался ниочинь. Свистелок и перделок много,  а каталога мало
источник

АЖ

Андрей Жуков in Data Engineers
Либо продаван ниочинь попался :)
источник

NT

Nikolay Troshnev in Data Engineers
А чем пользуетесь?
источник

AP

Alexander Piminov in Data Engineers
Nikolay Troshnev
Уточню.  Внедрял и пользовался Alation, представляю что не умеет Atlas, смотрел на материалы по Waterline и Collibra.
Alation нравится почти всем кроме цены. Бюджетный вариант - крутиться с Atlas или есть ещё альтернативы?
Atlas следует рассматривать как framework (который что-то за тебя сделал) и поверх него уже делать то, что тебе нужно🙂
источник

NT

Nikolay Troshnev in Data Engineers
Alexander Piminov
Atlas следует рассматривать как framework (который что-то за тебя сделал) и поверх него уже делать то, что тебе нужно🙂
Насколько при этом реально его использовать не только для Hadoop части, а заливать и Postgres и nosql?
источник

AP

Alexander Piminov in Data Engineers
Nikolay Troshnev
Насколько при этом реально его использовать не только для Hadoop части, а заливать и Postgres и nosql?
Если общаться с ним по API, то все равно, что туда грузить🙂 По крайней мере, коллеги делали для PostgreSQL клиент для интеграции. А абстракции (dataset, lineage и т.п.) предоставляет Atlas.
источник