Size: a a a

2019 August 22

S

Stanislav in Data Engineers
Anton Zadorozhniy
эм, етл? эйрфлоу планировщик, нафаня это файлопроцессинг фреймворк
То единственное,  что эйрфлоу делает хреново - планирование.
источник

СХ

Старый Хрыч in Data Engineers
Anton Zadorozhniy
молодеж пошла, все что данные из точку а в точку б перемещает - это у них теперь етл, ушла эпоха
ужас
источник

AZ

Anton Zadorozhniy in Data Engineers
Stanislav
То единственное,  что эйрфлоу делает хреново - планирование.
эм, потому что он не планировщик?)
источник

AZ

Anton Zadorozhniy in Data Engineers
сам в ужасе, на кого индустрию оставим?
источник

N

Nikita Blagodarnyy in Data Engineers
Хрыч, срочно бери студентов, учи всему.
источник

S

Stanislav in Data Engineers
Anton Zadorozhniy
эм, етл? эйрфлоу планировщик, нафаня это файлопроцессинг фреймворк
Эм. Не понял
источник

AZ

Anton Zadorozhniy in Data Engineers
Stanislav
Эм. Не понял
эйрфлоу оперирует дагами, которые он толкает, а что дальше происходит - его не волнует; нафаня держит флоу, который пропускает через себя флоуфайлы по нарисованному графу, флоуфайл прошел до конца - дело сделано
источник

AZ

Anton Zadorozhniy in Data Engineers
по вашей логике тогда все что может передать кусочек данных от одного процесса другому - это сравнимые между собой продукты
источник

СХ

Старый Хрыч in Data Engineers
Nikita Blagodarnyy
Хрыч, срочно бери студентов, учи всему.
плановое снижение качества уже скоро превратит it в средний менеджент
источник

AZ

Anton Zadorozhniy in Data Engineers
(мб и сравнимые, но сравнение это не несет никакой практической ценности)
источник

S

Stanislav in Data Engineers
Anton Zadorozhniy
по вашей логике тогда все что может передать кусочек данных от одного процесса другому - это сравнимые между собой продукты
Эм.  А мне не все равно ли как? Что-то берет кусок данных,  и выдает результат.
То,  что эйрфлоу рисует красивые даги - не значит ничего. Такой же даг в найфай нарисован руками.
источник

S

Stanislav in Data Engineers
Но продавать можно 2 инструмента, да. Опсам работы всегда не хватает
источник

AZ

Anton Zadorozhniy in Data Engineers
Stanislav
Эм.  А мне не все равно ли как? Что-то берет кусок данных,  и выдает результат.
То,  что эйрфлоу рисует красивые даги - не значит ничего. Такой же даг в найфай нарисован руками.
окей, это одно и тоже)
источник

AZ

Anton Zadorozhniy in Data Engineers
вы троллите, я понял
источник

AZ

Anton Zadorozhniy in Data Engineers
а слово ETL вообще стоит выкинуть из лексикона, никто не делает преобразования перед загрузкой уже давно, это все теперь data pipelines, ingestion/aggregation и в таком духе
источник

PD

Pavel Denisenko in Data Engineers
Anton Zadorozhniy
а слово ETL вообще стоит выкинуть из лексикона, никто не делает преобразования перед загрузкой уже давно, это все теперь data pipelines, ingestion/aggregation и в таком духе
и получится как в анекдоте "слова нет, а жопа есть"
источник

AZ

Anton Zadorozhniy in Data Engineers
Pavel Denisenko
и получится как в анекдоте "слова нет, а жопа есть"
чем вам дата пайплайны не нравятся? я даже от самых энтерпрайзно прожженых архитекторов хранилища из zSeries в Exadata слышал такую терминологию
источник

PD

Pavel Denisenko in Data Engineers
Anton Zadorozhniy
чем вам дата пайплайны не нравятся? я даже от самых энтерпрайзно прожженых архитекторов хранилища из zSeries в Exadata слышал такую терминологию
нравятся и пайплайны, и инжестшены. но зачем выкидывать устоявшийся термин, который вполне справляется со своей задачей: обозначить комплекс технологий по организации потоков данных в контуре аналитической платформы
источник

PD

Pavel Denisenko in Data Engineers
можно и ELT использовать, если нет трансформации перед загрузкой. но это уже детали. ETL - как имя собственное прижилось. и, думаю, нескоро из лексикона уйдет
источник

AZ

Anton Zadorozhniy in Data Engineers
Pavel Denisenko
можно и ELT использовать, если нет трансформации перед загрузкой. но это уже детали. ETL - как имя собственное прижилось. и, думаю, нескоро из лексикона уйдет
а если нет выгрузки и загрузки? всякая операционная аналитика в бэкенде поверх кафки это вполне себе общее место, такие модели как датафлоу/бим вообще не проводят границы между батчом и стримингом... это тоже ETL или ETL это только батч?
ладно, это мелочи конечно, пусть живет) но своим студентам я преподаю что ETL это такое устаревшее понятие)
источник