Size: a a a

2019 September 25

TT

Tsh Tsh in Data Engineers
Сравни масштабируемость решений
источник

TT

Tsh Tsh in Data Engineers
И вендор лок
источник

AZ

Anton Zadorozhniy in Data Engineers
Nikolay
Добрый день, коллеги, никто не делал сравнение функциональности/производительности Azure DataFactory с другими ETL/ELT  решениям (DataStage, Informatica, Talend, etc.) ? Или, возможно есть ссылки на соответствующие статьи?
только если сами ETL вендоры делали, облачным вендорам это пофиг, а для простого клиента это адовая работа
источник

N

Nikolay in Data Engineers
Вендор лок - это ясно. Масштабируемость сравнима с DataStage on Hadoop (цена правда разная). А больше интересует сравнение именно функциональности. Например, сложно инстанциировать созданный датафлоу, использование динамических метаданных и т.д.
Но, да, я сейчас и пытаюсь их сравнить. Согласен - адово
источник

TT

Tsh Tsh in Data Engineers
Nikolay
Вендор лок - это ясно. Масштабируемость сравнима с DataStage on Hadoop (цена правда разная). А больше интересует сравнение именно функциональности. Например, сложно инстанциировать созданный датафлоу, использование динамических метаданных и т.д.
Но, да, я сейчас и пытаюсь их сравнить. Согласен - адово
Самописом пахнет
источник

TT

Tsh Tsh in Data Engineers
Тут уже обсуждали что пока в мире облаков и хадупов нет полноценного МДМ, дата говернанс, дата линидж, дата кволити и прочее
источник

N

Nikolay in Data Engineers
Только в Open Source, да. Но тут все таки коммерческие решения. Datastage линейджит и данные хадупа (маппит hdfs и таблицы хайва/bigsql) и дата говернанс делает и кволити. Азюр все это плохо. Но, все же, интересует именно ETL
источник

OA

Oleksandr Averchenko in Data Engineers
источник

OA

Oleksandr Averchenko in Data Engineers
источник

A

Alex in Data Engineers
А он каким боком?
источник

OA

Oleksandr Averchenko in Data Engineers
На нем ведь можно строить ЕТЛ на пистоне например.
источник

AZ

Anton Zadorozhniy in Data Engineers
Tsh Tsh
Тут уже обсуждали что пока в мире облаков и хадупов нет полноценного МДМ, дата говернанс, дата линидж, дата кволити и прочее
Оно и в проприетарных тулах так себе работает
источник

OA

Oleksandr Averchenko in Data Engineers
Tsh Tsh
Тут уже обсуждали что пока в мире облаков и хадупов нет полноценного МДМ, дата говернанс, дата линидж, дата кволити и прочее
Оно и не нужно. Их фокус мелкие конторы. Тырпрайз хочет кастомные решения по дешевле. Спроси и предложение не сходится.
источник

OA

Oleksandr Averchenko in Data Engineers
Но какие то простые вещи у них есть.

https://cloud.google.com/data-catalog/
источник

AZ

Anton Zadorozhniy in Data Engineers
У проприетарных ETL (у всех) есть родовая травма - схема всего определена на стадии разработки, и меняться в рантайме не может, любое изменение - новый релиз
источник

N

Nikolay in Data Engineers
Anton Zadorozhniy
У проприетарных ETL (у всех) есть родовая травма - схема всего определена на стадии разработки, и меняться в рантайме не может, любое изменение - новый релиз
Ошибаетесь, смотрите RCP в DataStage
источник

AZ

Anton Zadorozhniy in Data Engineers
Nikolay
Ошибаетесь, смотрите RCP в DataStage
Это лучшее что есть, но тоже такая себе полумера, про колонки
источник

AZ

Anton Zadorozhniy in Data Engineers
Данные же бывают и бинарные, и всякие кастомные форматы
источник

AZ

Anton Zadorozhniy in Data Engineers
И логика эволюции схем бывает не тупо “прокинь мне колонку», а всякие transient backward compatible
источник

N

Nikolay in Data Engineers
Не знаком с термином- это что? (Про transient backward compatible).
источник