Size: a a a

2020 February 25

N

Nikolay in Data Engineers
Anton Zadorozhniy
если у вас GCS+Dataflow+BQ то у вас очень современная аналитическая архитектура, но там нет кубера или S3))
Расшифруйте абревиатуры )
источник

DZ

Dmitry Zuev in Data Engineers
Anton Zadorozhniy
если у вас GCS+Dataflow+BQ то у вас очень современная аналитическая архитектура, но там нет кубера или S3))
Вместо датафлоу Спарк+кубер например
источник

AZ

Anton Zadorozhniy in Data Engineers
Nikolay
Расшифруйте абревиатуры )
google cloud store, google dataflow, bigquery
источник

DM

Daniel Matveev in Data Engineers
Anton Zadorozhniy
не S3, а объектный сторадж в целом, ну и кубер нужно знать только каким-то опсам, пользователя кубер не должен волновать вообще
согласен, кубер в нынешнем виде должен умереть
источник

N

Nikolay in Data Engineers
Почему кубер должен умереть ?
источник

DZ

Dmitry Zuev in Data Engineers
Daniel Matveev
согласен, кубер в нынешнем виде должен умереть
А что с ним не так?
источник

N

Nikolay in Data Engineers
Кубер выглядит как очень живеньким и конкурентов нет
источник

AZ

Anton Zadorozhniy in Data Engineers
Dmitry Zuev
Вместо датафлоу Спарк+кубер например
ну вы как архитектор хотите максимально спрятать кубер от пользователя, но смысл правильно уловили, должен быть серверлесс/селфсервис АПИ для сабмита джобов, что-то на пути от датабрикс селфсервис к авс глу
источник

DM

Daniel Matveev in Data Engineers
Dmitry Zuev
А что с ним не так?
вопрос что с ним так, что для пользователя что для сопровождающего

избыточная сложность со всех сторон
источник

AZ

Anton Zadorozhniy in Data Engineers
Daniel Matveev
согласен, кубер в нынешнем виде должен умереть
я не говорил что он должен умереть, просто он должен быть гораздо менее user facing, сами идеологи кубера идут по этому пути, см всю идею и экосистему операторов
источник

ME

Mikhail Epikhin in Data Engineers
Anton Zadorozhniy
ну вы как архитектор хотите максимально спрятать кубер от пользователя, но смысл правильно уловили, должен быть серверлесс/селфсервис АПИ для сабмита джобов, что-то на пути от датабрикс селфсервис к авс глу
ну у gcp уже можно dataproc задание засабминить в k8s :)
источник

DZ

Dmitry Zuev in Data Engineers
Mikhail Epikhin
ну у gcp уже можно dataproc задание засабминить в k8s :)
Но зачем?
источник

N

Nikolay in Data Engineers
Ну под капотом останется кубер
источник

ME

Mikhail Epikhin in Data Engineers
Dmitry Zuev
Но зачем?
ну чтобы не поднимать отдельный кластер, не платить, чтобы доутилизировать существующие мощности
источник

N

Nikolay in Data Engineers
А использования кубера станет проще. Хотя куда проще. Пиши файлы и аплай
источник

DM

Daniel Matveev in Data Engineers
Anton Zadorozhniy
я не говорил что он должен умереть, просто он должен быть гораздо менее user facing, сами идеологи кубера идут по этому пути, см всю идею и экосистему операторов
я подбрасываю по дороге, но суть в том что сейчас взаимодействие с системой типа упрощающей жизнь все равно в костылях приходится облепливать
источник

AZ

Anton Zadorozhniy in Data Engineers
условно это как какие-нибудь cgroups или linux kernel namespace, они есть и прекрасно работают, но люди занимающиеся даже низким уровнем уже не так в них погружаются, спасибо container runtimes
источник

N

Nikolay in Data Engineers
Ну да. Докер все это скрывает успешно .
источник

DZ

Dmitry Zuev in Data Engineers
Daniel Matveev
вопрос что с ним так, что для пользователя что для сопровождающего

избыточная сложность со всех сторон
Основания моя претензия это дефолтный шедулер, который для спарка не оч
источник

AZ

Anton Zadorozhniy in Data Engineers
Mikhail Epikhin
ну чтобы не поднимать отдельный кластер, не платить, чтобы доутилизировать существующие мощности
в концепции будущего вы вообще не должны платить за недоутилизированные мощности, см EKS + Fargate
источник