Size: a a a

2020 February 25

S

Serg Slipushenko in Data Engineers
Можно аргументы?
источник

DZ

Dmitry Zuev in Data Engineers
Serg Slipushenko
Можно аргументы?
Есть писать под что угодно, не нужно забываться о ресурсах?
источник

DZ

Dmitry Zuev in Data Engineers
Например на ярне запустите
источник

DZ

Dmitry Zuev in Data Engineers
Да хоть на голой виртуалке, у вас ресурсы анлимные?
источник

DZ

Dmitry Zuev in Data Engineers
Как писать код и не понимать сколько он чего будет отжирать?
источник

S

Serg Slipushenko in Data Engineers
В кубере эффективный менеджмент ресурсов отличается от бареметал кластера
источник

AZ

Anton Zadorozhniy in Data Engineers
Serg Slipushenko
Иначе народ пишет не эффективный код и не понимает почему этот код фиговый
тут как с любым пирогом логических и физических абстракций, всегда будут пользователи которым нужно отжать максимум и они пойдут на более низкий уровень (как есть люди поднимающие на амазоне минио), но мы же тут говорим про мейнстрим и сервисы для пользователей, мое видение - больше серверлесс и доменных апишек, меньше ковыряния в планировщиках
источник

DZ

Dmitry Zuev in Data Engineers
Но как это влияет на разработку
источник

AZ

Anton Zadorozhniy in Data Engineers
успех датафлоу кмк мое видение подтверждает
источник

S

Serg Slipushenko in Data Engineers
Anton Zadorozhniy
тут как с любым пирогом логических и физических абстракций, всегда будут пользователи которым нужно отжать максимум и они пойдут на более низкий уровень (как есть люди поднимающие на амазоне минио), но мы же тут говорим про мейнстрим и сервисы для пользователей, мое видение - больше серверлесс и доменных апишек, меньше ковыряния в планировщиках
Ок, зависит от домена, согласен. Я говорю про процесинг большой даты в картинках
источник

DZ

Dmitry Zuev in Data Engineers
Serg Slipushenko
Ок, зависит от домена, согласен. Я говорю про процесинг большой даты в картинках
Чем он отличается от процессинга большой даты в чем либо другом?
источник

S

Serg Slipushenko in Data Engineers
Тем, что нужно не только что б работало, а что б работало эффективно и пользовало все ресурсы запрошенные в облаке
источник

UD

Uncel Duk in Data Engineers
Mikhail Epikhin
Я, конечно, свечку не держал, но вот ребята из minio сранивают себя с aws s3 и разница в латентности не очень большая https://blog.min.io/benchmarking-apache-spark-vs-aws-s3/
в тесте минио старый трюк ( nvme диски )
источник

S

Serg Slipushenko in Data Engineers
Ну и про другие домены я понимаю не так хорошо) мож там другая специфика
источник

ME

Mikhail Epikhin in Data Engineers
Uncel Duk
в тесте минио старый трюк ( nvme диски )
А в aws они не стоят?)
источник

UD

Uncel Duk in Data Engineers
Mikhail Epikhin
А в aws они не стоят?)
если бы с3 был целиком на флеше, он был бы заметно дороже
источник

S

Serg Slipushenko in Data Engineers
А он на флеше)
источник

DZ

Dmitry Zuev in Data Engineers
Serg Slipushenko
Тем, что нужно не только что б работало, а что б работало эффективно и пользовало все ресурсы запрошенные в облаке
Так никому не нужно, все же хотят платить побольше чтобы мериться размерами кластеров
источник

ME

Mikhail Epikhin in Data Engineers
Uncel Duk
если бы с3 был целиком на флеше, он был бы заметно дороже
ну так то да, но часто делают tiering. В момент заливки на ssd, а дальше уже перенос на hdd / anything else
источник

ME

Mikhail Epikhin in Data Engineers
Uncel Duk
если бы с3 был целиком на флеше, он был бы заметно дороже
В любом случае, вы пробовали minio? Как оно?
источник