Size: a a a

2019 October 14

VE

Vladimir E. in Data Engineers
Renarde
ну по сути кейс кажется больше зависит от хранилки, нежели от execution engine. По сути нужен быстрый upsert по ключу, тут миллион вариантов - HBase, Cassandra, Aerospike, если у вас денег много - Redis
Вот да,хотелось бы что нибудь легковесное, бесплатное и просто в поддержке. Скорость не так важна
источник

VE

Vladimir E. in Data Engineers
Hbase не хочу потому что Hadoop dependency
источник

AZ

Anton Zadorozhniy in Data Engineers
Vladimir E.
Вот да,хотелось бы что нибудь легковесное, бесплатное и просто в поддержке. Скорость не так важна
хорошее, бесплатное, и качественное.. хм, прям есть из чего выбрать..
источник

VE

Vladimir E. in Data Engineers
Нужно чтоб это ещё и с датабриксом работало например
источник

R

Renarde in Data Engineers
Vladimir E.
Вот да,хотелось бы что нибудь легковесное, бесплатное и просто в поддержке. Скорость не так важна
- бесплатное
- легковесное
- просто в поддержке
- без hadoop-deps

PosgreSQL,мм? Вопрос еще сколько данных и с какой скоростью это будет прирастать
источник

R

Renarde in Data Engineers
Vladimir E.
Нужно чтоб это ещё и с датабриксом работало например
вообще Databricks умеет в апдейты с помощью Delta Lake, но это вот вообще не про real-time, как мы в нашем проекте выяснили…
источник

VE

Vladimir E. in Data Engineers
Согласен, здесь больше oltp случай
источник

I

Igor in Data Engineers
если денег много то Redis?
источник

M

Mi in Data Engineers
Renarde
- бесплатное
- легковесное
- просто в поддержке
- без hadoop-deps

PosgreSQL,мм? Вопрос еще сколько данных и с какой скоростью это будет прирастать
Ну и по скорости не критично)
источник

R

Renarde in Data Engineers
мы вот в похожем кейсе пока посматриваем на ScyllaDB
источник

VE

Vladimir E. in Data Engineers
У постгреса вроде upsert не очень, но я не спец в нём, может можно как то оптимизировать
источник

VE

Vladimir E. in Data Engineers
А что у постгреса с масштабированием одной таблицы?
источник

R

Renarde in Data Engineers
Вот тут есть интересная статейка, в ней смотрят на Postgres,MonetDB, HyPer (не знаю что это), Redis и Aerospike в сравнении:
https://bigdata.uni-saarland.de/publications/GSD17_extended.pdf
источник

VE

Vladimir E. in Data Engineers
Кстати, а почему для редиса нужно много денег?
источник

VE

Vladimir E. in Data Engineers
Renarde
Вот тут есть интересная статейка, в ней смотрят на Postgres,MonetDB, HyPer (не знаю что это), Redis и Aerospike в сравнении:
https://bigdata.uni-saarland.de/publications/GSD17_extended.pdf
Спасибо, почитаю!
источник

R

Renarde in Data Engineers
Vladimir E.
Кстати, а почему для редиса нужно много денег?
ну вот в нашем кейсе мы прикидочно посчитали и вышло как хрустальный мост, но у нас объекты очень большие
источник

R

Renarde in Data Engineers
еще кстати может быть DynamoDB ваш кейс, но это если у вас нет burst-load
источник

VE

Vladimir E. in Data Engineers
Это по цене за хардвар и платная поддержка?
источник

VE

Vladimir E. in Data Engineers
Посчитали
источник

R

Renarde in Data Engineers
Vladimir E.
Это по цене за хардвар и платная поддержка?
мы считали по AWS калькулятору, предполагая использовать AWS ElastiCache с Redis backend
источник