Size: a a a

Scalability Camp — чат про распределенные системы (и про HPC)

2021 March 23

AT

Andrey Terekhov in Scalability Camp — чат про распределенные системы (и про HPC)
Ruslan Chekalov
А потом данных откуда?
SNS/SQS в основном
источник

AT

Andrey Terekhov in Scalability Camp — чат про распределенные системы (и про HPC)
Ruslan Chekalov
А потом данных откуда?
Вопрос же про поток данных?
источник

RC

Ruslan Chekalov in Scalability Camp — чат про распределенные системы (и про HPC)
да
источник

RC

Ruslan Chekalov in Scalability Camp — чат про распределенные системы (и про HPC)
Ну если тебе все же необходимо отдельное хранилище для новых данных, то выглядит оправдано. Вообще можно же считывать в память данные, или сразу на диск, отсылать файлик, и акать  весь батч
источник

RC

Ruslan Chekalov in Scalability Camp — чат про распределенные системы (и про HPC)
У меня такая трабла с кликхаусом, ему аналогично лучше писать батчи редко, чем по одной записи часто. Решил это средствами кафки, просто считываю батч раз в N времени
источник

AT

Andrey Terekhov in Scalability Camp — чат про распределенные системы (и про HPC)
Ruslan Chekalov
Ну если тебе все же необходимо отдельное хранилище для новых данных, то выглядит оправдано. Вообще можно же считывать в память данные, или сразу на диск, отсылать файлик, и акать  весь батч
Батч внесёт задержки или фрагментацию.
Вспомнил про Kinesis ещё кстати
источник

AT

Andrey Terekhov in Scalability Camp — чат про распределенные системы (и про HPC)
Ruslan Chekalov
У меня такая трабла с кликхаусом, ему аналогично лучше писать батчи редко, чем по одной записи часто. Решил это средствами кафки, просто считываю батч раз в N времени
Да, если под требования попадает, мне этот вариант тоже нравится
источник

N

Nikolay in Scalability Camp — чат про распределенные системы (и про HPC)
Andrey Terekhov
Всем привет!
Подскажите, может есть подход под задачу — есть поток данных, нужно иметь возможность их держать в бд для аналитики (aws athena) и при этом иметь доступ к реалтайм данным. В athena не очень получается эффективно вставлять потоковые данные по событию — создаётся по файлику на s3 на каждый insert.
Подумал что можно прикрутить небольшой постгрес, партицировать посуточно и партиции старше 3х дней скидывать на s3 для athena.
При запросах с фронта бэк бы объединял результаты с двух баз с учётом какой временной период выбран.
Это прям кривой велосипед?)
Clickhouse?
источник

AT

Andrey Terekhov in Scalability Camp — чат про распределенные системы (и про HPC)
Nikolay
Clickhouse?
Был бы management инстанс у амазона, то может быть взял его, да)
источник

N

Nikolay in Scalability Camp — чат про распределенные системы (и про HPC)
Andrey Terekhov
Был бы management инстанс у амазона, то может быть взял его, да)
А Redshift сильно хуже?
источник

AT

Andrey Terekhov in Scalability Camp — чат про распределенные системы (и про HPC)
Nikolay
А Redshift сильно хуже?
я только с CH имел опыт, RedShift как вариант держу
источник

S

Slach in Scalability Camp — чат про распределенные системы (и про HPC)
Andrey Terekhov
Был бы management инстанс у амазона, то может быть взял его, да)
возьмите altinity.cloud
это будет AWS EKS + clickhouse-operator + мониторинг
источник

S

Slach in Scalability Camp — чат про распределенные системы (и про HPC)
Nikolay
А Redshift сильно хуже?
источник
2021 March 24

at

agusik t in Scalability Camp — чат про распределенные системы (и про HPC)
18
источник
2021 March 27

N

Nikolay in Scalability Camp — чат про распределенные системы (и про HPC)
источник

N

Nikolay in Scalability Camp — чат про распределенные системы (и про HPC)
Хорошо обьясняет про саги.
источник

RC

Ruslan Chekalov in Scalability Camp — чат про распределенные системы (и про HPC)
источник

RC

Ruslan Chekalov in Scalability Camp — чат про распределенные системы (и про HPC)
@lynxed хочешь поднять бабла?
источник

AB

Aleksandr Borgardt in Scalability Camp — чат про распределенные системы (и про HPC)
+1 видов огонь
источник

ZO

Zlata Obukhovskaya in Scalability Camp — чат про распределенные системы (и про HPC)
Ruslan Chekalov
@lynxed хочешь поднять бабла?
М?
источник