Телеграмм чат группы scalability

Ruslan Chekalov in Scalability Camp — чат про распределенные системы (и про HPC)

16:39пожаловаться #1

RC

Саша наверное уже удалил

16:39пожаловаться #2

2021 March 31

N

Nikolay in Scalability Camp — чат про распределенные системы (и про HPC)

Интересная архитектру у Amazon Aurora. У них нет вообще checkpoints, к которым вот все уже привыкли. При записи в WAL они не батчуют. Raft, Paxos не используют. У них есть один мастер, который пишет WAL в 6 разных мест и использует кворум w=4 and r = 3. такой кворум они выбрали, чтобы переживать падение одного DC + 1 сторадж.На запись у них 200K транзакций выдает на Single Master ( в видео у них указанна конфигурация EC2, которая для этого использовалась). Так я понял, что если с мастером что-то происходит, то они перезапускают EC2 инстанс с мастером. Не знаю как они делают failure detection для мастера. Если у кого есть опыт с Aurora или знаете, какие-то нюансы как она работает = поделитесь плиз. https://www.youtube.com/watch?v=U42mC_iKSBg

AWS re:Invent 2018: [REPEAT 1] Deep Dive on Amazon Aurora with MySQL Compatibility (DAT304-R1)

Amazon Aurora is a fully managed relational database service that combines the speed and availability of high-end commercial databases with the simplicity an...

08:46пожаловаться #3

N

Nikolay in Scalability Camp — чат про распределенные системы (и про HPC)

Multi-master у них тоже есть.

Alexander Shinkarenk... in Scalability Camp — чат про распределенные системы (и про HPC)

09:01пожаловаться #4

AS

Nikolay

Интересная архитектру у Amazon Aurora. У них нет вообще checkpoints, к которым вот все уже привыкли. При записи в WAL они не батчуют. Raft, Paxos не используют. У них есть один мастер, который пишет WAL в 6 разных мест и использует кворум w=4 and r = 3. такой кворум они выбрали, чтобы переживать падение одного DC + 1 сторадж.На запись у них 200K транзакций выдает на Single Master ( в видео у них указанна конфигурация EC2, которая для этого использовалась). Так я понял, что если с мастером что-то происходит, то они перезапускают EC2 инстанс с мастером. Не знаю как они делают failure detection для мастера. Если у кого есть опыт с Aurora или знаете, какие-то нюансы как она работает = поделитесь плиз. https://www.youtube.com/watch?v=U42mC_iKSBg

AWS re:Invent 2018: [REPEAT 1] Deep Dive on Amazon Aurora with MySQL Compatibility (DAT304-R1)

Amazon Aurora is a fully managed relational database service that combines the speed and availability of high-end commercial databases with the simplicity an...

Aurora не пишет данные в 6 мест. У нее под капотом спец хранилище от AWS, которое делает репликацию в остальные 5 мест. Поэтому повторить Aurora за пределами AWS невозможно, нет таких открытых продуктов.

Не знаю насколько там больше информации, но вот в этом году рассказывали на русском:
https://www.youtube.com/watch?v=vfLqez8Ydmw

Чем Amazon Aurora лучше вашей базы данных (DevDay 2020)

Вы, наверное, уже слышали об Amazon Aurora - управляемой базе данных, совместимой с MySQL и с PostgreSQL. Так в чем же ее преимущество? Прежде всего, Aurora ...

Iliya Ch in Scalability Camp — чат про распределенные системы (и про HPC)

15:46пожаловаться #5

IC

12

Денис Черемисов... in Scalability Camp — чат про распределенные системы (и про HPC)

19:46пожаловаться #6

ДЧ

12

21:27пожаловаться #7

N

Nikolay in Scalability Camp — чат про распределенные системы (и про HPC)

Alexander Shinkarenko

Aurora не пишет данные в 6 мест. У нее под капотом спец хранилище от AWS, которое делает репликацию в остальные 5 мест. Поэтому повторить Aurora за пределами AWS невозможно, нет таких открытых продуктов.

Не знаю насколько там больше информации, но вот в этом году рассказывали на русском:
https://www.youtube.com/watch?v=vfLqez8Ydmw

Чем Amazon Aurora лучше вашей базы данных (DevDay 2020)

Вы, наверное, уже слышали об Amazon Aurora - управляемой базе данных, совместимой с MySQL и с PostgreSQL. Так в чем же ее преимущество? Прежде всего, Aurora ...

Спасибо большое. А если она не пишет в 6 мест, а пишет в 1 место и это одно отвечает за репликацию в остальные 5, то получается, что координатор живет там ( в этом 1 месте). Тогда это leader based топология репликации. И встает вопрос, что будет происходить, если этот лидер упадет. А они утверждают, что у них нет ни Raft ни Paxos и тому подобного. Мне изначально казалось, что роль координатора выполняет master, который пишет в эти 6 мест параллельно, а не в одно из них. И мастер отслеживает наличие кворума т.е когда 4 из его 6 запросов записи завершатся, то он считает запись успешной.

Rinat Shigapov in Scalability Camp — чат про распределенные системы (и про HPC)

22:29пожаловаться #8

2021 April 02

RS

Про Amazon Aurora Global и CockroachDB - https://www.cockroachlabs.com/blog/just-how-global-is-amazon-aurora

TL;DR Not only does CockroachDB offer the lowest price for OLTP workloads, it does so while offering the highest level of consistency. To get a better understanding of the numbers, check out this blog post about the price of running OLTP workloads in CockroachDB and Aurora. In short, the CockroachDB cost includes 3 machines, as well as a DBA's salary to monitor and maintain the cluster.

Cockroach Labs

Just How "Global" Is Amazon Aurora vs CockroachDB?

Many databases claim to be "global." If you are evaluating products that promise global capabilities -- like CockroachDB or Amazon Aurora -- they should have these three requirements.

Nikolay in Scalability Camp — чат про распределенные системы (и про HPC)

10:45пожаловаться #9

N

OLTP в наше время все умеют, вы дайте толковый OLAP не по цене паровоза. Clickhouse? Apache Kudu? Что ещё?

Slach in Scalability Camp — чат про распределенные системы (и про HPC)

10:48пожаловаться #10

S

да дофига всего, но тебе не понравится =) выглядит как поделка потому что
у китайцев даже клоны clickhouse есть =) типа https://tensorbase.io

есть Citus для Postgres как columnar storage
есть https://github.com/taosdata/TDengine
есть Baidu Palo он же https://github.com/apache/incubator-doris
есть https://github.com/pingcap/tidb - тоже китайцы
для савсем неструктурированного (Parquet, Avro в HDFS) есть prestodb.io и sparkSQL

в целом бери clickhouse если понимаешь как его готовить ;)

An open-source big data platform designed and optimized for the Internet of Things (IoT). - taosdata/TDengine

taosdata/TDengine

Nikolay in Scalability Camp — чат про распределенные системы (и про HPC)

12:44пожаловаться #11

N

Slach

да дофига всего, но тебе не понравится =) выглядит как поделка потому что
у китайцев даже клоны clickhouse есть =) типа https://tensorbase.io

есть Citus для Postgres как columnar storage
есть https://github.com/taosdata/TDengine
есть Baidu Palo он же https://github.com/apache/incubator-doris
есть https://github.com/pingcap/tidb - тоже китайцы
для савсем неструктурированного (Parquet, Avro в HDFS) есть prestodb.io и sparkSQL

в целом бери clickhouse если понимаешь как его готовить ;)

An open-source big data platform designed and optimized for the Internet of Things (IoT). - taosdata/TDengine

taosdata/TDengine

Нудык хочется выбор же. Есть SingleStore (бывший MemSQL), но он тоже ну такое, ещё и дорогой

Slach in Scalability Camp — чат про распределенные системы (и про HPC)

12:57пожаловаться #12

S

Nikolay

Нудык хочется выбор же. Есть SingleStore (бывший MemSQL), но он тоже ну такое, ещё и дорогой

ну tidb в OLAP режиме и citusdb пощупайте

Rinat Shigapov in Scalability Camp — чат про распределенные системы (и про HPC)

13:27пожаловаться #13

2021 April 03

RS

Slach

да дофига всего, но тебе не понравится =) выглядит как поделка потому что
у китайцев даже клоны clickhouse есть =) типа https://tensorbase.io

есть Citus для Postgres как columnar storage
есть https://github.com/taosdata/TDengine
есть Baidu Palo он же https://github.com/apache/incubator-doris
есть https://github.com/pingcap/tidb - тоже китайцы
для савсем неструктурированного (Parquet, Avro в HDFS) есть prestodb.io и sparkSQL

в целом бери clickhouse если понимаешь как его готовить ;)

An open-source big data platform designed and optimized for the Internet of Things (IoT). - taosdata/TDengine

taosdata/TDengine

https://github.com/ballista-compute/ballista

Для недолгого хранения данные можно сохранять в Arrow IPC (Feather)

Distributed compute platform implemented in Rust, and powered by Apache Arrow. - ballista-compute/ballista

ballista-compute/ballista

Aleksandr Borgardt in Scalability Camp — чат про распределенные системы (и про HPC)

19:22пожаловаться #14

AB

Балиста с точки зрения архитектура хорошая, а реализация подкачал.

Rinat Shigapov in Scalability Camp — чат про распределенные системы (и про HPC)

19:45пожаловаться #15

RS

Aleksandr Borgardt

Балиста с точки зрения архитектура хорошая, а реализация подкачал.

Что не понравилось в реализации?

Pavel Bukhmatov in Scalability Camp — чат про распределенные системы (и про HPC)

19:52пожаловаться #16

2021 April 04

PB

Всем привет! Собрал в 1 месте краткую историю CAP теоремы и нескольких работ вокруг неё https://telegra.ph/Istoriya-CAP-teoremy-04-03
Вроде сильно не наврал. Делюсь)

Telegraph

История CAP теоремы

С чего начался CAP Недавно (~ в середине марта 2021 года) меня триггернуло на фразу "CAP теорема — это миф" от интервьювера. В этом посте мы поговорим о том, как вообще эта теорема появилась на свет, что она значит, и немного затронем важность ограничений, при чтении любых работ по Computer Science. Началось все в 2000 году, когда Eric Brewer (ныне — VP of infrastructure в гугле) выступил вот с этой презентацией на кейноуте симпозиума по принципам распределенных систем (PODC). Это большая крутая конференция…

Vitaly Isaev in Scalability Camp — чат про распределенные системы (и про HPC)

11:07пожаловаться #17

VI

Pavel Bukhmatov

Всем привет! Собрал в 1 месте краткую историю CAP теоремы и нескольких работ вокруг неё https://telegra.ph/Istoriya-CAP-teoremy-04-03
Вроде сильно не наврал. Делюсь)

Telegraph

История CAP теоремы

С чего начался CAP Недавно (~ в середине марта 2021 года) меня триггернуло на фразу "CAP теорема — это миф" от интервьювера. В этом посте мы поговорим о том, как вообще эта теорема появилась на свет, что она значит, и немного затронем важность ограничений, при чтении любых работ по Computer Science. Началось все в 2000 году, когда Eric Brewer (ныне — VP of infrastructure в гугле) выступил вот с этой презентацией на кейноуте симпозиума по принципам распределенных систем (PODC). Это большая крутая конференция…

👍

С чего начался CAP Недавно (~ в середине марта 2021 года) меня триггернуло на фразу "CAP теорема — это миф" от интервьювера. В этом посте мы поговорим о том, как вообще эта теорема появилась на свет, что она значит, и немного затронем важность ограничений, при чтении любых работ по Computer Science. Началось все в 2000 году, когда Eric Brewer (ныне — VP of infrastructure в гугле) выступил вот с этой презентацией на кейноуте симпозиума по принципам распределенных систем (PODC). Это большая крутая конференция…

12:00пожаловаться #18

N

Nikolay in Scalability Camp — чат про распределенные системы (и про HPC)

Pavel Bukhmatov

Всем привет! Собрал в 1 месте краткую историю CAP теоремы и нескольких работ вокруг неё https://telegra.ph/Istoriya-CAP-teoremy-04-03
Вроде сильно не наврал. Делюсь)

Telegraph

История CAP теоремы

Оличная статья. Спасибо

Alexander Petrovsky in Scalability Camp — чат про распределенные системы (и про HPC)

17:24пожаловаться #19

AP

А кто нить раскурил pacelc как продолжение cap? Какая-то крайне мутная штука