Интересная архитектру у Amazon Aurora. У них нет вообще checkpoints, к которым вот все уже привыкли. При записи в WAL они не батчуют. Raft, Paxos не используют. У них есть один мастер, который пишет WAL в 6 разных мест и использует кворум w=4 and r = 3. такой кворум они выбрали, чтобы переживать падение одного DC + 1 сторадж.На запись у них 200K транзакций выдает на Single Master ( в видео у них указанна конфигурация EC2, которая для этого использовалась). Так я понял, что если с мастером что-то происходит, то они перезапускают EC2 инстанс с мастером. Не знаю как они делают failure detection для мастера. Если у кого есть опыт с Aurora или знаете, какие-то нюансы как она работает = поделитесь плиз.
https://www.youtube.com/watch?v=U42mC_iKSBg