Телеграмм чат группы scalability

Да, но сами NVMe всё ещё дороже обычных SSD. И нельзя исключать, что у кого-то базы работают даже на HDD. Вопрос был скорее в том, насколько часто в практике встречается случай, когда данные требуется синкать на каждый запрос, и никакая другая схема обеспечения отказоустойчивости невозможна?

Я опросил знакомых программистов, и только один сказал, что видел fsync один раз в каком-то проекте Mail.ru, но и там его быстро отключили, так как всё тормозило

источник

14:22пожаловаться #11

Vitaly Isaev in Scalability Camp — распределенные системы и HPC

Всё на усмотрение клиента. Если клиент обладает большим количеством денег и железа для обеспечения такого уровня отказоустойчивости, то можем включить. Но пока такие не встречались. Обычно люди экономят на железе и соглашаются на риски

источник

14:24пожаловаться #12

Paul Rudnitskiy in Scalability Camp — распределенные системы и HPC

вообще насколько я помню, большинство DBE сами управляют кешами и взаимодействием с дисковой подсистемой и тот же flush/fsync делают сами в критический момент. В свое время было много сложностей с виртуализацией, потому что виртуализированный сторадж только имитирует fsync :)

источник

14:26пожаловаться #13

Slach in Scalability Camp — распределенные системы и HPC

не на каждый запрос а на каждый коммит, разница есть

=) ну, если вы считаете какую нибудь лабуду, то можно и отключить
а если бабло, то я бы все таки не советовал

источник

14:27пожаловаться #14

Vitaly Isaev in Scalability Camp — распределенные системы и HPC

ну а в WALах разве не каждый запрос надо сохранять (синхронно) ?

источник

14:28пожаловаться #15

Slach in Scalability Camp — распределенные системы и HPC

в WAL'ах, пишется если что содержимое транзакции, чтобы ее потом можно было проиграть, может быть несколько запросов в одной транзакции

fsync делается в финале транзакции а не в финале запроса, так понятнее? ;)

источник

14:30пожаловаться #16

Vitaly Isaev in Scalability Camp — распределенные системы и HPC

Ага, спасибо

источник

14:30пожаловаться #17

Slach in Scalability Camp — распределенные системы и HPC

и еще для PostgreSQL не стоит synchronous_commit путать с fsync

вот его вполне себе можно отключать off или ставить в local

источник

14:34пожаловаться #18

Nikolay in Scalability Camp — распределенные системы и HPC

Могу сказать, как fsycn и запись в WAL работает в oracle. Но там все настолько хитро, что нет наверное человека вне оракла, кто это понимает до конца т.к это все еще завязано на файловую систему может быть. Поправите, если где ошибусь. Чтобы минимизировать стоимость fsync он пишет в директ моде т.е при открытии файла. он открывает его с флагом - O_DIRECT (since Linux 2.4.10) Try to minimize cache effects of the I/O to and from this file. И еще он выставляет O_SYNC Write operations on the file will complete according to the requirements of synchronized I/O file integrity completion (by contrast with the synchronized I/O data integrity completion provided by O_DSYNC.) А при записи он батчует. В целом там идея такая, что пачк по времени или размеру. что раньше( как и в кафке). И в целом получается, что у него fsync уже дешевле выходит. Он синкает не всю транзакцию, а пачку.

источник

15:11пожаловаться #19

Vitaly Isaev in Scalability Camp — распределенные системы и HPC

Ну то есть можно продолбать несколько транзакций, если не успели синкнуть последнюю пачку?

источник

15:15пожаловаться #20