Сергей Якушев
Мне такую фишку один раз удалось словить на реплике:
Было длительное отключение электричества, мастер долго работал не имея возможности за архивировать транзакции и не видя слейва. Хранилище транзакции и слейв были в poweroff.
Когда питание восстановилось сначала стартануло хранилище транзакций. Потом стартналул сервер с репликой (он свои файловые системы долго проверял, минут 20) и сервис postgres был убит стартовыми скриптами.
Я этот момент отследил и добился работы стартовых скриптов перенаприв логи в pg_log:
logging_collector = on
log_directory = 'pg_log'
log_filename = 'postgresql-%a.log'
Скрипты выдали все ОК. Postgres на реплике запустился и еще час мастер догонял пока не выдала: "готов к подключению".
P.S. если я ничего не путаю
P.S.S. у DT именно так и настроено, но может старый постргес и новый линукс.. х.з.
Я это к чему все говорю: а вы как-то обходите этот глюк со стартовыми скриптами (увеличения лимита, настройка postgres.conf)?
в зависимости от ситуации — или увеличиваем лимит или, например, ставим restart=always (это конечно для очень некритичных систем) - каждый перезапуск постгрес продвигается в проверке чуть дальше и в итоге стартует.