репликация менеджится двумя потоками: io (который льет бинлоги с мастера(-ов)) и sql (который применяет запросы из бинлога). если у тебя падает репликация, то нужно смотреть какой из потоков упал. если упал io, то данные уже не льются с мастера. если же упал sql, то данные продолжают литься, а не применяются. даже если неделю не чинить, то все равно вам без разницы отротируются ли бинлоги на мастере или нет. если вы останавливаете реплику руками, то вы можете стопать как целиком реплику, так и отдельный поток. если у стопнули мускул, то после рестарта она сама начнет с того места где закончила. если вы ресетаете слейв, то в логах мускула вы найдете позицию на которой ресетнули и с нее можно будет начать. ну, и как финал, можно всегда иметь binlog server, который пулит логи с мастера и хранит у себя долго, а реплики читают с него. в дополнении отмечу, что скипать ошибки - путь в никуда.