SRE - это конкретное воплощение принципов DevOps. SRE отвечает за достижение SLO с помощью SLI с целью соблюдения SLA бизнеса перед клиентами. SRE посвящают как минимум 50% времени разработке решений, позволяющих достигать SLO без участия человека. Это может быть либо какой-нибудь костыль, следящий за приложением и перезапускающий это приложение в случае сбоя(привет, k8s), либо же доработка самого приложения с целью повышения надежности. Например, добавление повторных попыток соединения с соседним микросервисом в случае, если часть данных теряется из-за проблем с сетью у провайдера(на которые не повлиять). SRE - это такие dev+ops инженеры, которые часть(половину или менее) времени занимаются привычной эксплуатацией в ручном режиме, а остальное время посвящают разработке таких решений, которые минимизируют ручные операции. Тем самым постоянно тянут одеяло c Ops в Dev. Это я только первые 10% SRE Book прочитал =))