если затрагивать минимально возможное кол-во ресурсов то кратко описать можно так: при остановке подов (находящихся под нагрузкой) мы всё равно получаем ошибки при чтении на сокетах. Воспроизвести можно так:
1. Берём кластер (желательно на до или ему подобных)
2. Приложение(пускай отдаёт хелоу ворлд) на го, умеющее останавливать accept(по сигналу), при продолжении обработки существующих соединений.
3. Два ресурса, деплоймент и сервис (для простоты берём node port), при этом деплой мент умеет сигнализировать приложению об остановке и ждать завершения работы подов (так же настроен readness параметр).
После этого запускаешь один под и натравливешь на него вкр, пока без перезапуска) Если нет ошибок можно приступить к тестированию.
Поднимаешь n подов, натравливаешь wrk, останавливаешь m, m меньше чем n. Наблюдаешь ошибки при чтении, а значит кубер отключает от сервиса поды ранее чем они завершили работу. Как то так.