Добрый день, переодически консьюмер падает с таймаутом в 5 секунд на OFFSET_COMMIT. По дебаг логам нашел, что таймаут 5сек происходит в RemoteTimeMs, то есть на подтверждении комита фолловерами.
Знаю про параметр брокера "
offsets.commit.timeout.ms".
Но хотелось бы разобраться в root cause. Пока убедился что:
- CPU/RAM/Network/DiskIO проблем нет.
- Метрики "NetworkProcessor" и "RequestHandler" почти у 1
- в метриках RequestMetrics нет никаких пиков в 99.9 персентили, то есть эти случаи охватывает менее 0.01% сообщений
Посоветуйте пожалуйста в какие стороны еще можно покопать.