вопрос: что это было и как этого избежать в будущем?
как уже обратили внимание, проблема скорее всего была вызвана дропами ARP из-за превышения cpu-rx-ratelimit, при этом могли бы пострадать и транзитные, это можно решить применением local-arp enable
любопытно отработал ли loopback-detection, при корректной настройке он должен был за секунды отрезать сегмент с петлей