Короче, всё сводится к тому, что как только мы поняли, что ключевое свойство – это компактность, нам открывается возможность убрать тысячи костылей и создать подходящую обобщённую абстракцию (в данном случае теорему). А до этого момента мы будем вынуждены обрабатывать разные случаи отдельно.
Мне это видится так.
Только не костылей, а разных реализаций на разных "особенных" свойствах. Мы не понимали, как связаны такие похожие теоремы, при этом каждую из них доказывали независимо, задействуя аксиомы, которые не нужны