Я понимаю что надо писать юнит тесты, юай тесты медленные, джава топ и все такое. И в идеальном мире код вообще писать ненадо :)
Между юнитами и юай могут быть интеграционные тесты. Они по скорости ближе к юнитам, но проверяют логику нескольких модулей. Я делал несколько немаленьких датасетов для таких задач.
Для (хорошего) разработчика не проблема соорудить код который будет гонять именно логику по данным, беря эти данные из каких-то файлов (csv, xml, json). Это "о-маленькое" от его собственного кода.
Емнип,
~165 проверок прогонялись секунд за 40-45,
~360 минуты за две.
Стабильность была 100% (в отличие от UI проверок на Аппиуме), фидбек разработчикам скорейший и наглядный.
Если такого даже не начинать делать, будут прогоны UI-проверок на несколько часов, и хорошо если они будут стабильны.