Мы не работаем с "единичными файликами", поэтому локально особо ничего не протестируешь. Для хранилищ плохо подходят стандартные методики тестирования принесенные из классической разработки ПО.
Вам чтобы логику трансформации протестировать обязательно надо 100500 файлов на hdfs и запуск через ярн? 5 локальных файлов из ресурсов в локальной сессии никаких не подойдут?