Правильный это:
1) Однозначно толкуемый.
2) Прозрачный.
3) Легко воспроизводимый.
Дальше начинается интересное, потому что соотношение (и ожидаемые уровни) этих параметров зависит и от системы, и от команды.
Где-то хватает полноценного описания сценария, шага падения, тестовых данных и скриншота, например.
На другом проекте мы пилили штуку, которая позволяла сделать локальный replay теста по одной команде.