Как минимум еще исходная фотка до кучи. А дальше зависит от того, что вы делаете и планируете делать, и какой инструмент используете.
Если у вас самописный разметчик, то, понятно дело вы вольны в выборе форматов и прочего - это второстепенно.
Для задачи, если вы планируете рисовать рамку поверх того, что детектируете, то вам может хватить просто координат, но есть нюансы, которые, например, можно по статьям посмотреть, как выше сказали