Для тех, кто не следит - я извлекаю картинки из видео самостоятельно
Тебе надо как-то прописать в кадры реальное время. Это делает что-то в mapillary_tools. Я ей конвертировал видео с автомобильного сратора в кадры для мапилари, а время начала съёмки брал скриптом на питоне из имени видеофайла