задача специфическая, т.к. во-первых, в разные периоды времени в течение года разная загрузка, еще могут быть дополнительные корреляции связанные с погодой например, или чем-нибудь еще (что-нибудь запретили или какое-то событие по определенному маршруту)
был опыт проведения подобных a/b-тестов со случайными влияниями, и это проиходило так:
- периоды тестирования одного и другого варианта сменяются один за другим, типа А - В - А - В - А - В итп пока не будет покрыт статистический значимый промежуток
- в нашем случае мы использовали периоды 2ч в течение дня, 2ч вариант А, 2ч вариант В, и так в течение пары недель, у нас данные быстрее собирались, но в вашем случае надо бы использовать во-первых побольше промежуток времени (пару месяцев примерно, но это можно рассчитать), плюс период проведения каждого варианта также длительное время
Ну допустим, автобусное расписание забито на неделю, по пн рейсы 1, 2 и 3, по вт и чт рейсы 4,5,6, по ср рейсы 7, только по чт 8 итп итп итп
и ну и можно сделать 3 дня вариант А, 3 дня вариант В, и так чередуем до тех пор, пока не получим статистически значимый результат.
чем меньше отклонение между результатами А и В, тем дольше проводить тестирование
где-то даже формулы и калькуляторы готовые есть, где можно исходя из разницы показаний посчитать стат.значимость, нужно ли больше измерений или уже хватит