Boris может ты знаешь. Есть плюсовый std::bitset, есть ли разница в плане кешмиссов между итерацией по нему в цикле 0->N и N->0? он небольшой, 512 бит, и должен весь влезать в кешлайн по идее. Но обращения к этому циклу очень частые
Я с ходу не скажу, КМК, это зависит от конкретного компилятора, оптимизаций и процессора.
Самое простое, что делается в таких случаях, пишется простейшая програма, которая гоняет цикл, и к ней присобачивается профайлер, на линуксе - oprofile или cachegrind. Или интел студио какой-нибудь, если есть он. и смотришь, что там с кэш миссес.