Технически, можно отловить шаблонный код прохода по массиву и оптимизировать/распараллелить его. Но кто это делает (если делает), я не знаю. Вроде из статьи про Джулию, не следует, что они занимаются этим. А вот LLVM может что-нибудь от себя добавить