Очевидно, что максимально эффективный код получается на ассемблере.
кстати, чтобы написаный код на асме был быстрее сгенреного компилятором надо нехуйово-много знать, вот совсем много.
То что можно сделать в казуальном режиме — это по к-ву кода оптимизировать, но не факт что это будет самый быстрый код