Ну и сомневаюсь что эти пару наносекунд дадут увеличение перфоманса больше чем на 0.001%
с таким подходом у тебя соберется много неоптимизированного кода. да и люди умножение матриц с n^3 на n^2.8 оптимизировали и радовались. в данном контексте вопрос про "правильный" подход.
с таким подходом у тебя соберется много неоптимизированного кода. да и люди умножение матриц с n^3 на n^2.8 оптимизировали и радовались. в данном контексте вопрос про "правильный" подход.
Если есть требование оптимизации до наносекунды, то нужно писать не на питоне🤷🏿♂