MaxGraey
Самые медленные операции в таких задачах как работа с сетью или BD - это IO, а так же системные вызовы. Перенос всего на Ring 0 (микроядро) даст куда более заметныйй эффект, чем оптимизации ALU / FPU (числодробилки), не находите?
Да уж ладно, в JVM работой в оптимизирующих компиляторах никто б не запаривался в таких условиях. Но нет, производительность "чистого" кода ещё как важна, без I/O и прочей системщины. Там за единицы процентов на больших ворклоадах медали раздают. А переносить 10 мегастрок энтерпрайзного мишшн-критикал кода на FPGA, GPU, да и в нулевое кольцо -- это "безумству храбрых поём мы песню" ;)