ну для этого надо было приходить и слушать, но вкратце так:
"глупо сравнивать языки, еще более глупо выбирать языки на базе микробенчмарков, а не тестирования вашего приложения. но никто не может нас остановить. взяли рандомный memory-bound тест на Си++ (априорно не помещающийся в L3 кеш. и портировали это как есть в Го. Такой порт в лоб исполнялся примерно в 2 раза дольше на Го. (что не атк уж и плохо). Обращаем внимание что процессорных ресурсов в Го программе было потрачено в 3 раза (из-за параллельного GC). Если немного поработать над качеством Го кода можем таки получить время даже быстрее наивного Си++ кода, но если порабоать над Си++ кодом (сделав статические массссивы) то справедливость опять торжествует и наши побеждают.
Выводов сделать больших не можем, качество кода генератора Го - адекватное. (Не проигрывает в случае memory-bound задач, как минимум). Тестируйте и выбирайте на своем кейсе отдельно"
Спасибо за ответ. Я посмотрел на perf stat обоих вариантов и увидел сплошные LLC/branch predictor misses.
Напоминает историю времен prescott, когда специально писали код с большим числом условных переходов, что приводило к постоянному сбросу конвеера