вот у AVX без всяких ноутов есть троттлинг. Причем на несколько инструкций (десяткой инструкций?) вперед после того, как ты потрогал AVX. Так что если у тебя смешанная нагрузка, то векторные операции могут в результате обойтись дороже.
Это ж все платформоспецифичное, АМД например в тротлинг не идёт, но частоту почти до базовых скидывает.
в нашем случае 99% нагрузки было на AVX, так что юзкейс прекрасный. Но если 100 независимых пруфов попытаться запараллелить районом - сразу просир, потому что каждый пруф - 1 мс.
Ну 1мс - это ж поидее нормальный порядок для параллелизации? Можно же по N пруфов валидировать в таске. Должно дать преимущество.