Общий принцип такой: 0) Очень много знать об архитектуре CPU 1) Написать хороший код 2) Измерить производительность 3) Молиться, чтоб оно работало на других процах
я думал что в языках есть какие-нибудь низкоуровненвые либы или макросы которые позволяют помогать процу понимать какие данные сейчас будут использоваться и их надо загрузить в кэш
я думал что в языках есть какие-нибудь низкоуровненвые либы или макросы которые позволяют помогать процу понимать какие данные сейчас будут использоваться и их надо загрузить в кэш
Нельзя управлять кешем вручную. Даже операционке только самый минимум будет доступен (возможность сбросить этот кеш). Это верно для ARM/AArch64/x86-64. Долей остальных архитектур можно пренебречь.