Будет ещё L2 cache для сглаживания задержек DDR.
Просто не совсем понятно, правильно ли считать, что SRAM 128 бит 100МГц (частота для простоты) будет равнозначна DDR4 32 бита 200МГц и DDR4 16 бит 400МГц (с учётом ddr передачи данных).
По верхней теоретической границы будут равны. НО в том и теоретичность её. А на практике можно лишь приближаться к ней при обмене большими кусками данных. Если же доступ не большими кусками а случайный то DDR вдруг их превращается в тыкву и скорость падает просто катастрофически.