как я понимаю, что CU управляет несколькими wavefront'ами, то бишь на каждый пускает какие-то свои шейдера. и как-то не ложится несколько simd модулей (допустим это отдельный модуль, потому что надо выполнять за 4 такта весь вэйфронт и он как-то дублирует команды, хз)