Ну профит будет только на числе горутин соответствующем числу ядер компа имхо.
Если 4 ядра, то да, в 4 раза быстрее (теоретически) будет.
Если сделать 400 горутин, то грубо говоря на ядро по 100 горутин будут планировщиком планироваться, но вряд ли профит будет ибо резка это cpu-bound задача. Возможно будет даже медленнее из-за оверхеда.
Но это теоретически и моя прикидка. По факту надо смотреть на практике. Если задача чисто побаловаться, то даже классно.