Собрал в итоге код класса Barrier и на mutex'ах, и на каналах - разницы никакой в точности достижения всеми барьера в одно и то же время не вижу.
Это такая штука, чтобы N потоков стартовали некие свои вычисления одновременно.
Я замерил стандартное отклонение времени достижения барьера - см. на скрине