В целом - правильная рекомендация. Не все устройства правильно умеют работать с звуковыми дорожками. Чтоб всё было по феншую - в потоке должно быть только 1 видео и 1 аудио. Если сильно нужны 2 дорожки, то правильнее делать 2 канала.
Для пользователя важно иметь столько дорожек, сколько их есть у вещателя. Оператор, который по своему усмотрению "выпиливает" вторую дорожку, потому что у него плохой плеер = плохой оператор.