Т.е. у Вас идёт RTP поток с Вашим голосовым кодеком (711,729,722 и т.д.), но в тот момент, когда нужно передать DTMF отправитель вставляет специальные RTP пакеты с payload type 101(или какой согласовали) и в них содержится специфическая информация для описания того, какой DTMF сигнал был передан
я понял, спасибо , касательно проигрывания файлов проверю сам