Не вижу никаких других хотя бы отчасти легальных способов получить более-менее значимый объем телефонной речи. Приходится выбирать - либо развитие опен-сурс, что явно хорошо скажется в том числе и на прикладных разработках, либо фыркать на сомнительный источник происхождения пранков.
К слову, коммерческие компании эти пранки давно уже взяли в оборот.
Добавлю еще, что не стоит преувеличивать их качество, как и их перспективы как датасета.