короче, есть стопицот музыкальных треков, надо найти дубликаты. А файлы могут быть пожаты по-разному, мп3, апконверт, вав/флак и прочие радости. Я сделал как - через sox с low-pass и high-pass фильтром выделил 2 картинки - спектрограммы низких и высоких частот. далее пробежался фильтром с moving average и привел этот спектр к бинарному виду - пик 1, провал 0