у меня опять странный вопрос (но я же собака сутулая, мне можно)
как из выборки в ???M элементов (объект с десятками полей разных типов) выбрать "наиболее типичные".
Если характеристики объектов численные (или приводимые к числовым), то можно сделать knn, потом отобрать топ-N объектов близких к центроидам