Да к минс то в целом хорош, но уж больно медленно считается (((
Ещё, кстати, один хак.
Если ты готов пожертвовать качеством во имя скорости, то можно обучающие данные сократить по обоим измерениям: сделать случайную выборку из строк, и сократить размерность столбцов каким-нибудь PCA.
Получишь кластеры чуть похуже, зато сильно побыстрее.
А потом, кстати, можно заморочиться и этими кластерами уже полноценный k-means инициализировать - авось, он так быстрее сойдется.