Всем привет!
есть тут знатоки sklearn ?
Интересует вот эта смесь:
https://scikit-learn.org/stable/modules/generated/sklearn.mixture.BayesianGaussianMixture.htmlА вернее параметр n_components.
Наткнулся как раз на такую ситуацию, что "иногда" модель может решить не использовать все компоненты, такое поведение выглядит ужасным.
Например:
bgm = BayesianGaussianMixture(n_components = 17)
labels_predict = bgm.fit_predict(x_train) (число эффективных лейблов 16)
proba = bgm.predict_proba(test_data) - (уже выдает матрицу с 17 столбцами)
К слову сказать , в proba присутствуют все компоненты, все 17, хотя да, один из них достаточно близок к нулю.
все бы ничего , но умное поведение , иногда создает проблемы. Как с этим бороться?
Как заставить модельку, перестать умничать?