А нужно ли пытаться приводить мое распределение к нормальному виду?
Просто у меня оно виде экспоненты и если взять ln, то будет как нормальное распределение
В задачах регрессии это иногда улучшает качество модели. С кластеризацией получится, что кластеры по другому будут сформированы, и тут вопрос , какой вариант лучше. Можно попробовать сделать визуализацию на двух признаках и посмотреть с тз практики/бизнес-задачи, что больше похоже на правду, либо посмотреть в сторону метрик оценки качества кластеризации.