Size: a a a

Язык программирования Julia / Julia programming language

2021 March 18

АО

Андрей Оськин... in Язык программирования Julia / Julia programming language
Когда категориальные признаки превратятся в количественные, размерность будет дай боже.
источник

A

Alexandr in Язык программирования Julia / Julia programming language
Я вообще не рассматриваю категориальные признаки кроме как при начальной группировке. Может я, конечно, вообще чушь говорю - опять таки я не сильно аналитик. Но суть в следующем - у меня есть N групп пользователей, и одна метрика.  я хочу из них сделать M (M сильно меньше N) групп пользователей. Категориальные признаки используются только для того, чтобы изначально разбить на N групп, после этого они вообще не учитываются в расчете
источник

A

Andrey in Язык программирования Julia / Julia programming language
Андрей Оськин
То есть план такой
1. one-hot encoding, чтобы превратить все категориальные данные в количественные
2. t-SNE - понизить размерность.
3. DBScan - вытащить кластеры и выбросы.
Лучше umap вместо тсне
источник

АО

Андрей Оськин... in Язык программирования Julia / Julia programming language
источник

АО

Андрей Оськин... in Язык программирования Julia / Julia programming language
Это какая-то симпатичная статья, чтобы поиграться с umap.
источник

YO

Yuliya Ostrov in Язык программирования Julia / Julia programming language
Интересная штука, спасибо
источник

A

Andrey in Язык программирования Julia / Julia programming language
И в ней как раз показано, чем umap лучше
источник

АО

Андрей Оськин... in Язык программирования Julia / Julia programming language
Ну что, теперь вопрос - кто сможет сделать umap в Джулии?
источник

АО

Андрей Оськин... in Язык программирования Julia / Julia programming language
Чтобы не выбиваться из темы данного чата 😊
источник

АО

Андрей Оськин... in Язык программирования Julia / Julia programming language
Ааа... Слишком поздно.

https://github.com/dillondaudert/UMAP.jl
источник

VG

Viktor G. in Язык программирования Julia / Julia programming language
расплющенный скелет мамонта - это что-то)
источник

PY

Popov Yuri in Язык программирования Julia / Julia programming language
Serg Gini
зависит от специфики задачи. Так там тоже есть @safe и GC, который можно убирать @nogc
Писать в целом быстрее и пакетный менеджер есть, но пакетов, конечно, меньше. Хотя есть инструменты для достаточно простого подключения библиотек на C, Obj-C и C++(правда этот не всегда гладко работает)
Ой ну все ещё плюсик к расту. Придётся ставить и пробовать
источник

PY

Popov Yuri in Язык программирования Julia / Julia programming language
Alexandr
Всем привет. Такой вопрос, может кто подскажет. Я прогер, аналитикой занимаюсь достаточно редко, а тут появилось потребность. Вообщем у меня есть много пользователей, у пользователей есть много формальных параметров - возраст, страна, пол, население города где пользователь живет и тому подобное. И есть важные для бизнеса метрики навроде кол-ва каких-то действий в среднем на пользователя за месяц. Распределение метрик даже близко не нормальное, в большинстве случаев это что-то типа 0 действий у 30%, 1 действие у  60% и длинный-длинный хвост.
Хочется научится автоматически получать кластиризацию вида "мужчины 18-20 лет из городов миллионников и мужчины 18-25 из городов с населением 250-500К с точки зрения данной метрики видут себя похоже и сильно отлично от мужчин 30-35 лет, которые тоже ведут себя похоже".  
Пока я придумал следующее - разбить данные изначально на мелкие группы по формальным параметам. На каждой группе прогнать bootstrap чтобы получить нормальное распределение метрики. И после этого объединять эти группы между собой подобно иерархической кластеризации либо по близости среднего значения метрики либо с помощью метода Уорда (модифицированного слегка)
Может быть кто сталкивался с подобными задачами и что-нибудь поумнее/попрактичнее посоветует?
Попробуй матлаб поставить там очень удобный инструмент машинного  оюучения он тебе и признаки поможет удобно подобраьть и алгоритм и потом ещё и с++ код сгенерит пригодны для дальнейшего встраивания. А может и приложуху  но тогда малaб движок потянет за собой
источник
2021 March 19

АО

Андрей Оськин... in Язык программирования Julia / Julia programming language
источник

АО

Андрей Оськин... in Язык программирования Julia / Julia programming language
Побольше бы таких историй
источник

АО

Андрей Оськин... in Язык программирования Julia / Julia programming language
Хотя конечно я не знал, что у Бразилии есть космическая программа :-)
источник
2021 March 20

ЕП

Евгений Погребняк... in Язык программирования Julia / Julia programming language
Боты подписались?
источник

SG

Serg Gini in Язык программирования Julia / Julia programming language
В другом чате - антиспамбот норм работает
При входе новенький должен кнопку там нажать)
источник

SG

Serg Gini in Язык программирования Julia / Julia programming language
Отсеивает прилично ботов :-)
источник
2021 March 21

ИЦ

Игорь Цалко... in Язык программирования Julia / Julia programming language
источник