Size: a a a

Machine learning

2021 January 25

B

Blablabla in Machine learning
Спасибо за ответ
источник

M

Max in Machine learning
Здравствуйте! Подскажите, пожалуйста, что надо ли что-то делать с  геометрическим (вроде) распределением целевого признака? Задача классификации текста с 36 классами.
У меня просто появились подозрения, что модель переучиться может на первых классах...
источник

T

TA in Machine learning
Всем привет. У кого есть опыт в когортном анализе? У меня есть данные с продаж ПО с подпиской, там подписки либо месячные либо годовые. И вопрос: как правильнее делать анализ? У меня несколько вариантов:
Смотреть только месячные подписки
ИЛИ
Рассматривать людей с годовой подпиской как клиентов совершивших 12 покупок сразу
источник

T

TA in Machine learning
Или может кто знает какой-то более подходящий метод? Когортный анализ retention
источник

ss

serg shishlo in Machine learning
TA
Всем привет. У кого есть опыт в когортном анализе? У меня есть данные с продаж ПО с подпиской, там подписки либо месячные либо годовые. И вопрос: как правильнее делать анализ? У меня несколько вариантов:
Смотреть только месячные подписки
ИЛИ
Рассматривать людей с годовой подпиской как клиентов совершивших 12 покупок сразу
Добрый день надо глянуть исходные данные кусочек
источник

T

TA in Machine learning
InvoiceDate - дата когда была совершена покупка
Type - там данные о типе подписки: возврат, новый клиент, обновление подписки
Plan - monthly/annual
Price - цена

Вот такие данные
источник

ss

serg shishlo in Machine learning
TA
InvoiceDate - дата когда была совершена покупка
Type - там данные о типе подписки: возврат, новый клиент, обновление подписки
Plan - monthly/annual
Price - цена

Вот такие данные
Не получиться когортный анализ в полной мере, так как сложно по Type идентифицировать к какой когорте относится клиент. Если бы был идентификатор клиента то можно было бы накидать алгоритм расчета ничего сложного нет даже можно было бы оценить выручку с каждой когорты
источник

T

TA in Machine learning
Там индекс transactionId
источник

T

TA in Machine learning
Поэтому клиентов можно идентифицировать. Вот только не могу подход к периодам найти. Там и месячные и годовые подписки, а это мой 1 когортный анализ)
источник

ss

serg shishlo in Machine learning
TA
InvoiceDate - дата когда была совершена покупка
Type - там данные о типе подписки: возврат, новый клиент, обновление подписки
Plan - monthly/annual
Price - цена

Вот такие данные
Алгоритм такой:
1. Выделяешь первый месяц(неделю) прихода клиента это же будет и номер когорты
2. Находишь дельту между датой покупки и первой датой покупки переводишь в месяц(неделю)
3. группируешь в разрезе номера когорты, дельты. в agg({'Type':'nunique'})
4. сбрасываешь индексы в полученной таблице
5. Определяешь количество покупателей в каждой когорте (это количество клиентов для 0 месяца(недели))
6. объединяешь две таблицы лучше использовать merge
7. Находишь retention
8. из полученной таблицы pivot_table(index='cohorts', columns = 'cohort_lifetime', values='retention',aggfunc='sum')
9. Для наглядности по полученной таблице строишь тепловую карту
источник

T

TA in Machine learning
serg shishlo
Алгоритм такой:
1. Выделяешь первый месяц(неделю) прихода клиента это же будет и номер когорты
2. Находишь дельту между датой покупки и первой датой покупки переводишь в месяц(неделю)
3. группируешь в разрезе номера когорты, дельты. в agg({'Type':'nunique'})
4. сбрасываешь индексы в полученной таблице
5. Определяешь количество покупателей в каждой когорте (это количество клиентов для 0 месяца(недели))
6. объединяешь две таблицы лучше использовать merge
7. Находишь retention
8. из полученной таблицы pivot_table(index='cohorts', columns = 'cohort_lifetime', values='retention',aggfunc='sum')
9. Для наглядности по полученной таблице строишь тепловую карту
Ок, спасибо большое
источник
2021 January 26

K

K-S in Machine learning
A кто-нибудь эту байду решает?

https://www.kaggle.com/c/jane-street-market-prediction
источник

SS

Sergey Salnikov in Machine learning
а что там? если коротко?
источник

Ю

Юрий in Machine learning
Я подумываю начать, но слово "байду" напрягает, не стоит?)
источник

of

oleg fadeev in Machine learning
http://www.pythontutor.com/visualize.html#code=class%20Buffer%3A%0A%20%20%20%20def%20__init__%28self,%20*a%29%3A%0A%20%20%20%20%20%20%20%20%0A%20%20%20%20%20%20%20%20%0A%20%20%20%20%20%20%20%20self.a%20%3D%20%5B*a%5D%0A%20%20%20%20%20%20%20%20%0A%20%20%20%20%20%20%20%20return%0A%20%20%20%20%20%20%20%20%23%20%D0%BA%D0%BE%D0%BD%D1%81%D1%82%D1%80%D1%83%D0%BA%D1%82%D0%BE%D1%80%20%D0%B1%D0%B5%D0%B7%20%D0%B0%D1%80%D0%B3%D1%83%D0%BC%D0%B5%D0%BD%D1%82%D0%BE%D0%B2%0A%0A%20%20%20%20def%20add%28self,%20*sum%29%3A%0A%20%20%20%20%20%20%20%20self.a.extend%28%5B*sum%5D%29%0A%20%20%20%20%20%20%20%20if%20len%28self.a%29%20%3E%3D%205%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20print%28sum%28self.a%5B%3A5%5D%29%29%0A%20%20%20%20%20%20%20%20%20%20%20%20%5B*self.a%5D%20%3D%20%20%5B*self.a%5D%5B5%3A%5D%0A%20%20%20%20%20%20%20%20if%20len%28self.a%29%20%3E%3D%205%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20print%28sum%28%5B*self.a%5D%5B-5%3A%5D%29%29%0A%20%20%20%20%20%20%20%20%20%20%20%20%5B*self.a%5D%20%3D%20%20%5B*self.a%5D%5B%3A-5%5D%0A%20%20%20%20%20%20%20%20%23%20%D0%B4%D0%BE%D0%B1%D0%B0%D0%B2%D0%B8%D1%82%D1%8C%20%D1%81%D0%BB%D0%B5%D0%B4%D1%83%D1%8E%D1%89%D1%83%D1%8E%20%D1%87%D0%B0%D1%81%D1%82%D1%8C%20%D0%BF%D0%BE%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D0%BE%D1%81%D1%82%D0%B8%0A%0A%20%20%20%20def%20get_current_part%28self%29%3A%0A%20%20%20%20%20%20%20%20%0A%20%20%20%20%20%20%20%20print%28self.a%29%0A%20%20%20%20%20%20%20%20%23%20%D0%B2%D0%B5%D1%80%D0%BD%D1%83%D1%82%D1%8C%20%D1%81%D0%BE%D1%85%D1%80%D0%B0%D0%BD%D0%B5%D0%BD%D0%BD%D1%8B%D0%B5%20%D0%B2%20%D1%82%D0%B5%D0%BA%D1%83%D1%89%D0%B8%D0%B9%20%D0%BC%D0%BE%D0%BC%D0%B5%D0%BD%D1%82%20%D1%8D%D0%BB%D0%B5%D0%BC%D0%B5%D0%BD%D1%82%D1%8B%20%D0%BF%D0%BE%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D0%BE%D1%81%D1%82%D0%B8%20%D0%B2%20%D0%BF%D0%BE%D1%80%D1%8F%D0%B4%D0%BA%D0%B5,%20%D0%B2%20%D0%BA%D0%BE%D1%82%D0%BE%D1%80%D0%BE%D0%BC%20%D0%BE%D0%BD%D0%B8%20%D0%B1%D1%8B%D0%BB%D0%B8%20%20%20%20%20%0A%20%20%20%20%20%20%20%20%23%20%D0%B4%D0%BE%D0%B1%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D1%8B%0Abuf%20%3D%20Buffer%28%29%0Abuf.add%281,%202,%203%29%0Abuf.get_current_part%28%29%20%23%20%D0%B2%D0%B5%D1%80%D0%BD%D1%83%D1%82%D1%8C%20%5B1,%202,%203%5D%0Abuf.add%284,%205,%206%29%20%23%20print%2815%29%20%E2%80%93%20%D0%B2%D1%8B%D0%B2%D0%BE%D0%B4%20%D1%81%D1%83%D0%BC%D0%BC%D1%8B%20%D0%BF%D0%B5%D1%80%D0%B2%D0%BE%D0%B9%20%D0%BF%D1%8F%D1%82%D0%B5%D1%80%D0%BA%D0%B8%20%D1%8D%D0%BB%D0%B5%D0%BC%D0%B5%D0%BD%D1%82%D0%BE%D0%B2%0Abuf.get_current_part%28%29%20%23%20%D0%B2%D0%B5%D1%80%D0%BD%D1%83%D1%82%D1%8C%20%5B6%5D%0Abuf.add%287,%208,%209,%2010%29%20%23%20print%2840%29%20%E2%80%93%20%D0%B2%D1%8B%D0%B2%D0%BE%D0%B4%20%D1%81%D1%83%D0%BC%D0%BC%D1%8B%20%D0%B2%D1%82%D0%BE%D1%80%D0%BE%D0%B9%20%D0%BF%D1%8F%D1%82%D0%B5%D1%80%D0%BA%D0%B8%20%D1%8D%D0%BB%D0%B5%D0%BC%D0%B5%D0%BD%D1%82%D0%BE%D0%B2%0Abuf.get_current_part%28%29%20%23%20%D0%B2%D0%B5%D1%80%D0%BD%D1%83%D1%82%D1%8C%20%5B%5D%0Abuf.add%281,%201,%201,%201,%201,%201,%201,%201,%201,%201,%201%29%20%23%20print%285%29,%20print%285%29%20%E2%80%93%20%D0%B2%D1%8B%D0%B2%D0%BE%D0%B4%20%D1%81%D1%83%D0%BC%D0%BC%20%D1%82%D1%80%D0%B5%D1%82%D1%8C%D0%B5%D0%B9%20%D0%B8%20%D1%87%D0%B5%D1%82%D0%B2%D0%B5%D1%80%D1%82%D0%BE%D0%B9%20%D0%BF%D1%8F%D1%82%D0%B5%D1%80%D0%BA%D0%B8%0Abuf.get_current_part%28%29%20%23%20%D0%B2%D0%B5%D1%80%D0%BD%D1%83%D1%82%D1%8C%20%5B1%5D&cumulative=false&heapPrimitives=nevernest&mode=edit&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false
источник

AD

Andrey Dolgopolov in Machine learning
Может кто посоветует чат, где сидят начинающие ребятки в DL ?
источник

K

K-S in Machine learning
Sergey Salnikov
а что там? если коротко?
Предсказывать «купить/не купить» какой-то фин инструмент
источник

of

oleg fadeev in Machine learning
Помогите плззз, не понимаю почему сумму не считает, пишет что аргумент tuple хотя по факту он list
источник

SS

Sergey Salnikov in Machine learning
классификация? 0/1 или prob? серии? или таблица?
источник

K

K-S in Machine learning
Юрий
Я подумываю начать, но слово "байду" напрягает, не стоит?)
Так и есть — байда)
источник