Size: a a a

Machine learning

2021 July 09

AO

Alex Ololo in Machine learning
подскажите пжл годный курс/тренажер по аб тестам. можно на англ
источник

VP

Vadym Pakholchuk in Machine learning
Подскажите пожалуйста, есть таблица:id заказа,  id продукта, номер продукта в заказе. В одном заказе могут быть и разные, и олиноковые продукты. хНужно определить какие продукты с какими покупают чтобы потом рекомендовать. Думал составить таблицу продукт id на продукт id, где значение на пересечении будет количество раз сколько пара встретилась во всех заказах. Но цыклом слишком долго, большая сложность.  Пробовал pivot_table, выдало ошибку изза размеров. Может есть более эффективный метод? Или я не правильно понимаю финальный результат?
источник

O

Ol in Machine learning
Размер таблицы какой?
источник

VP

Vadym Pakholchuk in Machine learning
100 000 уникальных product_id
источник

O

Ol in Machine learning
А всего записей?
источник

VP

Vadym Pakholchuk in Machine learning
300 тис
источник

I

Ilya in Machine learning
Ну такой объем данных сразу поднять в память и циклом разметить - быстро будет-же... Дольше из бд читать будет чем таблицу связей в памяти считать
источник

I

Ilya in Machine learning
Если выкинуть все кроме ид там пару тройку метров всего получается (как мне кажется).
источник

VP

Vadym Pakholchuk in Machine learning
Дропнул заказы с количеством продуктов менее 2. Осталось 36 тысяч записей. Но подход с результирующей таблицей норм? Или лучше другой способ?
источник

МС

Максим Скуратов... in Machine learning
Помню была какая-то программулина на джаве, которая позволяла по подобного рода таблицам изучать правила и составлять что-то вроде частотных правил. Попробуйте погуглить, может найдется что
источник

МС

Максим Скуратов... in Machine learning
Вообще то, что вы описываете, насколько понимаю, похоже на коллаборативную фильтрацию
Попробуйте составить таблицу вида айди закупки - флаг покупки продукта, потом по методу к-ближайших соседей искать похожих и рекомендовать разницу в покупках. Это своего рода классика.
источник

МС

Максим Скуратов... in Machine learning
З.Ы. Не являюсь и никогда не был экспертом в этой теме, просто мысли на этот счет
источник

VP

Vadym Pakholchuk in Machine learning
Спасибо!
источник

I

Ibp in Machine learning
источник

I

Ibp in Machine learning
источник

AO

Alex Ololo in Machine learning
О спс
источник

AO

Alex Ololo in Machine learning
Посмотрю
источник

DK

Daniel Kireev in Machine learning
Привет!
Может кто-то помочь с парой вопросов по отчетному заданию "Линейная регрессия и стохастический градиентный спуск", C2:W1?
источник

A

Alexey in Machine learning
Так пиши вопросы сразу сюда
источник

DK

Daniel Kireev in Machine learning
Ок, просто думал что будет не совсем красиво сразу в чат спамить вопросами - да и куски кода кидать, только чат захламлять

Вопрос такой:
Для п.2 задание: Какие продажи предсказываются линейной моделью с весами, найденными с помощью нормального уравнения, в случае средних инвестиций в рекламу по ТВ, радио и в газетах? (то есть при нулевых значениях масштабированных признаков TV, Radio и Newspaper).

Получаем веса, умножаем на массив - все просто
def normal_equation(X, y):
   return np.linalg.pinv(X).dot(y)

norm_eq_weights = normal_equation(X, y)
// массив с нулевыми весами
np.array([0, 0, 0, 1]).dot(norm_eq_weights)
источник