Size: a a a

Data Science Chat

2021 September 14

RN

Roman Nm in Data Science Chat
Всё так 🙂
источник

A

Andrey in Data Science Chat
всегда можно создать недостающие колонки из 0
источник

A

Andrey in Data Science Chat
смотрите. есть набор точек (xi1, xi2, xi3,  yi), алгоритм - условный линрег - подбирает такие k1, k2, k3, b, что отклонение (среднеквадратичное совсем точкам) минимальное.

потом вы пользуетесь теми же найденными k1, k2, k3, b, y_pred = k1×x1 +... + b, уже для новых x1, ..., x3.

если y не один, таргет, отклик еще его называют, предсказываемая величина, то наборов k1, ... k3 уже будет столько, сколько откликов (и это не так для нейросеток и деревьев).

я об этом писал, хотя может и не вкурил вопрос правильно
источник

A

Artyom in Data Science Chat
вот, простыми словами - мы учили модель - у нас были "вес машины,цвет, год выпуска, расход, производитель". а модели мы подаем только "производитель, цвет" и хотим узнать цену
источник

RN

Roman Nm in Data Science Chat
No way
источник

S

Somebody in Data Science Chat
Вы б написали формулу, которую хотите получить
источник

S

Somebody in Data Science Chat
В линреге выходная переменная одна
источник

A

Andrey in Data Science Chat
как выше написали, берёте среднее и получаете собирательно "для всех производителей". для категориальной переменной это глуповато, поэтому зануляете и интерпретируете как-то как "неизвестного производителя".

но в целом для категориальных переменных нехорошо. для непрерывных больше можно чудить
источник

S

Somebody in Data Science Chat
Что такое (y1,y2,y3)=f(x1,...,xn) -  не понятно
Это
[a11x1+a12x2+...]
.
.
[a31x1+a32xw+...]
Или что?
Как связаны строки?
источник

A

Artyom in Data Science Chat
так какая разница, какой алгоритм?
источник

S

Somebody in Data Science Chat
Большая
источник

A

Andrey in Data Science Chat
f - это вектор-функция, большего не имелось ввиду в этом выраженит
источник

A

Artyom in Data Science Chat
ну если я lightgbmregressor натренирую?
источник

S

Somebody in Data Science Chat
Какая вектор-функция?
источник

S

Somebody in Data Science Chat
Хз что там внутри в многомерном случае
источник

A

Andrey in Data Science Chat
некоторая
источник

S

Somebody in Data Science Chat
Даже в бустингах функции собираются из класса функций
источник

A

Andrey in Data Science Chat
каждый признак, если он был в обучении, должен иметь  значение при предсказаний.

как проинтепретировать - вопрос решается конкретикой относительно признака.
источник

S

Somebody in Data Science Chat
Если определить набор чисел - будет набор чисел, можно, наверное, строить алгоритмы независимо, если опредедять хотя бы вектор это таки уже большая разница
источник

S

Somebody in Data Science Chat
А можно строить алгоритм на x1,...,xn получить y1^
А потом на x1,...,xn,y1^ и получить y2^
И т.д.
источник