Телеграмм чат группы datasciencechat страница 7061

Size: a a a

Data Science Chat

5162 membersпожаловаться на группу

2021 September 14

Roman Nm in Data Science Chat

Всё так 🙂

источник

19:02пожаловаться #1

Andrey in Data Science Chat

всегда можно создать недостающие колонки из 0

источник

19:16пожаловаться #2

Andrey in Data Science Chat

смотрите. есть набор точек (xi1, xi2, xi3, yi), алгоритм - условный линрег - подбирает такие k1, k2, k3, b, что отклонение (среднеквадратичное совсем точкам) минимальное.

потом вы пользуетесь теми же найденными k1, k2, k3, b, y_pred = k1×x1 +... + b, уже для новых x1, ..., x3.

если y не один, таргет, отклик еще его называют, предсказываемая величина, то наборов k1, ... k3 уже будет столько, сколько откликов (и это не так для нейросеток и деревьев).

я об этом писал, хотя может и не вкурил вопрос правильно

источник

19:16пожаловаться #3

Artyom in Data Science Chat

вот, простыми словами - мы учили модель - у нас были "вес машины,цвет, год выпуска, расход, производитель". а модели мы подаем только "производитель, цвет" и хотим узнать цену

источник

19:19пожаловаться #4

Roman Nm in Data Science Chat

No way

источник

19:21пожаловаться #5

Somebody in Data Science Chat

Вы б написали формулу, которую хотите получить

источник

19:21пожаловаться #6

Somebody in Data Science Chat

В линреге выходная переменная одна

источник

19:22пожаловаться #7

Andrey in Data Science Chat

как выше написали, берёте среднее и получаете собирательно "для всех производителей". для категориальной переменной это глуповато, поэтому зануляете и интерпретируете как-то как "неизвестного производителя".

но в целом для категориальных переменных нехорошо. для непрерывных больше можно чудить

источник

19:23пожаловаться #8

Somebody in Data Science Chat

Что такое (y1,y2,y3)=f(x1,...,xn) - не понятно
Это
[a11x1+a12x2+...]
.
.
[a31x1+a32xw+...]
Или что?
Как связаны строки?

источник

19:23пожаловаться #9

Artyom in Data Science Chat

так какая разница, какой алгоритм?

источник

19:24пожаловаться #10

Somebody in Data Science Chat

Большая

источник

19:24пожаловаться #11

Andrey in Data Science Chat

f - это вектор-функция, большего не имелось ввиду в этом выраженит

источник

19:24пожаловаться #12

Artyom in Data Science Chat

ну если я lightgbmregressor натренирую?

источник

19:24пожаловаться #13

Somebody in Data Science Chat

Какая вектор-функция?

источник

19:25пожаловаться #14

Somebody in Data Science Chat

Хз что там внутри в многомерном случае

источник

19:25пожаловаться #15

Andrey in Data Science Chat

некоторая

источник

19:26пожаловаться #16

Somebody in Data Science Chat

Даже в бустингах функции собираются из класса функций

источник

19:27пожаловаться #17

Andrey in Data Science Chat

каждый признак, если он был в обучении, должен иметь значение при предсказаний.

как проинтепретировать - вопрос решается конкретикой относительно признака.

источник

19:28пожаловаться #18

Somebody in Data Science Chat

Если определить набор чисел - будет набор чисел, можно, наверное, строить алгоритмы независимо, если опредедять хотя бы вектор это таки уже большая разница

источник

19:29пожаловаться #19

Somebody in Data Science Chat

А можно строить алгоритм на x1,...,xn получить y1^
А потом на x1,...,xn,y1^ и получить y2^
И т.д.

источник

19:31пожаловаться #20