Size: a a a

Data Science Chat

2021 November 22

A

Andrey in Data Science Chat
Вот мне кажется, что где-то в пайторче это уже сделано
источник

SD

Sergey Dulikov in Data Science Chat
Но вообще torch.nn.LogSoftmax -> torch.nn.NLLLoss
источник

AN

Alexander N in Data Science Chat
звучит как выход. Руками приходится, т.к. у сети два разных выхода. Ну или я просто не разобрался как такие кастомные штуки делать не вручную.
источник

SD

Sergey Dulikov in Data Science Chat
Второе =)
источник

SD

Sergey Dulikov in Data Science Chat
Торчевые лоссы можно просто складывать, а потом .backward(), и не важно сколько выходов
источник

AN

Alexander N in Data Science Chat
Ок, попробую. Спасибо.
источник

A

Andrey in Data Science Chat
Интересно, что в PoissonNLLLoss есть eps "to avoid evaluation of log(0)". А в NLLLoss нету
источник

SD

Sergey Dulikov in Data Science Chat
Логично, ведь NLLLoss логарифмы не считает
источник

SD

Sergey Dulikov in Data Science Chat
А LogSoftmax использует log-sum-exp trick, поэтому там эпсилон не нужен и такой проблемы в принципе нет
источник

A

Andrey in Data Science Chat
А, так я правильно выше советовал кросс-энтропию взять?
источник

SD

Sergey Dulikov in Data Science Chat
Ну в рукописном виде это бы ничего не изменило, а при использовании торчевских реализаций и то, и другое стабильно)
источник

AK

Alex K in Data Science Chat
а можно дурацкий вопрос.
ДЕлаю задачу оттока. Есть фича - как давно чел на этом тарифе.
Есть ли смысл переводить её в логическую(например < 14дн). Может же быть, что если условно дольше, то это перестает влиять и вносить вклад. Или это бред и оставить как есть?
источник

D

Dima in Data Science Chat
эту фичу +- можно перегнать в твой таргет, либо в фичу, которая будет сильно коррелировать с таргетом
источник

AK

Alex K in Data Science Chat
прости не плнял, что значит «перегнать в таргет», у меня же есть таргет
источник

D

Dima in Data Science Chat
ну в готов датасете-да, в реальной задаче, ты чаще всего из этой фичи делаешь свой таргет.
если у тебя есть эта фича, то можешь посмотреть сгруппировать по таргету и посмотреть среднее кол-во дней для людей,которые ушли, и которые остались. и вообще можно из этой фичи подобрать такой день, который  будет  твоим таргетом.
конечно,если определение оттока там базируется на днях,которые не посещал клиент сайт
источник

A

Andrey in Data Science Chat
Это не таргет
источник

SD

Sergey Dulikov in Data Science Chat
Построй график фича/таргет, и там могут сразу быть видны конкретные разрезы. Еще можно дерево на одной этой фиче построить, тоже может быть полезно)
источник

A

Andrey in Data Science Chat
Отток - это time to event либо бинарная классификация на каком-то интервале (уход в след. месяце, например).
источник

A

Andrey in Data Science Chat
А срок на тарифе - просто фича.
источник

AK

Alex K in Data Science Chat
+
источник