Ты троллишь что ли. Моя шутка состояла в том, что собеседование длиной в 10 минут очень может быть - если человек не может ответить на элементарные вопросы.
а откуда она выводится? от неё нужны: -монотонность -дифференцируемость -пределы на бесконечностях -выразимость производной через значение (чтобы легче градиенты считать) вроде всё
Более того, вот я знаю о нем. Но на практике встречал пару раз. И то, мне проще было слой / архитектуру поменять, чем что-то там выдумывать и бороться.
а откуда она выводится? от неё нужны: -монотонность -дифференцируемость -пределы на бесконечностях -выразимость производной через значение (чтобы легче градиенты считать) вроде всё
Сигмоида? Ну из предположения, что случайный шум имеет логистическое распределение с нулевым средним