Телеграмм чат группы natural_language

а почему это вопрос ко мне? :D
issue на гитхабе можно создать, если что
с точки зрения здравого смысла - MSE как раз больше штрафует за ошибки на выбросах и скорее всего чуть более устойчива в обучении

источник

13:41пожаловаться #14

Toemik Mnemonic in Natural Language Processing

Для меня вообще странно что они не сделали loss опциональным . Но я в мире DL совсем недавно так что видимо много чему придётся удивиться ) а к вам вопрос был уже вне либы и кода, а теоретический ))

источник

13:46пожаловаться #15

Ilya Gusev in Natural Language Processing

Ну ограничение по лоссу существует только в рамках AutoModelForSequenceClassification, можно у них взять просто тушку и достроить любую свою голову. Исторически сложилось, что transformers - это не про обучение моделей, а про применение готовых. У них Trainer-то совсем недавно появился.

источник

13:48пожаловаться #16

David Dale in Natural Language Processing

А этот loss и есть опциональный: если ты не передаёшь в модель labels, то он не вычисляется, и дальше ты его можешь вычислить как тебе угодно на основе logits, переданных моделью.

источник

13:48пожаловаться #17

Toemik Mnemonic in Natural Language Processing

Да , пожалуй

источник

13:59пожаловаться #18

Toemik Mnemonic in Natural Language Processing

Без лейблс? В таком случае он выполняет кластеризацию ?

источник

14:01пожаловаться #19

David Dale in Natural Language Processing

Нет, вообще ничего не выполняет. В этом случае модель просто выдаёт тебе чиселки, а ты уже сам решаешь, какой смысл им придать и как их оптимизировать.

источник

14:11пожаловаться #20