Телеграмм чат группы natural_language

Но на всех языках (ru и en) и всех датасетах (много), на которых я проверял, bertscore хуже меряет смысловую близость предложений, чем LaBSE+косинус, и уж тем более чем специализированные модели, обученные на задаче детекции парафраз или sts

источник

17:23пожаловаться #4

David Dale in Natural Language Processing

для обоих языков это строго НЕ правда)

источник

17:24пожаловаться #5

Ilya Gusev in Natural Language Processing

ну зачем-то авторы bertscore его делали :D

источник

17:25пожаловаться #6

Katya Artemova in Natural Language Processing

спасибоньки

источник

17:25пожаловаться #7

Ilya Gusev in Natural Language Processing

а так да, на суммаризации он так себе

источник

17:25пожаловаться #8

Katya Artemova in Natural Language Processing

вот я что-то такое сейчас и смотрю в своих делах)

источник

17:26пожаловаться #9

Ilya Gusev in Natural Language Processing

chrF из той таблички оооочень приятно смотрится кстати

источник

17:28пожаловаться #10

David Dale in Natural Language Processing

И для ещё ряда других задач тоже так себе.
Ямщиков, например, в прошлом году его на пяти датасетах сравнивал с другими метриками, и пришёл к выводу, что glove + word mover distance и то лучше работает. И это он ещё современные sentence encoders не пробовал.
https://arxiv.org/abs/2004.05001

источник

17:28пожаловаться #11

David Dale in Natural Language Processing

В одной недавней статье для 4 европейских языков метрики смысловой близости на text style transfer сравнивали, и у них тоже chrF оказалось лучше остальных. Хоть меня и не покидает ощущение, что трансформерные метрики авторы там как-то неправильно готовили.
https://arxiv.org/abs/2110.10668

источник

17:32пожаловаться #12

Ilya Gusev in Natural Language Processing

CrhF ещё и простая, как палка, я вообще удивлён, что её используют не настолько часто, как bleu или rouge. А ещё если внимательно почитать оригинальные статьи, то оказывается, что там переводу на русский особое внимание уделялось, поэтому на русских текстах она точно неплохо работает.

источник

17:34пожаловаться #13

Ruslan515 Y in Natural Language Processing

Добрый вечер. есть задача автомодерации текста(проще говоря бин класс-я хороший текст и плохой). настроил руберт от павлова.
1. длинна текста которую допускает берт 512 символов. правильно?
2. из за дисбаланса выбрал ф1. но качество просто ужасное. что можно сделать?

источник

17:54пожаловаться #14

daniil in Natural Language Processing

Для начала посмотрите на ROC-AUC, потому что для F-score надо пороги аккуратно выбирать.

источник

17:58пожаловаться #15

Ruslan515 Y in Natural Language Processing

ок

источник

18:05пожаловаться #16

Katya Artemova in Natural Language Processing

Давид, а frechet-bert-distancefrechet-bert-distance не пробовали запускать?

GitHub

GitHub - yhlleo/frechet-bert-distance: Findings of ACL 2021

Findings of ACL 2021. Contribute to yhlleo/frechet-bert-distance development by creating an account on GitHub.

источник

18:12пожаловаться #17

David Dale in Natural Language Processing

Нет, не пробовали. Из беглого взгляда на статью кажется, что метрика направлена не на сравнение смысла двух текстов, а на выявление систематической разницы между двумя большими мешками текстов, и для конкретно моей задачи это не особо релевантно.

(Я сравнивал метрики для text style transfer, там эта систематическая разница по определению есть, и выявляется более простыми методами, типа классификаторов).

источник

18:18пожаловаться #18

Katya Artemova in Natural Language Processing

поняла

источник

18:19пожаловаться #19

АН

Алексей Ничников... in Natural Language Processing

Упражняюсь с cointegrated/rubert-tiny (в частности файтюню для NLI на пробном датасете), вроде работает, Accuracy в районе 95% (данных совсем мало, думаю, можно лучше на больших датасетах). Но вопрос другой. Заглянул в словарь модели, там 29,5 тыс. токенов и нет специфических терминов, типа ПБУ, НДС и т. п. (специфических бухгалтерских терминов, у меня профессиональная бухгалтерская и юридическая лексика). Я правильно понимаю, что модель эти токены "не видит"?

источник

18:48пожаловаться #20