Всем привет и с Новым годом!
Друзья, какие вы знаете более-менее публичные лидерборды по русскоязычному NLP?
Мечтаю об аналоге GLUE. Понимаю, что такого нет, но надеюсь, что по кусочкам можно собрать.
Так что если вы знаете для разных русских NLP-задач датасеты+разбивки трейн/тест+метрики - поделитесь, пожалуйста.
И, кстати, у glue есть большой недостаток. У нескольких заданий статистика (т.е. не обобщение, а скорее, в варианте "всегда говори да, наберёшь 70%") позволяет DL алгоритму показывать 80%-90%. А если декоррелировать -- то 60% (и это в бинарном тесте).
Поэтому появился SuperGlue