Телеграмм чат группы natural_language

Всем привет! Никто не пробовал/не находил реализацию алгоритмов выбора negative sampling, но в применении для классификации предложений?

У меня очень несбалансированный датасет, где 80% данных - это один класс, и остальные 20% - это ещё 5 классов. И модель плохо обучается (пробовала сбалансировать датасет и на каждой эпохе подкидывать рандомно выбранные из большого класса экземпляры, каждый раз другие, но не особо помогает).

Или может кто-то сталкивался с такой проблемой?

источник

21:38пожаловаться #14

SМ

SancheZz Мов in Natural Language Processing

А хард негативы семплил?

источник

21:59пожаловаться #15

SМ

SancheZz Мов in Natural Language Processing

В батче во время обучения

источник

21:59пожаловаться #16

Alex Wortega in Natural Language Processing

Всем привет, хочу сделать ner для кастомных сущностей, есть cooking recipes?

источник

22:04пожаловаться #17

Майя in Natural Language Processing

Нет, спасибо за идею! Значит, попробую семплить какой-то процент хард негативов в каждый батч и тренировать на них.

источник

22:11пожаловаться #18

David Dale in Natural Language Processing

1) обучать берт на NER можно примерно таким путём: оригинальный блокнот от huggingface, моя адаптация для русского
2) если размеченных данных мало, хорошо заходит active learning (прогоняешь модель через неразмеченные данные, отбираешь несколько десятков самых неуверенных примеров, размечаешь их руками, добавляешь в обучающую выборку, дообучаешь модель, повторяешь). Размечать NER очень удобно в labelstudio

источник

22:12пожаловаться #19

David Dale in Natural Language Processing

В качестве бейзлайна очень рекомендую безMLный алгоритм попробовать, например, на yargy

источник

22:12пожаловаться #20