При подготовке датасета для ner, нужно ли в нем оставлять предложения, в которых вообще нет сущностей, как примеры отсутствия, и если нужно, то насколько много?
Нужно, но нельзя, чтобы предложений без сущностей было >X%. X - по дефолту ~50, дальше надо подбирать, тк зависит от сущностей, длины предожений и проекта. Подбирать по результатам на валидации, где есть все предложения без сущностей.
Всем привет, пишу проект-whitepaper по NLP, нужна консультация сегодня на 1-1.5 часа по используемым технологиям и точности терминологии, заплачу 5-10 тыс.руб. Кто готов помочь, плз пишите в личку.
Привет, задача такая - делать seq2seq из кода в код. Существенно, что словарь на выходе сильно отличается от входного. Какую модель взять, чтобы не собирать все с нуля? у Т5 вроде словари одинаковые