Всем привет, насколько мне известно, NER обычно делается через классификацию отдельных токенов, когда-то сотой в этом плане были разные вариации рннок-энкодеров с последующим использованием CRF. Сейчас услышал мнение, что для NER хорошо подходит seq2seq. Очевидно, что при большом желании к этой проблеме можно подойти и с этой стороны, но лично у меня возникает вопрос, зачем? В общем, перейду к сути вопроса, использует ли в своей практики кто-то именно seq2seq подход вместо классификации токенов и есть ли публикации, в которых сравнивают эти подходы без использования multitask learning?