Size: a a a

Natural Language Processing

2021 October 22

TM

Toemik Mnemonic in Natural Language Processing
есть такое эпизодически
источник

V

Vital in Natural Language Processing
Раз в два дня примерно
источник

V

Vic in Natural Language Processing
Недавно вышла модель бьющая gpt3 по куче даунстрим тасков T0pp в не в частности есть таск генерации вопроса по тексту, как раз что вам нужно. Но также видел и другие решения, это модель большая
https://huggingface.co/bigscience/T0pp
источник

ВК

Владимир Кузовкин... in Natural Language Processing
А модель на английском? Аналогичные модели,работающие на русском есть?
источник

V

Vic in Natural Language Processing
Не видел
источник

DD

David Dale in Natural Language Processing
Ну, моя https://huggingface.co/cointegrated/rut5-base-multitask может вопросы задавать.
Но стоит её ещё пофайнтюнить на датасете sbersquad  http://files.deeppavlov.ai/datasets/sber_squad-v1.1.tar.gz, т.к. у этой модели задавание вопросов - только один из скиллов, и, если хочется на нём сконцентрироваться, лучше иметь специализированную модель.
источник

М

Мария Макаренко, Вла... in Natural Language Processing
источник

ВК

Владимир Кузовкин... in Natural Language Processing
Мария,спасибо огромное!!!

Т.е. эти работы пока не выложены в открытый доступ на гитхабе,я верно понимаю? ввиде отдельного кода?
источник

М

Мария Макаренко, Вла... in Natural Language Processing
не знаю) я сама интересуюсь этим вопросом, но то что видела отправила
источник

🐙

🐙 in Natural Language Processing
Привет! В формате CONLL 2003 как-то фундаментально зашито приклеивать кавычки к сущностям? Выгружаю из labelstudio NER разметку в формате CONLL 2003, кавычки входят в состав слова, хотя спан явно размечен без кавычек. Это баг, или так надо?
источник

СУ

Сергей Устьянцев... in Natural Language Processing
похоже, это вопрос к labelstudio, а не к CONLL
источник

🐙

🐙 in Natural Language Processing
Спасибо, пойду к ним в Slack

UPD. Нашёл  конвертёр и несколько issue для него. Под капотом там nltk WhitespaceTokenizer, оттого такие результаты
https://github.com/heartexlabs/label-studio-converter/blob/master/label_studio_converter/converter.py
источник

A

Alex in Natural Language Processing
Всем доброй приятной пятницы!
Прошу подсказать если кто знает.

Обучил Deeppavlov Text QA на своих данных.
Модель выдает ответы, но очень короткие, в несколько слов, хотя в скормленных данных ответы гораздо более полные.
Как это тюнится?
источник

AS

Artem Sergeev in Natural Language Processing
как можно видеть на примере Demo, оно в качестве ответа берёт подходящую фразу из текста, к которому вопрос. Так, что, боюсь, никак.

Разве что просить GPT "развернуть мысль".
источник

A

Alex in Natural Language Processing
понял, благодарю)
источник

OS

Oleg Serikov in Natural Language Processing
источник

A

Alex in Natural Language Processing
Спасибо
источник

V

Vic in Natural Language Processing
источник

V

Vic in Natural Language Processing
Тюнится, но стек нейросеток надо брать другой и обучать на другом типе вопросов и ответов. Это наше решение на BART
источник

A

Alex in Natural Language Processing
а какой стек надо брать?
Ваши результаты выглядят впечатляюще - то что надо.
источник