Size: a a a

Natural Language Processing

2021 May 12

IG

Ilya Gusev in Natural Language Processing
Про модели из hf я ответил в ods, "я бы смотрел в сторону мультиязычных дистиллированных моделей, типа https://huggingface.co/distilbert-base-multilingual-cased". Именно лёгких моделей для русского я не знаю, было бы круто, если бы их кто-то сделал.
источник

IG

Ilya Gusev in Natural Language Processing
если не завязываться на transformers, то ещё USE
источник

VF

Vadim Fomin in Natural Language Processing
В предпоследней строке вы случайно поставили пробел (или в примере он случайно появился), поэтому она не сработала. Во второй строке, наоборот, перед строкой нужен отступ. Надо выполнить две строки ещё раз, но перед первой строкой убрать пробел, а перед второй добавить.
источник

o

oldysty in Natural Language Processing
Да, увидел, спасибо. Мультиязычные тоже должны подходить.
источник

o

oldysty in Natural Language Processing
Да, спасибо, забыл про него
источник

IG

Ilya Gusev in Natural Language Processing
да, к gpt3 от сбера я отношусь скептично, именно для нормальных применений я ни разу не видел, чтобы оно работало
источник

Дв

До:q!тор выходных на... in Natural Language Processing
А я вот пытаюсь обучить руГПТ3 на javascript коде. Получается вполне приемлимо)
источник

IG

Ilya Gusev in Natural Language Processing
обучить на что?
источник

Дв

До:q!тор выходных на... in Natural Language Processing
что бы в иде моделька генерировался подсказки когда
источник

IG

Ilya Gusev in Natural Language Processing
Ок, уточню, под нормальными применениями я имел в виду что-то, где можно сравниться с другими моделями. Как авторегрессивная языковая модель она приемлемо работает.
источник

IG

Ilya Gusev in Natural Language Processing
а вот эмбеддинги из неё как будто бы так себе
источник

AM

Anton Mes in Natural Language Processing
Всем привет!
Есть задача, сделать для диплома MVP системы автоматической проверки открытых ответов на русском языке.
Нашел в интернете несколько статей на эту тему, одна идеальная - https://cyberleninka.ru/article/n/sistema-avtomaticheskoy-proverki-otvetov-na-otkrytye-voprosy-na-russkom-yazyke/viewer
Но, очевидно никаких исходников или хотя бы наборов данных там нет (наивный я конечно)
Вопрос - кто-то изучал подобную тему когда либо? Возможно есть какие-то наработки от которых можно было бы оттолкнуться? Готов задонатить (если есть реально что-то работающее разумеется)
Можно в лс
источник

YB

Yuri Baburov in Natural Language Processing
А не поздно начинать работу над дипломом в середине мая? Или у вас ещё год есть?
источник

AM

Anton Mes in Natural Language Processing
Никогда не поздно :)
Да и вуз такой, нужно просто что-то сделать, чтоб закончить магистратуру 😅
Тему давно выбрал, и в целом всякую писанину написал, но хотелось бы что-то рабочее показать на защите
И этого бы хватило, я уверен
источник

YB

Yuri Baburov in Natural Language Processing
Тогда возьмите kaggle question pairs для начала, если хотите архитектуру подобрать и отталкиваться от чего-то. Увы, с датасетами на русском языке проблема.
источник

RZ

Roman Zhukov in Natural Language Processing
Хватило на что? Может кому? Не думали о том, как выгодно связать учебу и собственную мотивацию делать продукты?
источник

AM

Anton Mes in Natural Language Processing
Я бы с удовольствием в это погрузился, но основная работа забирает большую часть времени
источник

YB

Yuri Baburov in Natural Language Processing
Но можно соскрейпить данные с какого-либо форума или сайта с ответами. И тогда сможете сделать то что надо.
источник

AM

Anton Mes in Natural Language Processing
По сути просто забрать диплом и положить на полку, без особого смысла)
источник
2021 May 13

VM

Victor Maslov in Natural Language Processing
computer science in Russia
источник