кто-то обучал рл агентов на эмбеддингах текстов ? есть какие-то примеры проектов у кого-нибудь или статьи ? хочется какой-то бейзлайн иметь и не шагать в пустоту
можно попробовать заводить специальные символы для “копирования” из src в tgt. Но я это применял для того, чтобы модель не переводила термины всякие с английского в какой-нибудь другой.
здравствуйте я залётная птица в обработке языка, так что проблема, описанная мной, может быть слишком простой.
у меня есть частично бессвязный набор символов(только буквы без пробелов), и мне нужно найти все осмысленные русские слова(неважно в какой морфологической форме). как это можно сделать?