как-то так - есть тройка понятий, связанных
мама--имеетСпособностьМыть--рама.
все сущности имеют writenRepresentation и какой-то синсет
мама : [мама, мать],
рама : [рама, окно],
имеетСособностьМыть : [мыть]
Видится что должно быть как-то так:
1. нагенерить по шаблонам предложений: мама мыла раму, моет мама раму, рама мамой моется.
2. какой-то моделькой "украсить" текст. Чтобы "мама мыла раму" стало "мама рано утром эротично мыла тряпкой раму на радость папе")
Текст по шаблонам - что-то видел, но не нашел. Вроде тут кто-то давал ссылку на свой репозиторий - тоже не нашел.
Украшательства текста. Тут GPT-2 справится?
Видел модель на уже обученной модели сеткой генерит, на гитхабе, как раз для задачи аугментации данных. Что-то типа sent2vec гуглить