red75prime
Генерация внутреннего представления символов, объектов разной природы, свойств, отношений и ограничений. Возможно в форме эмбеддингов, да.
"внутреннее представление" в этом контексте называется latent space. если к одной голове нейронки прицепить две жопы, которые будут приводить данные к одному latent space, ты получишь именно вот это вот "объединение мультимодальной информации". именно так работают нейронки, которые описывают, что находится на картинках