небольшой вопрос на счет GAN с self-attention, смотрю разные реализации, (васерштейн, саган),
и наблюдаю что аттеншен лаер в разных местах в череде конволюционных блоков в разных реализациях,
как бы вы интепритировали нахождение аттеншена ближе или дальше к концу/началу ?
Влияние такого решения ? И что влияет на подобные архитектурные решения ?