

Система на базе диффузионных моделей искажает исходную картинку и добавляет на нее гауссовский шум. Затем она оборачивает процесс вспять, постепенно удаляет дефекты и генерирует новые объекты.
Разработчики использовали нейросеть с 3,5 млрд параметров, протестировав ее с классификатором CLIP и самостоятельно. Они определили, что второй подход более эффективен.
🖼 GLIDE генерирует детали в течение несколько секунд, включая тени и отражения. Он может работать с фотографиями и картинами, адаптируясь к стилю художника и подстраиваясь к «характеру» каждого полотна.
#OpenAI

















