Как подсказывает автор канала
@NeuralShit колаб для генерации подобных картинок все же уже опубликован –
вот он.
А я пока игрался с колабом обратил внимание, что CLIP когда тренировали, совершенно точно почистили от «сексуального» контента в датасете – в CLIP не сгенерировать какое-то порно из текстового запроса.
Но видимо в Open AI забыли про то, что в интернете у некоторых эиодзи довольно откровенный контекст: «💦, 💖, 🍑, 🍒, 👌👈» – их обычно ставят у довольно откровенных картинок и чистка датасета пропустила такие картинки – я продолжу ковырять контекст, но уже сейчас можно догадаться что там было в датасете 🌚 (самое пошлое я не опубликовал, там похуже есть с 🍆)