Opisy narzędzia powyżej przedstawiają model Stabilnych Wariacji Obrazów z Dyfuzją, który został dostrojony w celu przyjmowania wielu osadzeń obrazów CLIP jako wejścia, umożliwiając użytkownikom łączenie osadzeń obrazów z różnych obrazów, aby mieszać swoje koncepcje oraz dodawanie koncepcji tekstowych dla większej różnorodności. Wynikiem jest obraz o rozmiarze 640×640, który można uruchomić lokalnie lub w chmurze GPU Lambda.