Stable Diffusion 2.0
Została właśnie wydana druga wersja Stable Diffusion, mojego ulubionego modelu do generowania grafik na podstawie opisu. Nowa wersja wykorzystuje nowy model dyfuzji generujący obrazy o wymiarach 512×512 pikseli i 768×768 pikseli, które można przeskalować nawet do rozdzielczości 2048×2048 lub wyższej. Wersja Stable Diffusion 2.0 zapewnia szereg dużych ulepszeń i funkcji w porównaniu z wersją V1.
Nowa wersja Stable Diffusion zawiera modele zamiany tekstu na obraz wyszkolone przy użyciu zupełnie nowego kodera tekstu (OpenCLIP), opracowanego przez LAION przy wsparciu Stability AI, co znacznie poprawia jakość generowanych obrazów w porównaniu z wcześniejszymi wersjami V1.
Modele te zostały wyszkolone na podzbiorze zbioru danych LAION-5B stworzonym przez zespół DeepFloyd w Stability AI, który następnie został przefiltrowany w celu usunięcia treści dla dorosłych za pomocą filtra NSFW firmy LAION. Wersja Stable Diffusion zawiera również model Upscaler Diffusion, który zwiększa rozdzielczość obrazów czterokrotnie.
Więcej informacji na temat dostępu do modelu, zapoznaj się z informacjami o wersji na naszym GitHubie: https://github.com/Stability-AI/StableDiffusion