Imagen konkurencja dla Dall-E 2 od Google Brain Team
Niedawno opisywaliśmy Dall-E 2 który może generować realistyczne obrazy i grafikę na podstawie opisów w języku naturalnym, wydawało się, że ten model to szczytowe osiągnięcie w tej dziedzinie na dziś. Jednak okazuje się, że Imagen od Google Brain Team – nowy model AI stworzony do tego samego celu wydaje się znacznie lepszy. Jak dowiadujemy się na stronie projektu Imagen to model dyfuzji tekstu na obraz który z niespotykanym dotąd stopniu rozumie język naturalny i generuje na podstawie opisu fotorealistyczne obrazy o jakości przewyższającej Dall-E 2. Do budowy modelu min. został użyty LAION-400M, czyli największy na świecie otwarty ogólnodostępny zestaw danych pary obrazu-tekstu z 400 milionami próbek.
Kilka próbek możliwości Google Brain Team znajdziecie poniżej.
Istnieje kilka wyzwań etycznych w związku z tą nową technologią, o których wspominają twórcy Imagen. Dla zainteresowanych tematyką etyki projektu jak i samego projektu odsyłamy na stronę Imagen.