Riffusion: model sztucznej inteligencji, generuje muzykę na podstawie tekstu

Riffusion

Riffusion: model sztucznej inteligencji, generuje muzykę na podstawie tekstu Riffusion to aplikacja, która pozwala tworzyć unikalną muzykę poprzez wykorzystanie zaawansowanych algorytmów i mocy spektrogramów. Spektrogramy są wizualizacją dźwięku, pokazującą różne częstotliwości (wysokości) dźwięku w różnych momentach. Aplikacja wykorzystuje model Stable Diffusion v1.5 znany z generowania grafik na podstawie tekstu, który został dostrojony do spektrogramów, aby …

Czytaj dalej

ChatGPT o sobie

ChatGPT o sobie

ChatGPT o sobie – artykuł nadpisany na swój temat przez chatbota OpenAI ChatGPT Jako duży model języka przeszkolony przez OpenAI, jestem wyjątkowym i wyrafinowanym systemem, który jest w stanie generować tekst podobny do ludzkiego na szeroki zakres tematów. W przeciwieństwie do większości modeli językowych, które są szkolone na określonym korpusie tekstu, ja zostałem przeszkolony na …

Czytaj dalej

NVIDIA RTX 6000 Ada

NVIDIA RTX 6000 Ada

Nowa karta graficzna NVIDIA RTX 6000 Ada przeznaczona dla profesjonalistów zapowiadana jakiś czas temu w końcu trafiła do sprzedaży. Karta wyglądem przypomina karty z serii RTX A /Ampere/, posiada 48 GB pamięci VRAM typu GDDR a jej współczynnik TDP wynosi na poziomie 300 W. Moc obliczeniowa NVIDIA RTX 6000 robi wrażenie, bo w FP32 wynosi …

Czytaj dalej

eDiff-I – nowy generator obrazów od Nvidia

eDiff-I

DALL·E 2 – nowy generator obrazów od Nvidia eDiff-I to zupełnie nowy model dyfuzji tekstu na obraz od Nvidia. Po generatorach obrazu Ai OpenAI, MidJourney i Stability AI również Nvidia zademonstrowała swój generator wg. niej lepszy od modeli pozostałych firm. Twórcy eDiff-I przedstawiają sporą listę w czym ich generator jest lepszy od takich modeli jak …

Czytaj dalej

Wydano Stable Diffusion 2.0

Stable Diffusion 2.0

Stable Diffusion 2.0 Została właśnie wydana druga wersja Stable Diffusion, mojego ulubionego modelu do generowania grafik na podstawie opisu. Nowa wersja wykorzystuje nowy model dyfuzji generujący obrazy o wymiarach 512×512 pikseli i 768×768 pikseli, które można przeskalować nawet do rozdzielczości 2048×2048 lub wyższej. Wersja Stable Diffusion 2.0 zapewnia szereg dużych ulepszeń i funkcji w porównaniu …

Czytaj dalej

GALACTICA uniwersalny model języka naukowego od Meta AI

GALACTICA

GALACTICA uniwersalny model języka naukowego od Meta AI Meta AI ponownie zaskakuje udostępniając model AI wyszkolony wyłącznie na artykułach naukowych, bazach wiedzy i wielu innych źródłach związanych z nauką. Model zawiera aż 120 miliardów parametrów które są w stanie zmieścić się w pojedynczym procesorze Nvidia A100 z pamięcią 80 GB. Galactica została wydana jako open …

Czytaj dalej

AudioLM nowy model Google zdolny do generowania muzyki

AudioLM

AudioLM nowy model Google zdolny do generowania muzyki AudioLM to nowy model Google, zdolny do generowania muzyki w tym samym stylu co odtworzony mu wcześniej fragment jakiegoś utworu. Nowy model potrafi generować bardzo złożone dźwięki instrumentów jak i głosu ludzkiego. AudioLM został przeszkolony na obszernych danych dźwiękowych, które obejmowały nie tylko muzykę, ale także ludzkie …

Czytaj dalej

11 listopad oczami sztucznej inteligencji

11 listopada oczami sztucznej inteligencji

11 listopad oczami sztucznej inteligencji Z okazji naszego święta narodowego postanowiłem sprawdzić jakie obrazy wygeneruje AI, kiedy wprowadzę tylko krótki monit z datą i nazwą święta niepodległości Polski. Uzyskałem wiele ciekawych wyników, ale wszystkie te zdjęcia miały jedną wspólną cechę, mimo że święto powinno dawać nam radość to wizja Ai nie odbiega od tego co …

Czytaj dalej

Universal Speech Model

Universal Speech Model

Universal Speech Model Universal Speech Model to ambitny projekt Google zbudowania jednego modelu językowego który będzie zdolny tłumaczyć 1000 najczęściej używanych języków świata. Zoubin Ghahramani, wiceprezes ds. badań w Google AI w wywiadzie dla The Verge powiedział: „Dzięki jednemu modelowi, który jest wystawiony na działanie wielu różnych języków i jest w nich szkolony, uzyskujemy znacznie …

Czytaj dalej

Wordcraft od Google

Wordcraft od Google

Wordcraft od Google, czyli wspomaganie pisarzy za pomocą modeli językowych Największe modele językowe takie jak GPT-3 posiadają imponujące możliwości w z rozumieniu i generowaniu języka. Nie są one jednak zbyt oryginalne w generowaniu treści i w tej formie na pewno nie zastąpią pisarzy. Google do problemu generowania treści podeszło w inny sposób w projekcie Wordcraft. …

Czytaj dalej

Google UniTune

Google UniTune

Google UniTune – model do edycji obrazu opartej na monitach tekstowych. Google opublikowało na arXiv nowy model sztucznej inteligencji UniTune który umożliwia edycję obrazu na podstawie tekstu. Wcześniej już pisałem o modelu Imagic który umożliwiał edycję renderowanego zdjęcia natomiast model UniTune potrafi edytować oryginalne zdjęcie zachowując wysoką wierność semantyczną i wizualną.  Co o samym modelu …

Czytaj dalej

BLOG TECHNOLOGICZNY Gadzety360.pl
Przegląd prywatności

Ta strona korzysta z ciasteczek, aby zapewnić Ci najlepszą możliwą obsługę. Informacje o ciasteczkach są przechowywane w przeglądarce i wykonują funkcje takie jak rozpoznawanie Cię po powrocie na naszą stronę internetową i pomaganie naszemu zespołowi w zrozumieniu, które sekcje witryny są dla Ciebie najbardziej interesujące i przydatne.