Przebudzenie Google

Przebudzenie Google

Do tej pory Google dość ostrożnie podchodził do udostępniania swoich modeli AI nad którymi pracują od wielu miesięcy a nawet lat. Jednak wydaje się, że bardziej otwarta polityka konkurenta OpenAI i jego model ChatGPT zmienił tę politykę Google dotyczącą udostępniania swoich niesamowitych modeli.

Które modele mogą zostać udostępnione w najbliższej przyszłości? Poniżej znajduje się lista modeli, nad którymi pracuje Google i które, według wielu doniesień, mają być udostępnione i zintegrowane z różnymi usługami Google.

LaMDA

Google obecnie pracuje nad modelami językowymi dla aplikacji dialogowych (LaMDA). Model LaMDA zwrócił uwagę jakiś czas temu, gdy wewnętrzny badacz, Blake Lemoine, stwierdził, że model językowy jest świadomy. Co wysyłało spore zamieszanie i zwolnienie Blake Lemoine.

Google teraz pracuje nad integracją LaMDA z istniejącymi produktami i, miejmy nadzieję, udostępnieniem interfejsu API, z którego mogą korzystać programiści, zapewniając jednocześnie bezpieczeństwo technologii. Wydaje się, że jest to naturalny konkurent dla ChatGPT i odpowiedź Google na rosnącą konkurencję ze strony OpenAI.

Google podało dość lakoniczne stanowisko w tej sprawie: „Nasze trwające prace nad LaMDA badają, w jaki sposób te modele można wykorzystać do bezpiecznego, ugruntowanego i wysokiej jakości dialogu, aby umożliwić kontekstowe rozmowy wielotorowe„.

Imagen i Parti

Google Imagen i Parti to dwie innowacyjne modele AI, które będą konkurować z czołowymi modelami AI w generowaniu obrazu przy pomocy tekstu, takimi jak MidJourney, Stable Diffusion i Dall-E2. Jednak Google dba o bezpieczeństwo swoich technologii i dlatego opóźnia publiczne udostępnianie Imagen i Parti. Model Parti oferuje lepsze wyniki niż Imagen, skalując parametry Transformera enkoder-dekoder do 20B. Dreambooth to dodatkowa funkcja umożliwiająca użytkownikom dostosowywanie przeszkolonych modeli Imagen lub Parti do generowania nowych obrazów z połączenia tekstu i własnych obrazów.

Google Imagen Video i Phenaki to dwa generatory wideo AI, które mają zrewolucjonizować świat generatywnej sztucznej inteligencji. W przeciwieństwie do zamiany tekstu na obraz, zamiana tekstu na wideo jest znacznie bardziej skomplikowana ze względu na dodatkowy wymiar czasu i konieczność przetwarzania ogromnych zbiorów danych. Aby uzyskać realistyczne wyniki, wszystkie piksele w każdej klatce muszą pasować do tego, co w danej chwili powinno się dziać w filmie, a także być spójne i zgodne z innymi klatkami.

Imagen Video i Phenaki

Google Imagen Video i Phenaki znacznie przesuwają granice tego, co można osiągnąć w dziedzinie generatywnej sztucznej inteligencji. Dzięki zastosowaniu najnowszych algorytmów i metod uczenia maszynowego, te dwa modele są w stanie generować realistyczne filmy na podstawie tekstu, uwzględniając nie tylko akcję, ale także emocje i inne subtelne szczegóły. Zanim jednak Google udostępni je szerokiej publiczności, firma musi upewnić się, że te modele są bezpieczne. Z powodu potencjalnie niebezpiecznego wpływu, jaki generatywna sztuczna inteligencja może mieć na świat, Google traktuje swoją odpowiedzialność bardzo poważnie i wprowadza ścisłe kontrole i procedury, aby upewnić się, że te modele są bezpieczne i nie wprowadzają negatywnych zmian w naszym świecie.

Imagen Video

Mimo to, Imagen Video i Phenaki zapowiadają się jako kolejne, fascynujące kroki w dziedzinie generatywnej sztucznej inteligencji i z pewnością będą miały ogromny wpływ na nasze życie i przyszłość.

Dodaj komentarz

4 × dwa =