Google I/O 2025: Revolucija umjetne inteligencije

Sadržaj

Google I/O 2025 donio je velik broj najava, uglavnom fokusiranih na umjetnu inteligenciju.

Gemini 2.5 – Novi standardi u AI jezicima

Tvrtka je predstavila ažuriranja i nove mogućnosti za modele Gemini 2.5 (Pro i Flash).

Gemini 2.5 proširio je podršku za preko 24 jezika, uz dodatnu mogućnost pretvaranja teksta u govor s izražajnim glasovima.

Google tvrdi da su poboljšani rasuđivanje, multimodalnost, programiranje te mogućnosti obrade dugih kontekstualnih ulaza za oba modela – Flash i Pro.

Deep Think – Eksperimentalni alat za složene zadatke

Najvažnije novo ažuriranje za model Gemini 2.5 Pro je funkcija „Deep Think“. Riječ je o posebnom načinu rada za kompleksne matematičke i programerske zadatke. Funkcija je još uvijek u eksperimentalnoj fazi, a uskoro će biti dostupna odabranim testnim korisnicima. Google naglašava da ovaj način rada može razmotriti više hipoteza prije nego što pruži odgovor.

Vodeće performanse na WebDev i LMArena testovima

Gemini 2.5 Pro trenutno je vodeći AI model na benchmark testovima WebDev Arena i LMArena. Pruža poboljšane alate za programiranje i izgradnju web aplikacija te podržava obradu dugih konteksta do čak milijun tokena. Osim toga, Gemini 2.5 povećava sigurnost od neizravnih napada putem promptova. Model Gemini 2.5 Flash dostupan je za pregled svim korisnicima putem Gemini aplikacije, dok je opće izdanje planirano za kraj lipnja. Komercijalno izdanje modela Gemini 2.5 Pro uslijedit će nedugo nakon toga.

Imagen 4 – AI generiranje slika visoke rezolucije

Imagen 4 može generirati slike do 2K rezolucije. Google ističe značajno poboljšanje točnosti teksta na generiranim materijalima poput kartica, postera i stripova.

Imagen 4 dostupan je od danas u aplikacijama Gemini, Google Workspace, Whisk i Vertex AI.

Veo 3 – Napredno generiranje videa

Veo 3 najnoviji je Googleov AI model za generiranje videa, s poboljšanim prepoznavanjem tekstualnih promptova za video.

Omogućuje generiranje video sadržaja sa zvukom, dijalozima likova i pozadinskim efektima. Veo 3 dostupan je od danas pretplatnicima usluge Google AI Ultra u SAD-u te korisnicima Vertex AI Enterprise platforme.

Veo 2 dobiva dodatne funkcionalnosti

Model Veo 2 također dobiva dodatne mogućnosti poput simulacije kretanja kamere te funkcija dodavanja i uklanjanja objekata. Korisnici sada mogu dodati slike za kontrolu stila, kao i koristiti opciju „outpainting“ za proširenje kadra izvan originalnih granica.

Flow – Revolucionarni alat za AI filmsku produkciju

Flow je novi Googleov AI alat specijaliziran za filmsku produkciju, koji objedinjuje mogućnosti modela Veo, Imagen i Lyria za stvaranje detaljnih filmskih scena. Google tvrdi da Flow pomaže kreativcima u kreiranju vrhunskih filmskih isječaka, koji se ističu fizikalnom točnošću i realističnosti.

Korisnici mogu kontrolirati kretanje kamere, kutove i perspektive, kao i uređivati ili proširivati ranije generirane video sadržaje. Flow je trenutno dostupan pretplatnicima Google AI Pro i Ultra usluga u SAD-u.

U kratkim crtama

Gemini 2.5 – Novi standardi u AI jezicima

Deep Think – Eksperimentalni alat za složene zadatke

Vodeće performanse na WebDev i LMArena testovima

Imagen 4 – AI generiranje slika visoke rezolucije

Veo 3 – Napredno generiranje videa

Veo 2 dobiva dodatne funkcionalnosti

Flow – Revolucionarni alat za AI filmsku produkciju

Nino Krstačić

Možda će vas zanimati

ChatGPT stigao u CarPlay

Puca AI balon? OpenAI gasi Soru

Hitno ažurirajte Android: opasan Zero-Day propust na Qualcomm čipovima