Google I/O 2025 donio je velik broj najava, uglavnom fokusiranih na umjetnu inteligenciju.
Gemini 2.5 – Novi standardi u AI jezicima
Tvrtka je predstavila ažuriranja i nove mogućnosti za modele Gemini 2.5 (Pro i Flash).
Gemini 2.5 proširio je podršku za preko 24 jezika, uz dodatnu mogućnost pretvaranja teksta u govor s izražajnim glasovima.
Google tvrdi da su poboljšani rasuđivanje, multimodalnost, programiranje te mogućnosti obrade dugih kontekstualnih ulaza za oba modela – Flash i Pro.
Deep Think – Eksperimentalni alat za složene zadatke
Najvažnije novo ažuriranje za model Gemini 2.5 Pro je funkcija „Deep Think“. Riječ je o posebnom načinu rada za kompleksne matematičke i programerske zadatke. Funkcija je još uvijek u eksperimentalnoj fazi, a uskoro će biti dostupna odabranim testnim korisnicima. Google naglašava da ovaj način rada može razmotriti više hipoteza prije nego što pruži odgovor.
Vodeće performanse na WebDev i LMArena testovima
Gemini 2.5 Pro trenutno je vodeći AI model na benchmark testovima WebDev Arena i LMArena. Pruža poboljšane alate za programiranje i izgradnju web aplikacija te podržava obradu dugih konteksta do čak milijun tokena. Osim toga, Gemini 2.5 povećava sigurnost od neizravnih napada putem promptova. Model Gemini 2.5 Flash dostupan je za pregled svim korisnicima putem Gemini aplikacije, dok je opće izdanje planirano za kraj lipnja. Komercijalno izdanje modela Gemini 2.5 Pro uslijedit će nedugo nakon toga.
Imagen 4 – AI generiranje slika visoke rezolucije
Imagen 4 može generirati slike do 2K rezolucije. Google ističe značajno poboljšanje točnosti teksta na generiranim materijalima poput kartica, postera i stripova.
Imagen 4 dostupan je od danas u aplikacijama Gemini, Google Workspace, Whisk i Vertex AI.
Veo 3 – Napredno generiranje videa
Veo 3 najnoviji je Googleov AI model za generiranje videa, s poboljšanim prepoznavanjem tekstualnih promptova za video.
Omogućuje generiranje video sadržaja sa zvukom, dijalozima likova i pozadinskim efektima. Veo 3 dostupan je od danas pretplatnicima usluge Google AI Ultra u SAD-u te korisnicima Vertex AI Enterprise platforme.
Veo 2 dobiva dodatne funkcionalnosti
Model Veo 2 također dobiva dodatne mogućnosti poput simulacije kretanja kamere te funkcija dodavanja i uklanjanja objekata. Korisnici sada mogu dodati slike za kontrolu stila, kao i koristiti opciju „outpainting“ za proširenje kadra izvan originalnih granica.
Flow – Revolucionarni alat za AI filmsku produkciju
Flow je novi Googleov AI alat specijaliziran za filmsku produkciju, koji objedinjuje mogućnosti modela Veo, Imagen i Lyria za stvaranje detaljnih filmskih scena. Google tvrdi da Flow pomaže kreativcima u kreiranju vrhunskih filmskih isječaka, koji se ističu fizikalnom točnošću i realističnosti.
Korisnici mogu kontrolirati kretanje kamere, kutove i perspektive, kao i uređivati ili proširivati ranije generirane video sadržaje. Flow je trenutno dostupan pretplatnicima Google AI Pro i Ultra usluga u SAD-u.