ff 5
1180
Views

Raniji AI modeli često su imali problema s generiranjem teksta na slikama; u najboljem slučaju prikazivali bi nejasne riječi, a u najgorem nerazumljive znakove. Međutim, GPT-4o uspješno prevladava taj izazov.

Za razliku od tradicionalnih pristupa, gdje je korisnik morao mijenjati originalni tekstualni opis slike, GPT-4o funkcionira drukčije – korisnik najprije zatraži sliku, a zatim postupno daje upute o promjenama. Proces je interaktivan, a slike se mogu kontinuirano usavršavati.

OpenAI navodi primjere koji pokazuju što GPT-4o može postići. Iako priznaje kako su neki od objavljenih rezultata pažljivo odabrani („najbolji od 2“ ili „najbolji od 8“ pokušaja), konačni su rezultati impresivni. Sučelje za korištenje ove funkcije iznimno je jednostavno i prilagođeno korisnicima.

GPT-4o omogućuje stvaranje slike od nule ili modifikaciju postojeće fotografije. Na primjer, korisnik može učitati fotografiju mačke i zatražiti dodavanje detektivskog šešira i monokla, a zatim sliku dodatno prilagoditi kako bi izgledala kao scena iz računalne igre u stilu RPG-a. Također, model može kombinirati elemente iz više različitih slika u jedinstveni konačni prikaz.

12

OpenAI ističe kako GPT-4o izvrsno slijedi detaljne upute korisnika. Model može istovremeno manipulirati s 10 do 20 različitih objekata u jednoj sceni, što je znatno više od prethodnih AI modela koji su uglavnom mogli upravljati s najviše 5 do 8 objekata.

Ipak, GPT-4o još uvijek nije savršen, što i sam OpenAI otvoreno priznaje. Povremeno se javljaju problemi poput odsijecanja donjeg dijela slike, AI halucinacija, otežanog upravljanja većim brojem objekata te nedovoljno kvalitetnog prikaza teksta, posebno kod nelatiničnih znakova.

Konačno, OpenAI je predstavio i video demonstracije koje jasno prikazuju nove mogućnosti GPT-4o modela u području generiranja i prilagodbe slika.

Article Tags:
·
Article Categories:
Novosti · Poslovanje · Tehnikalije
Nino https://preporucamo.com/

Autor mnogih IT članaka, svojevremeno suvlasnik IT portala. Gaji velike osjećaje prema IT sektoru te uživa u njemu (naravno koliko mu to primarni posao dopusti). Svaki članak piše na sebi svojstven način te ima poseban pristup informacijama i donošenju istih.

Odgovori