ff 5
Umjetna inteligencija - AI

Chat GPT 4o – jednostavnije kreira slike

U kratkim crtama

Prije otprilike godinu dana predstavljen je OpenAI-jev model GPT-4o, koji je od tada dodatno usavršen novim značajkama. Posljednje poboljšanje je generiranje slika – AI model...
Nino Krstačić
Vrijeme čitanja
1 min čitanja

Raniji AI modeli često su imali problema s generiranjem teksta na slikama; u najboljem slučaju prikazivali bi nejasne riječi, a u najgorem nerazumljive znakove. Međutim, GPT-4o uspješno prevladava taj izazov.

Za razliku od tradicionalnih pristupa, gdje je korisnik morao mijenjati originalni tekstualni opis slike, GPT-4o funkcionira drukčije – korisnik najprije zatraži sliku, a zatim postupno daje upute o promjenama. Proces je interaktivan, a slike se mogu kontinuirano usavršavati.

OpenAI navodi primjere koji pokazuju što GPT-4o može postići. Iako priznaje kako su neki od objavljenih rezultata pažljivo odabrani („najbolji od 2“ ili „najbolji od 8“ pokušaja), konačni su rezultati impresivni. Sučelje za korištenje ove funkcije iznimno je jednostavno i prilagođeno korisnicima.

GPT-4o omogućuje stvaranje slike od nule ili modifikaciju postojeće fotografije. Na primjer, korisnik može učitati fotografiju mačke i zatražiti dodavanje detektivskog šešira i monokla, a zatim sliku dodatno prilagoditi kako bi izgledala kao scena iz računalne igre u stilu RPG-a. Također, model može kombinirati elemente iz više različitih slika u jedinstveni konačni prikaz.

12

OpenAI ističe kako GPT-4o izvrsno slijedi detaljne upute korisnika. Model može istovremeno manipulirati s 10 do 20 različitih objekata u jednoj sceni, što je znatno više od prethodnih AI modela koji su uglavnom mogli upravljati s najviše 5 do 8 objekata.

Ipak, GPT-4o još uvijek nije savršen, što i sam OpenAI otvoreno priznaje. Povremeno se javljaju problemi poput odsijecanja donjeg dijela slike, AI halucinacija, otežanog upravljanja većim brojem objekata te nedovoljno kvalitetnog prikaza teksta, posebno kod nelatiničnih znakova.

Konačno, OpenAI je predstavio i video demonstracije koje jasno prikazuju nove mogućnosti GPT-4o modela u području generiranja i prilagodbe slika.

Napisao/la

Nino Krstačić

Autor mnogih IT članaka, svojevremeno suvlasnik IT portala. Gaji velike osjećaje prema IT sektoru te uživa u njemu (naravno koliko mu to primarni posao dopusti). Svaki članak piše na sebi svojstven način te ima poseban pristup informacijama i donošenju istih.

Možda će vas zanimati

FF 5
Umjetna inteligencija - AI

VLC kreira titlove pomoću Umjetne Inteligencije

1 9
Umjetna inteligencija - AI

ChatGPT Health – vaš AI zdravstveni savjetnik

ff 9
Umjetna inteligencija - AI

OpenAI želi da ChatGPT bude vaš osobni asistent