Apple, iako do sada nije bio prepoznat kao vodeći igrač u oblasti veštaćke inteligencije, predstavio je novi open source AI model za uređivanje fotografija, nazvan MLLM-Guided Image Editing (MGIE). Ovaj model koristi multimodalne velike jezičke modele (MLLM) za interpretaciju tekstualnih komandi prilikom manipulacije fotografijama, čime Apple demonstrira svoj potencijal u AI sferi.
Razvijen u saradnji sa istraživačima sa Univerziteta u Kaliforniji, MGIE model omogućava korisnicima da uređuju fotografije unosom tekstualnih naredbi. Na primer, korisnik može zatražiti da se fotografija pizze „učini zdravijom“, a model će to protumačiti kao zahtev za dodavanje povrća na fotografiju.
MGIE model nudi širok spektar mogućnosti uređivanja, uključujući izrezivanje, promenu veličine, rotaciju, kao i poboljšanje svetline, kontrasta i balansa boja, sve na osnovu tekstualnih naredbi. Takođe, model može da uredi specifične delove fotografije, modifikuje izgled osobe na fotografiji (kosa, oči, odeća) i ukloni elemente iz pozadine.
Apple je učinio MGIE model dostupnim preko GitHuba, a zainteresovani korisnici mogu isprobati demo verziju na platformi Hugging Face Spaces.
Iako Apple još uvek nije najavio da li će ovaj AI model biti integrisan u neki od njihovih budućih proizvoda, predstavljanje MGIE modela ukazuje na to da kompanija istražuje nove mogućnosti u oblasti umetne inteligencije i kako ona može unaprediti korisničko iskustvo.
Izvor vesti: IT Network