Apple uči Siri kako da čita sa usana

0
322
Apple Siri

Budući Apple uređaji će možda moći da koriste detekciju pokreta za čitanje sa usana i tako pokreću Siri bez potrebe za mikrofonom preko koga stalno sluša naše komande.

Ako ste dovoljno stari, ideja da Siri može da čita sa usana na bilo koji način je odmah i zabrinjavajuće dovela do toga da se setite filma „2001: Odiseja u svemiru“ Artura C. Klarka i Stenlija Kjubrika. Nadamo se da ako Apple kanališe taj film iz 1968. godine, to je zato što je računar HAL 9000 imao izvanredne veštine prepoznavanja glasa.

U poređenju sa HAL 9000 računarom, Siri ima mnogo više poteškoća da pouzdano i dosledno razume izgovorene komande, ali da budemo fer, još uvek nije pokušao da ubije posadu svemirskog broda.

Moguće je, međutim, da bi Siri dao dodatni upotrebni aspekt kao što je otkrivanje pokreta usta i glave mogao poboljšati njegovu tačnost. Novootkrivena patentna prijava pod nazivom „Otkrivanje ključnih reči pomoću detekcije pokreta“ ima za cilj da to uradi.

Senzori u akciji

„[Podaci] se primaju od senzora pokreta, na primer, beležeći kretanje korisnika dok korisnik izgovara govorni unos“, kaže se u prijavi patenta. „Određuje se da li se deo podataka o kretanju poklapa sa referentnim podacima za skup od jedne ili više reči (npr. reč ili fraza).“

„Pored toga, sistemi [samo] glasovne kontrole mogu dovesti do lažnih pozitivnih odgovora“, pomenuo je Apple, „ako audio senzor uhvati ambijentalnu buku ili govor od neželjenog korisnika“.

Detaljni opisi pokreta

Aplikacija za patent detaljno opisuje kako se pokreti usta mogu uporediti sa prethodnim podacima dok Siri ili uređaj pokušava da pronađe podudaranje.

Ali ovo zapravo nije za poboljšanje Siri i nije znak da Apple planira neke uređaje bez mikrofona. Umesto toga, Apple predlaže da takva detekcija pokreta može značiti mogućnost isključivanja mikrofona koje uređaj koristi da stalno sluša „Siri“ ili „Hej, Siri“.

„[Kontinuirano] otkrivanje i obrada audio podataka troši snagu i kapacitet obrade čak i kada korisnik ne koristi aktivno glasovnu kontrolu“, kaže Apple.

„Kada korisnik govori, njegova usta, lice, glava i vrat se pomeraju i vibriraju“, nastavlja se. „Senzori pokreta kao što su akcelerometri i žiroskopi mogu da otkriju ove pokrete, dok troše relativno malo energije u poređenju sa audio senzorima kao što su mikrofoni.

Hej Siri

Otkrivanje pokreta sada i upoređivanje sa prethodnim zapisima izgleda jasno da funkcioniše kada je ono što se kaže „Hej, Siri“ ili neka druga redovna komanda, kao što je „Sledeća numera“. Kada je izgovorena komanda manje uobičajena, kao što je „Hej, Siri, otvori vrata odeljka za kapsule“, tada detekcija pokreta sigurno neće raditi.

Ali sve dok je detekcija pokreta dovoljno brza, uočavanje da je korisnik rekao „Siri“ trebalo bi da znači da uređaj može da uključi mikrofone na vreme kako bi glasno uhvatio ostatak.

Osim što se odnosi na akcelerometre i žiroskope, Apple-ova patentna prijava ne troši mnogo vremena na diskusiju o uređajima koji bi se mogli koristiti za implementaciju ovog predloga.

Međutim, to je čitanje sa usana pomoću detekcije pokreta, a ne preko kamera i vidnog polja. Dakle, posebno u kombinaciji sa iPhone-om, ova detekcija pokreta bi teoretski mogla da radi sa AirPod-ovima kao i, na primer, Apple Vision Pro.

Ova patentna prijava je pripisana dvojici pronalazača, uključujući Madhua Čintakunta. Čintakuntin prethodni rad za Apple uključuje patent za to da Siri automatski dogovara i poziva u vaše ime.

Izvor vesti: Appleinsider

LEAVE A REPLY

Please enter your comment!
Please enter your name here