Principal Inovaţie Google AI permite acum utilizatorilor să traducă instantaneu text în 27 de limbi cu ajutorul camerelor telefonice

Google AI permite acum utilizatorilor să traducă instantaneu text în 27 de limbi cu ajutorul camerelor telefonice

(Gif: Google)

(Gif: Google)

Datorită inteligenței artificiale, călătoria în străinătate nu a fost niciodată mai simplă.

Aplicația Google Translate permite utilizatorilor să traducă text instantaneu. În aplicație, pur și simplu îndreptați camera spre textul pe care doriți să îl traduceți și îl veți transforma în limba dorită live, chiar în fața ochilor dvs. - nu este nevoie de conexiune la internet sau de date despre telefonul mobil. Această funcție utilă este disponibilă de ceva timp, dar fusese compatibilă doar cu șapte limbi. Acum , datorită învățării automate, Google a actualizat aplicația pentru a traduce instantaneu 27 de limbi.

Așadar, data viitoare când vă aflați în Praga și nu puteți citi un meniu, ne-am primit spatele, Otavio Good, inginer software la Google, a scris în cercetarea companiei Blog .

De asemenea, Google tocmai a folosit AI pentru a reduce la jumătate erorile de recunoaștere a vorbirii.

Începând de astăzi, pe lângă traducerea între engleză, franceză, germană, italiană, portugheză, rusă și spaniolă, următoarele 20 de limbi pot fi traduse și în timp real: bulgară, catalană, croată, cehă, daneză, olandeză, filipineză, Finlandeză, maghiară, indoneziană, lituaniană, norvegiană, poloneză, română, slovacă, suedeză, turcă și ucraineană. Și dacă alegeți să faceți o fotografie în loc să urmăriți traducerea textului în direct, sunt acceptate un total de 37 de limbi.

Deci, cum a reușit Google să mărească numărul de limbi disponibile? Au achiziționat mai întâi Word Lens, fostă aplicație de traducere în realitate augmentată, și au folosit rețele neuronale de învățare automată și convoluționale pentru a spori capacitățile aplicației. Progresele în recunoașterea imaginii au fost esențiale.

Acum cinci ani, dacă i-ai dat unui computer imaginea unei pisici sau a unui câine, avea probleme să-i spună care era. Datorită rețelelor neuronale convoluționale, computerele nu numai că pot face diferența dintre pisici și câini, ci chiar pot recunoaște diferite rase de câini, a spus domnul Good. Da, sunt bune pentru mai mult decât doar arta trippy —Dacă traduceți un meniu străin sau semnați cu cea mai recentă versiune a aplicației Google Traducere, utilizați acum o rețea neuronală profundă.

Pas cu pas

Primul , Traducerea trebuie să elimine dezordinea de fundal și să localizeze textul. Când localizează pete de pixeli de aceeași culoare, determină că sunt litere. Și atunci când acele blob-uri sunt apropiate unele de altele, înțelege că este o linie continuă care trebuie citită.

Următorul, aplicația trebuie să recunoască ce este fiecare literă individuală. Aici intervine învățarea profundă.

Folosim o rețea neuronală convoluțională, formând-o pe litere și non-litere, astfel încât să poată învăța cum arată diferite litere, citește postarea de pe blog.

Cercetătorii au trebuit să instruiască software-ul folosind nu doar litere cu aspect curat, ci și litere murdare. Scrisorile din lumea reală sunt afectate de reflecții, murdărie, pete și tot felul de ciudățenii, a scris domnul Good. Așa că ne-am construit generatorul de scrisori pentru a crea tot felul de murdărie falsă pentru a imita în mod convingător zgomotul lumii reale - reflexii false, pete false, ciudățenii false din jur. Unele dintre

Unele dintre literele murdare folosite pentru antrenament. (Foto: Google)

al treilea step este căutarea literelor recunoscute într-un dicționar pentru a obține traducerile. Și pentru o încercare suplimentară de precizie, căutările în dicționar sunt aproximative în cazul în care un S este citit greșit ca un 5.

În cele din urmă, textul tradus este redat deasupra originalului în același stil.

Putem face acest lucru pentru că am găsit și am citit deja literele din imagine, astfel încât să știm exact unde sunt. Putem privi culorile din jurul literelor și le putem folosi pentru a șterge literele originale. Și apoi putem desena traducerea deasupra folosind culoarea originală din prim-plan, se arată în postarea de pe blog.

Pentru a fi cât mai eficient posibil și a permite efectuarea tuturor acestor pași în timp real fără o conexiune la internet sau de date, echipa Google a dezvoltat o rețea neuronală foarte mică, cu o limită superioară pe densitatea informațiilor pe care le poate gestiona. Întrucât își generau propriile date de antrenament, era important să includem datele corecte, dar nimic în plus, astfel încât rețeaua neuronală să nu folosească prea mult din densitatea informațională pe lucruri neimportante. Un exemplu ar fi modul în care trebuie să recunoască o literă cu o ușoară rotație, dar nu prea mult.

În cele din urmă, utilizatorii au rămas cu încă 20 de limbi, dar cu aceeași viteză rapidă.

VEZI ȘI: Echipa de asistență artificială Google ne-a oferit scăderea cercetărilor lor de învățare automată

Articole Interesante