Huvud Innovation Google AI låter nu användare omedelbart översätta text på 27 språk med telefonkameror

Google AI låter nu användare omedelbart översätta text på 27 språk med telefonkameror

(Gif: Google)

(Gif: Google)

Tack vare artificiell intelligens har resor utomlands aldrig varit enklare.

Google Translate-appen låter användare översätta text direkt. I appen riktar du bara kameran mot texten du vill översätta och du ser den förvandlas till ditt önskade språk live, precis framför dina ögon - ingen internetanslutning eller mobiltelefondata behövs. Den här praktiska funktionen har funnits under en tid, men den hade bara varit kompatibel med sju språk. Nu , tack vare maskininlärning, har Google uppgraderat appen för att omedelbart översätta 27 språk.

Så nästa gång du är i Prag och inte kan läsa en meny har vi ryggen, skrev Otavio Good, mjukvaruutvecklare på Google, om företagets forskning Blogg .

Google använde också AI för att halvera sina taligenkänningsfel.

Från och med idag kan följande 20 språk förutom översättningen mellan engelska, franska, tyska, italienska, portugisiska, ryska och spanska också översättas i realtid: bulgariska, katalanska, kroatiska, tjeckiska, danska, nederländska, filippinska, Finska, ungerska, indonesiska, litauiska, norska, polska, rumänska, slovakiska, svenska, turkiska och ukrainska. Och om du väljer att ta en bild istället för att se texten översättas live, stöds totalt 37 språk.

Så hur kunde Google öka antalet tillgängliga språk? De förvärvade först Word Lens, tidigare en applikation för förstärkt översättningsverksamhet, och använde maskininlärning och fackliga neurala nätverk för att förbättra appens kapacitet. Framstegen inom bildigenkänning var nyckeln.

För fem år sedan, om du gav en dator en bild av en katt eller en hund, hade den svårt att berätta vilken som var. Tack vare fackliga neurala nätverk kan inte bara datorer se skillnaden mellan katter och hundar, de kan till och med känna igen olika hundraser, sa Mr. Good. Ja, de är bra för mer än bara trippy konst —Om du översätter en utländsk meny eller skriver med den senaste versionen av Googles Translate-app använder du nu ett djupt neurala nät.

Steg för steg

Först , Översätt måste rensa bort bakgrundsröra och hitta texten. När den lokaliserar pixlar av samma färg bestämmer det att de är bokstäver. Och när dessa klumpar är nära varandra förstår det att det är en kontinuerlig rad som ska läsas.

Nästa, appen måste känna igen vad varje enskild bokstav är. Det är här djupt lärande kommer in.

Vi använder ett fackligt neuralt nätverk och tränar det på bokstäver och icke-bokstäver så att det kan lära sig hur olika bokstäver ser ut, läser blogginlägget.

Forskarna var tvungna att träna programvaran med inte bara snygga bokstäver utan också smutsiga. Bokstäver i den verkliga världen skämmas av reflektioner, smuts, fläckar och all slags konstighet, skrev Mr. Good. Så vi byggde vår brevgenerator för att skapa alla slags falska smuts för att på ett övertygande sätt efterlikna den verkliga världens buller - falska reflektioner, falska fläckar, falska konstigheter runt om. Några av

Några av de smutsiga bokstäverna som används för träning. (Foto: Google)

De tredje steg är att leta upp de igenkända bokstäverna i en ordbok för att få översättningarna. Och för ett extra försök till noggrannhet är ordbokssökningar ungefärliga om en S missläses som en 5.

Slutligen, den översatta texten återges ovanpå originalet i samma stil.

Vi kan göra det eftersom vi redan har hittat och läst bokstäverna i bilden så att vi vet exakt var de är. Vi kan titta på färgerna som omger bokstäverna och använda den för att radera originalbokstäverna. Och sedan kan vi rita översättningen ovanpå med den ursprungliga förgrundsfärgen, läser blogginlägget.

För att vara så effektiv som möjligt och låta alla dessa steg slutföras i realtid utan internet- eller dataanslutning utvecklade Google-teamet ett mycket litet neuralnät med en övre gräns för informationstätheten det kan hantera. Eftersom de genererade sina egna träningsdata var det viktigt att inkludera rätt data men inget extra så att det neurala nätverket inte använder för mycket av sin informationstäthet på obetydliga saker. Ett exempel kan vara hur det behöver känna igen en bokstav med en liten rotation, men inte för mycket.

I slutändan sitter användarna kvar med 20 fler språk men samma snabba hastighet.

SE OCH: Googles AI-team gav oss nedgången i deras maskininlärningsforskning

Intressanta Artiklar