Lisää puheentunnistusta ja automaattikäännöksiä videoihin

Leevi Kokko, 31.1.2010.

Puolisentoista vuotta sitten Google sai puheentunnistuksensa sille tasolle, että saattoi tuoda tekniikan käyttöön muutamille Youtube-kanaville. Videoiden käyttö ja lataus Youtube-palveluun kasvaa edelleen käsittämätöntä vauhtia: kuukauden takaisen New York Timesin artikkelin mukaan lokakuussa 2009 keskimääräinen Youtube-kävijä katsoi 83 videota kuukaudessa, kun vuotta aiemmin sama luku oli 53. Kesällä 2008 Youtubeen ladattiin 13 tuntia videota minuutissa – nyt luku on jo 2o.

Google tekee tilinsä käytännössä täysin kontekstuaalisella mainonnalla, jonka keskeisin komponentti on käyttäjien hakuihin mainoksia kohdistava algoritmi. Samalla logiikalla Google kohdistaa myös mainosverkostonsa kautta muilla sivuilla käyttäjälle näytettävät mainokset. Ei siis ole ihme, että Google on viime vuodet kehittänyt raivokkaasti tapaa pystyä muuttamaan videoissa esiintyvä puhe tehokkaasti tekstiksi, koska tämä teksti on vuorostaan mahdollista muuttaa rahaksi mainosten kohdentamistarkkuuden kasvaessa huikeasti tämän myötä.

Marraskuussa 2009 Google ilmoitti, että valitut kumppanit saavat käyttöönsä tämän auto-caption -ominaisuuden (eli automaattisen puheentunnistuksen tekstiksi), ja kaikelle muulle englanninkieliselle materiaalille tarjolla on auto-timing, eli mikäli lataat palveluun englanninkielisen videon, voit ladata sen kyljessä mukaan tekstitiedoston ja Googlen algoritmi päättelee missä kohtaa mikäkin teksti esiintyy ja näyttää tekstit sen mukaisesti.

Toinen komponentti, jolla on mielenkiintoinen yhtymäkohta puheentunnistukseen, on reaaliaikainen käännöspalvelu, jonka viimeisintä versiota voi käydä kokeilemassa osoitteessa http://translate.google.com/. Vaikka käännös ei todellakaan aina osu kieliopillisesti kohdalleen, tekstin sisällön merkitys useimmiten on pääteltävissä – mikä lienee minkä tahansa kääntämisen perustehtävä.

Automaattisen puheentunnistuksen ja reaaliaikaisen käännöstyökalun  yhdistelmä avaa häkellyttäviä mahdollisuuksia tiedon löydettävyyden ja demokratisoinnin (sekä tietenkin monetisoinnin) näkökulmasta. Alla on esitetty Googlen omalta Youtube-kanavalta löytyvän Google Voice in Your Mobile Browser -videon avulla miten automaattista tekstitystä ja käännöstä saa kokeiltua käytännössä.

Valitse oikeasta alakulmasta “cc” ja “Transcribe Audio”

Palvelu ilmoittaa varmuudeksi, että kyseessä on Beta.

Tekstit näkyvät planssina videon päällä

Käännöksen saa päälle klikkaamalla “Translate Captions”

Kieliä on tarjolla viitisenkymmentä

Pian käännetyt tekstiplanssit alkavat juosta videon päällä

Kaiken kaikkiaan on todettava, että puheentunnistuksen horjuva taso tosiaankin vaatii vielä beta-leiman lyömisen palvelun päälle. Esimerkiksi lause “switch to the inbox to see all your transcribed voicemails and text messages you’ve received” on Googlen puheentunnistuksen mielestä “switch to the Imax to see all your transcript policeman’s and text messages you proceed”. Kun ko. lause vielä huonosta puheentunnistuksestä käännetään, vahinko kertautuu ja ruudulla lukee “siirtyä Imax nähdä kaikki transkriptio poliisi n ja tekstiviestejä jatkat”.

Hupaisin tästä videosta löytynyt yksittäinen tulkinta löytyy lopusta, jossa lukija pyytää katsomaan lisätietoja verkosta, “visit m dot google dot com”, ja konetulkin mielestä “visit and doctor will not come”…

Nähtäväksi jää, miten pian ominaisuus rullataan Youtubessa tuotantoon kaiken sisällön osalta, sekä miten pian puheentunnistusalgoritmi alkaa oppia muita kieliä kuin englantia.

Hakukoneoptimointiin vaikuttavia seikkoja kannattaa videoiden osalta miettiä siis vakavasti, ja mikäli yrityksesi tai yhteisösi tuottaa videoita osana verkkostrategiaa, tekstitystiedostojen lataaminen videoiden mukana palveluun ei ole missään nimessä turhaa puuhaa – sen voi tehdä manuaalisesti jo nyt. Tämä Googlen oma video näyttää miten homma Youtubessa tehdään.

Työkalupuolellakin on tapahtunut tämän osalta jo paljon, ja tässä Adoben sivuilta löytyvässä opasvideossa näytetään, miten Adobe Premieren avulla on mahdollista muuttaa puhe tekstiksi.

Lue lisää kategoriasta Google, Hakukoneet, Internetmarkkinointi. Jos tahdot kommentoida, klikkaa tästä: 1 kommentti. Tilaa kommentit RSS-syötteenä, tai lähetä trackback.

Jätä kommentti

Nimesi (pakollinen)

Sähköposti (ei näy muille, pakollinen)

Sivusto

Kommentit

1 kommentti
  1. [...] This post was mentioned on Twitter by Leevi Kokko, Sami Pekkola. Sami Pekkola said: RT @leevikokko: Googlen puheentunnistus ja reaaliaikaiset käännökset – buginen nykytila, huima potentiaali: http://bit.ly/97w1gw [...]

© All Content Copyright Leevi Kokko. Original theme by Speckyboy. Found at Wordpress Themes.  Clicky Web Analytics

Clicky