Flickr-kuvat täydentävät säähavaintoja

Otto Hyvärinen ja Elena Saltikoff, Ilmatieteen laitos

Artikkeli pdf-muodossa (Positio 1/2011)


Matti Meikäläisten verkkoon lataamat valokuvat auttavat arvioimaan kaukokartoitustuotteiden laatua.

Yhä useammat meistä julkaisevat henkilökohtaisia muistiinpanojaan tietoverkoissa, kuten Twitterissä, Facebookissa ja Flickrissä. Varsinkin valokuva-albumeihin kertyy kuvan lisäksi lähes huomaamatta hyödyllinen tietomassa, jota voidaan käyttää esimerkiksi kaukokartoitustuotteiden laadun arvioinnissa.

Ilmatieteen laitoksen meteorologisessa tutkimuksessa olemme täydentäneet perinteisiä säähavaintoja yhdysvaltalaisen Flickr-kuvapalvelun kuvilla. Kuviin liittyy runsaasti metatietoja, kuten kuvan otsikko, lyhyt kuvailu kuvan sisällöstä, julkaisuaika ja EXIF-tiedot kameran asetuksista. EXIF-tietoon sisältyy kuvausaika ja mahdolliset GPS-koordinaatit. Tutkimuksen tekoaikaan palvelussa oli avoimesti käytettävänä yli miljardi valokuvaa, joista noin kuusi prosenttia sisälsi paikkatietoja. Näitä kuvia on otettu lähes kaikkialla maailmassa, eniten Euroopasta, Pohjois-Amerikasta ja Itä-Aasiasta.

Kuvien hakeminen helpottuu, jos kuvaaja on liittänyt Flikcr-kuvaan avainsanoja kuten lumi ja raekuuro. Avainsanat ovat usein yksiselitteisempiä kuin vapaamuotoinen teksti kuvan otsikossa tai kuvailussa. Siksi etsimme kuvia sääilmiöistä juuri avainsanojen avulla.

Valokuvat tutkahavaintojen tukena

Ensimmäisessä tapaustutkimuksessamme testasimme tuotetta, jolla pyritään tunnistamaan rakeita yhdistämällä tietoja ilmakehän lämpötilan pystyjakaumasta ja säätutkan mittauksista. Laaduntarkkailua varten etsimme Flickristä avainsanojen avulla valokuvia, joissa on rakeita.

Esimerkkikuvamme oli otettu golfkentällä 17.7.2008 lähellä Vaasaa. Vertasimme sitä samanaikaisiin tutkakuviin Pohjanmaalta. Tutkakuvissa näkyvistä kuuropilvistä rae-algoritmi tunnisti ne pilvet, joista voi tulla rakeita. Yksi algoritmin tunnistamista raekuuroista oli kuvanottopaikan päällä - algoritmi toimi tässä tapauksessa oikein.

Samanlaisia tapaustutkimuksia olemme tehneet muistakin säätutkaan perustuvista rae- ja tornadoalgoritmeista. Vaikka Flickr-havaintoja on vähän, ne täydentävät harvalukuisia sääasemilla tehtyjä rae- ja tornadohavaintoja.

Aikaleimat täsmäävät Big Benin viisareihin

Arvioimme Flickr-kuvien käytettävyyttä mittaamalla paikka- ja aikaleimojen virhettä. Verratessamme tunnetuista maamerkeistä otettujen kuvien GPS-koordinaatteja karttatietoihin saimme paikkatiedon tyypilliseksi virheeksi alle kilometrin. Virheen suuruus riippuu kohteen luonteesta, koska kuvaajat nimeävät kuvansa kohteen eivätkä kuvauspaikan mukaan. Kauas näkyvän kohteen (Eiffel-torni tai tornado) ja kuvauspaikan välinen etäisyys on usein suurempi kuin lähikohteen (Jim Morrisonin hauta tai maahan pudonnut rae).

Aikaleimojen virhettä arvioimme vertaamalla Lontoon Big Benin viisarien asentoa siitä otettujen kuvien aikaleimoihin. Vertasimme vain minuuttiviisaria, sillä turistit siirtävät kameraansa harvoin paikalliseen aikaan. Valtaosassa kuvista ero oli alle kaksi minuuttia. Erityisesti GPS-koordinaatit sisältävistä kuvista missään ei ollut yli 10 minuutin virhettä. 

Kertooko Finland lumesta?

Toisessa tutkimuksessa vertasimme satelliittipohjaisia lumikarttoja, joita ovat tuottaneet eurooppalainen EUMETSAT ja yhdysvaltalainen NOAA. Alueita, joissa molempien tuotteiden mukaan oli lunta, pidimme varmoina lumitapauksina. Näiltä alueilta haimme kaikki Flickr-kuvat, jonka jälkeen niiden avainsanat järjestettiin informaatiosisällön mukaan.

Hyödyllisin avainsana oli snow, ja kärkisijoille pääsivät ski, schnee, ice ja skiing. Valitettavasti kärkeen sijoittui myös vähemmän hyödyllisiä avainsanoja, kuten maantieteeseen liittyvät Switzerland, Finland ja Alps sekä ajankohtaa kuvaavat winter ja christmas. Emme löytäneet hyödyllisiä avainsanoja, jotka olisivat kertoneet milloin lunta ei ole kuvissa. Pelkkiin avainsanoihin pohjautuva validointi voi siis jäädä puolitiehen, koska emme voi tutkia milloin ilmiötä ei esiinny.

Suositellaan tapaustutkimukseen

Mielestämme Flickr-kuvia ja niiden metadataa voi käyttää kaukokartoitustuotteiden laadun arvioinnissa. Koska GPS-paikannetut kuvat ovat luotettavia ja helposti käytettäviä todisteita jonkin ilmiön esiintymisestä tietyssä paikassa tiettyyn aikaan, voimme suositella niiden käyttöä etenkin tapaustutkimuksissa.

Flickr-kuvat ovat esimerkki aineistosta, jota ei ole alkujaan kerätty tutkimusta varten, mutta jonka pohjalta voi helposti tehdä alustavia selvityksiä. Vakiintuneen tuotteen laadunseurantaan voi järjestää myös organisoituja vapaaehtoisten ryhmiä; Ilmatieteen laitoksella on hyviä kokemuksia monivuotisesta yhteistyöstä Ursan myrskybongarien kanssa.

Vaikka tutkimuksessamme lumettomalla kuvalle ei löytynyt avainsanoja, muissa tutkimuksessa ilmiön puuttumiseen liittyviä avainsanoja voi löytyä. Joihinkin ilmiöihin keksimme mahdollisia avainsanoja: jäähavainnoissa avanto ja pilkkiminen kertovat että jäätä on, mutta uimassa ja kaarnalaiva viittaavat luultavasti avoveteen.

Koska avainsanojen käyttöön liittyy rajoitteita, toivottavasti pian kehitetään menetelmiä, joilla kuvia voidaan analysoida ja luokitella automaattisesti. Vasta sitten kuvavarastojen laajamittainen hyödyntäminen voi alkaa.

Otto Hyvärinen ja Elena Saltikoff toimivat tutkijoina Ilmatieteen laitoksen Meteorologisessa tutkimuksessa. Tehtävät painottuvat sään kaukokartoitussovelluksiin ja niiden laadun arviointiin. Tämä artikkeli pohjautuu enimmäkseen artikkeliin Social Media as a Source of Meteorological Observations, doi:10.1175/2010MWR3270.1

Sähköposti: etunimi.sukunimi[at]fmi.fi
 

24.3.2011 14:24