Deklinaatio: Luotettavaa ja tunnettua vai vapaata tietoa?

Kirjoittaja: Antti Jakobsson, Eurogeographics

Artikkeli pdf-muodossa (Positio 4/2010).

Paikkatiedot ovat jokaisen ulottuvilla ainakin Googlen, Yahoon ja Microsoftin tuottamana. Entistä useammin törmää näkemykseen, ettei esimerkiksi kansallisia karttalaitoksia tarvita vaan tieto voidaan tuottaa vapaaehtoisten avulla.

Paikannustekniikan ja sovellusten avulla paikkatietojen tuottaminen on tullut entistä helpommaksi, ja kaupunkiympäristöstä löytyy tarpeeksi vapaaehtoisia päivittämiseen.  Päivittäminen voi olla myös passiivista kuten nagivointilaitteiden valmistajien hyödyntämä tieto käyttäjien liikkumisesta.
Kansallisten karttalaitoksien strategioissa muutostarve onkin monesti tunnustettu, mutta silti tietoja ei välttämättä ole saatavilla ainakaan ilmaiseksi. Palvelut on monesti suunnattu ns. ammattikäyttäjille, ja kansalaisten palvelut ovat Googlen ja muiden kaupallisten toimijoiden varassa.  Suomessa on tunnetusti laadukkaita paikkatietoja, mutta onko niiden käyttö maksimoitu?

Inspire-direktiivin oletuksena on, että kansalaiset saavat katsella tietoja ilmaiseksi. Sitä varten rakennetaan paikkatietoportaaleja. Suomessa Maanmittauslaitos ja muut paikkatietojen tuottajat ovat tuoneet osan tiedoista saataville Paikkatietoikkunan kautta. Inspire ei kuitenkaan tuo kaikkea hyödyllistä paikkatietoa saataville. Kiinteistötiedot tai kauppahintatiedot saa vierailemalla virastossa, vaikka ne on ammattilaisille tuotu verkkoon katseltavaksi.

Inspire-direktiivi määrittelee ns. peruspaikkatiedoiksi liitteiden 1 ja 2 mukaiset tiedot. Niiden avulla pitäisi voida linkittää muut teemakohtaiset paikkatiedot.

Yksi teema on paikannimet. Paikannimi on tärkeä tunnistustieto yhdessä osoitteen kanssa. Ennen haja-asutusalueen osoitejärjestelmän käyttöönottoa paikannimen merkitys oli vieläkin suurempi kuin nykyään.  Silti paikanimen perusteella voidaan linkittää yhä monelaista tietoa. Paikannimistöstä saatiin ainakin muutama vuosi sitten eniten palautetta maastokartan päivityksen yhteydessä.

Yleisön käyttämät paikkatietopalvelut ovat usein globaalin toimijan tekemiä

Yleisön käyttämät paikkatietopalvelut ovat entistä useimmiten globaalin toimijan tekemiä. Samoin aineistot ovat yhä useimmiten kansainvälisen toimijan kautta yhdistettyjä.  Toimijat ovat usein melko kaukana alkuperäisestä tietolähteestä. Yksittäisen palautteen käsittely saattaa kestää kauan ja virheen korjaaminenkin on sattumanvaraista. Muista, kun navigoinnin yleistettyä taksien järjestelmät yrittivät oikaista Keravalle erään yksityistien kautta, josta läpikulku on kielletty. Yli viisi vuotta myöhemmin eräs navigointijärjestelmä kehoitti edelleen kääntymään kyseisestä risteyksestä.

Virhe, jonka itse koin Pariisissa Googlen karttoja käyttäessäni, oli tehty rautatieasemien nimeämisessä. Yksi asema oli jäänyt väliin. Sen seurauksena harhailimme metsikössä etsimässä Chambordin linnaa, jota tietenkään ei löytynyt, koska olimme jääneet väärällä asemalla pois. Googlen tulosteen kanssa ei ollut muuta vaihtoehtoa kuin palata takaisin Pariisiin.

Suomen kattavin paikannimistö on Maanmittauslaitoksella,  ja se toimittaa paikannimistön EuroGeographics:n EuroGeoNames palveluun(i). Globaalin paikannimistöpalvelun on tehnyt yhden miehen yritys GeoNames.org, jota voinee pitää esimerkkinä vapaaehtoistyöstä. Alkuperäinen nimistö palveluun tulee Yhdysvaltain armeijan keräämistä tiedoista.

Kokeilin palveluja hakusanalla Kerava. Geonames.org löytää hakusanalla Kerava kolme kohdetta, joista kaksi sijaitsee Suomessa.  Yksi on joki Salomonsaarilla. Maanmittauslaitoksen Karttapaikka löytää samoin kolme kohdetta: kaksi Keravalla ja yhden talon Lopella. EuroGeographicsin EuroGeoNames-palvelu löytää neljä kohdetta: yhden Liettuasta ja samat kohteet kuin Karttapaikka Suomesta. Yahoon karttasovellus löytää Keravan, mutta se sijaitseekin moottoritien risteyksessä samoin kuin Microsoftin karttapalvelu Bingin löytämä Kerava. Tietolähteenä näissä on Navteqin aineisto. Googlen karttojen Kerava on lähellä asemaa.

Kaikki palvelut osuivat siis suurinpiirtein hollille, eli käyttäjä pystyy taustakartan avulla päättelemään, missä Kerava sijaitsee.Taustakarttojen laadusta voisi tehdä oman juttunsa. Palveluissa on kuitenkin muitakin eroja kuin nimen sijainti ja käyetty taustakartta. GeoNames tietää Keravan sijaitsevan Suomessa. Se tietää, että Kerava on asutusnimi ja osa hallinnollista jakoa, mutta ei tiedä, että näiden välillä on yhteys. Se tietää Keravan ruotsinkielisen nimen ja kirjoitusasun venäjäksi (mutta käyttäjän pitää tietää, että muut annetut nimet ovat ruotsi ja venäjä). Lisäksi se tietää Keravan asutusluvun olevan 31347 (oikea luku 34133 30.9.2010/Väestörekisterikeskus). EuroGeographicsin palvelu kertoo nimen päivitetyn vuonna 2008, sen kielisyyden, yksilöintitunnuksen sekä tietolähteen nimen. Lisäksi se antaa tietojen metatietokuvauksen.

Jos vertaillaan tietomääriä, Suomen paikkatietonimistö kattaa yli 800 000 nimeä, EuroGeographics:n  paikkatietonimistö 3 miljoonaa nimeä (kattavuus tällä hetkellä 14 maata), GeoNames.org  noin 7 miljoonaa ja Yahoon GeoPlanet noin 5 miljoonaa nimeä (GeoNames ja Geoplanetin vertailu katso([i]). Kattavuudeltaan GeoNames on ylivertainen, koska se kattaa koko maailman. Aineiston päivityksistä ei ole yksilöityä tietoa, ja se perustuu vapaaehtoisuuteen.

Vapaalla paikkatiedolla on oma roolinsa. Se on tuonut paikkatiedot kaikkien käytettäväksi ja pakottaa viranomaiset tuomaan omat tietonsa käytettäväksi. Tietojen luotettavuuden ja lähteen merkitys kasvaa silloin, kun on todella tärkeää, että tieto on oikeaa. Maanmittauslaitos on panostanut paikannimistön tarkistamiseen esimerkiksi kielitoimiston keräämän alkuperäisen aineiston avulla. Jos olisin käyttänyt esimerkissäni luonnon nimistöä tai vaikkapa saamenkielistä nimeä, ei nimeä olisi löytynyt mistään muusta kuin Maanmittauslaitoksen tai EuroGeographicsin palvelusta.

Entistä useampi tiedon tarjoaja panostaa tiedon laatuun ja sen luotettavuuteen. Esimerkiksi Euroopan ympäristokeskus (EEA) näkee, että sen keskeinen tehtävä on panostaa tiedon oikeellisuuteen. Toisaalta se pyrkii tuomaan tietonsa kaikkien käyttöön pilvipalveluiden ja mm. Googlen kautta.

Tiedot globaalin palvelujentarjoajien ulottuville

Säännöllinen tietojen päivittäminen on tärkeää, ja peruspaikkatietojen ylläpitoon pitää investoida. Tärkeää on, että tiedontuottajat tuovat tietonsa myös globaalin yhteisön käyttöön. On mielenkiintoista nähdä, miten tässä onnistutaan. EuroGeographics:ssa työskennellessä huomaa, miten vaikeaa on joskus saada kaikki jäsenet toimimaan yhteisen hyvän eteen. EuroGeographicsin EuroGeoNames on ensimmäinen Inspire-yhteensopiva palvelu, joka perustuu hajautettuun tietojen ylläpitoon kansallisten karttalaitosten toimesta. Tavoitteena on viedä palvelu osaksi Inspire-geoportaalia, geonames.org palvelua ja muiden ylikansallisten toimijoiden palvelua.  Saavutammeko luottavuuden, tunnettavuuden ja vapaan paikkatiedon edut?

Kirjoittaja toimii EuroGeographicsin programme managerina.
Sähköposti: antti.jakobsson[at]eurogeographics.org

EuroGeographics on 56 kansallisen maanmittauslaitoksen muodostama yhteistyöjärjestö, joka pyrkii tuomaan jäsenien tietovarannot osaksi eurooppalaista/globaalia paikkatietoinfrastruktuuria.

i http://www.eurogeonames.com:8080/RefAppl3/ReferenceApplication/ReferenceApplication.html (huom! palvelu ei toimi Internet Explorer 8:lla)

ii http://www.cosmocode.de/en/blog/schoenborn/2010-01/24-free-geo-data-solutions-compared-geonames.org-vs.-yahoo-geoplanet

17.12.2010 09:58