Vaalitiedot analyysissa – työkaluja uteliaalle tutkijalle

Kirjoittajat: Antti Castrén, Paula Ahonen-Rainio, TKK
Artikkeli pdf-muodossa (Positio 2/2009)

Ennakkoluuloton ote ja keskittymiskyky ovat tarpeen, kun lähdetään tutkimaan paikkatietoon kätkeytyviä ilmiöitä pintaa syvemmältä. Moni analyysimenetelmä on pohjimmiltaan yksinkertainen mutta voi hätäisesti tulkittuna näyttää kaoottiselta tai houkutella vääriin johtopäätöksiin.

Teknillisen korkeakoulun geoinformatiikan opiskelijat ovat paneutuneet viime kuntavaalien tuloksiin spatiaalisen ja visuaalisen analyysin menetelmillä. Kiinnostus ei ole ollut niinkään vaalituloksissa kuin menetelmien tarjoamissa mahdollisuuksissa.

Tässä esitellään muutamia esimerkkejä, joissa vaaliaineistoa tarkastellaan sekä uusista että ennestään tutuista näkökulmista. Kaksi ensimmäistä karttaa havainnollistavat laskemalla saatuja analyysituloksia, ja niiden tulkinta edellyttää kulloisenkin analyysin periaatteen ymmärtämistä. Kolmas kartta on osa visuaalisen analyysin ympäristöä, jossa etsitään vuorovaikutteisesti eri näkymien avulla paikkatiedosta merkityksellisiä piirteitä.

Käytetty tilastoaineisto valikoitiin ja ladattiin Tilastokeskuksen verkkopalvelusta. Väestön taustoja koskevat tiedot jouduttiin muuntamaan käsityönä vuoden 2009 kuntajakoa vastaavaksi. Huomioon otettiin ainoastaan kokokuntaliitokset, ja ominaisuustiedot yleistettiin kohdistamalla ne kunnan painopisteeseen.

Äänien alueellinen jakautuminen

Puolueiden kannatuksen alueelliset erot ja samankaltaisuudet tulevat havainnollisesti esiin, kun tarkastellaan puolueiden saamien äänien keskihajontaellipsejä. Kartassa on ellipsien lisäksi merkitty myös valtakunnallinen äänestäneiden painopiste, joka sijaitsee Jämsässä lähellä maan väestön painopistettä.

Suurin osa puolueista saa valtaosan äänistään samoilta alueilta, mutta joukosta erottuvat RKP, Keskusta ja Vasemmistoliitto. RKP:n ellipsi on suunnaltaan poikkeava, kun taas Keskustan ja Vasemmistoliiton ellipsit poikkeavat kooltaan, mikä viittaa suhteellisesti suurempaan alueelliseen hajontaan.

Spatiaalinen autokorrelaatio

Yksi kiinnostava näkökulma kuntavaaliaineistoon on kuntien samankaltaisuus naapureidensa kanssa. Sitä kuvaa eri muuttujien arvojen spatiaalinen autokorrelaatio eli samankaltaisuuden aste naapurikuntien vastaavien arvojen kanssa.

Useimmiten paikkatietoaineistosta lasketaan kullekin muuttujalle ainoastaan yksi koko aineistoa kuvaava niin sanottu globaali tunnusluku. Tunnetuin näistä on Moranin indeksi.

Indeksin vaihteluväli on +/-1 siten, että 1 merkitsee täydellistä autokorrelaatiota, 0 täydellistä satunnaisuutta ja -1 täydellistä hajaantuneisuutta. Esimerkiksi shakkilaudalla mustan kaikki naapurit ovat aina valkoisia ja päinvastoin, jolloin Moranin indeksi saa arvon -1. Jos kaikki valkoiset ruudut asettuisivat vierekkäin laudan toiseen reunaan ja mustat toiseen, ruudut olisivat suurimmaksi osaksi naapureidensa kaltaisia ja Moranin indeksin arvo olisi lähellä 1:tä.

Esimerkissä laskettiin yksittäiselle muuttujalle myös paikallinen autokorrelaatio Moranin indeksin lokaalilla versiolla. Muuttujana on Kokoomuksen osuus kunnan valtuustopaikoista niissä kunnissa, joiden arvo muuttujalle on poikkeuksellisen samankaltainen tai poikkeuksellisen erilainen naapurikuntiin verrattuna.

Kuvaaja havainnollistaa sekä globaalia että lokaalia Moranin indeksiä. Akselien mitta-asteikko kuvaa poikkeamaa keskiarvosta keskihajontana ilmaistuna. Origossa on muuttujan kaikista Suomen kunnista laskettu keskiarvo. Vaaka-akselilla on kyseisen kunnan poikkeama ja pystyakselilla kyseisen kunnan naapureiden keskimääräinen poikkeama. Kun kaikkien kuntien pisteiden mukaan sovitetaan suora, on tämän suoran kulmakerroin globaalin Moranin indeksin arvo.

Kuvaajassa jokainen tähti vastaa yhtä kuntaa. Kuvaajasta on helppo havaita, että valtaosa kunnista sijoittuu vasempaan alaneljännekseen tai oikeaan yläneljännekseen. Tämä tarkoittaa, että Kokoomuksen pienen paikkaosuuden kunnat sijaitsevat lähellä muita pienen paikkaosuuden kuntia, ja suuren paikkaosuuden kunnat sijaitsevat lähellä muita suuren paikkaosuuden kuntia. Poikkeuksiakin löytyy, mutta selkeä trendi on havaittavissa, minkä myös globaali Moranin indeksi ilmaisee.

Kartassa erottuvat Kokoomuksen paikkaosuuden tilastollisesti merkitsevät keskittymät ja poikkeamat keskiarvosta. Samalla kartasta nousee esiin vahva lokaali autokorrelaatio. Sinisissä kunnissa Kokoomuksen osuus paikoista on suuri ja punaisissa pieni. Kirkas väri osoittaa samankaltaisuutta naapureihin nähden ja vaalea poikkeamaa naapureista. Värityksen idea toistuu kuvaajan taustaväreissä. Esimerkiksi Keski-Suomen pohjoisosassa Kinnula erottuu naapureistaan selkeästi suuremmalla osuudella, ja toisaalta muutamat eteläiset rannikkokunnat erottuvat naapureitaan selkeästi pienemmillä osuuksilla.

Sinisissä kunnissa Kokoomuksen osuus valtuustopaikoista on keskimääräistä suurempi. Kirkkaansinisten kuntien naapureilla on samanlainen tilanne, kun taas vaaleansinisten kuntien naapureilla osuus on keskimääräistä pienempi. Punaisissa kunnissa Kokoomuksella on keskimääräistä pienempi osuus valtuustopaikoista. Kirkkaan punaisten kuntien naapureilla on samanlainen tilanne, kun taas vaaleanpunaisten kuntien naapureilla osuus on keskimääräistä suurempi. Valkoisissa kunnissa samankaltaisuus tai ero naapureihin on satunnainen.

Visuaalinen analyysi tutkijan työkaluna

Visuaalisen analyysin menetelmillä lähdetään tutkimaan tuntematonta. Tavoitteena on paljastaa aineistosta piirteitä, joihin ei laskemalla ole osattu tarttua. Tällaisia piirteitä voivat olla useiden muuttujien väliset riippuvuudet, erilaiset klusterit, trendit ja poikkeamat. Kuntavaaliaineiston kätkemiä ilmiöitä on aikojen saatossa pureskeltu niin paljon, ettei esimerkissä kuitenkaan liikuta aivan tuntemattomalla maaperällä.

Esimerkissä on työkaluna joukko ominaisuustietojen tutkimiseen sopivia visuaalisia menetelmiä ja niihin linkitetty karttanäkymä. Kuvan alareunassa on yhdensuuntaiskoordinaatit eli PCP (parallel coordinate plot), joka näyttää jokaisen kunnan murtoviivana. Kuntaviivat kulkevat muuttujia esittävien pystyakselien kautta sen mukaan, mikä muuttujan arvo on kyseisessä kunnassa.

PCP:n vasemmanpuoleinen akseli, joka kuvaa naisten saamaa osuutta kunnan valtuustopaikoista, on jaettu kolmeen arvoväliin, ja kuntaviivat on väritetty näiden mukaan.

Visuaalisessa analyysissa on olennaista, että eri esitystavat on linkitetty toisiinsa niin, että kohteiden korostaminen toistuu yhtaikaa kaikissa näkymissä, jolloin eri näkymissä paljastuvia piirteitä voi vertailla.

PCP:ssä kirkkaan punaisella korostettu murtoviiva kuvaa Puolankaa, jossa naiset saivat 66,7 % valtuustopaikoista, mikä on suurin naisten osuus kaikkien kuntien joukossa. Muut akselit esittävät naisten osuutta puolueensa valtuustoryhmässä Kokoomuksen, SDP:n, Keskustan ja Vihreiden osalta.

Samat muuttujat toistuvat matriisissa. Siellä Puolanka löytyy kirkkaan punaisena pisteenä hajontakuvioissa ja vihreänä pikselinä täyttökuvissa. Kartassa Puolanka on korostettu punaisella viivoituksella.

Interaktiivisuudessa voima

Visuaalisen analyysin menetelmien voima on interaktiivisuudessa, jota on vaikea vangita yhteen esimerkkikuvaan. Esimerkiksi PCP:n akseleiden järjestystä voidaan muuttaa, jolloin päästään tutkimaan vierekkäisten muuttujien välisiä korrelaatioita. Värikoodauksen perustana olevan luokittelun voi muuttaa toiseksi tai vaihtaa toiselle akselille. Akseleita voi zoomata ja keskittyä tarkastelemaan vain tietylle arvovälille osuvia kohteita, tai kohdejoukon voi rajata sijainnin perusteella kartasta. Vaihtoehtoisia etenemistapoja on monta, mikä kuuluu tutkivan visualisoinnin luonteeseen. Visuaalisten havaintojen ohjaamana, osin intuitiivisesti vihjeitä seuraten ja osin systemaattisesti edeten etsitään mahdollisia merkityksiä tietomassasta.

PCP:tä staattisempi esitystapa on hajontakuviomatriisi, johon käyttäjä voi valita haluamansa muuttujat. Perinteinen hajontakuvio (scatter plot) esittää kohteet – tässä kunnat – pisteinä kahden muuttujan määrittelemässä koordinaatistossa. Kun tutkittavia muuttujia on enemmän kuin kaksi, kootaan pareittain muodostetut hajontakuviot matriisiksi.

Matriisin ylimmällä rivillä hajontakuvioiden pystyakselina on äänioikeutettujen määrä kunnassa. Kunkin hajontakuvion vaaka-akseli on mainittu matriisin yläreunassa. Hajontakuvioissa Helsinki erottuu yläreunassa yksinäisenä pisteenä ja muusta joukosta vähän ylempänä erottuvat muut 4-6 isoa kaupunkia. Helsingin poikkeavan suuri arvo aiheuttaa ruuhkan alareunaan, missä pisteitä on paljon päällekkäinkin.

Kuvioista nähdään, että naisten osuus on suurissa kaupungeissa suuri (vihreät pisteet) ja pienissä kunnissa pieni (punaiset pisteet) paria kuntaa lukuun ottamatta. Suuria naisten osuuksia löytyy kuitenkin kaikenkokoisista kunnista.

Isoissa kaupungeissa naisten osuus Keskustan valtuustoryhmässä vaihtelee huomattavasti ja enemmän kuin naisten osuus muissa puolueissa. Analyysin seuraavassa vaiheessa voisi ottaa tarkasteltavaksi valtuustopaikkojen määrän naisten osuuden rinnalle. Se osoittaisi, että kun puolueen valtuustopaikkojen määrä on pieni (niin kuin Keskustalla isoissa kaupungeissa), pienetkin määräerot sukupuolten välillä johtavat isoihin eroihin osuuksissa. Esimerkiksi Helsingin valtuustossa Keskustalla on kolme naista ja Espoon valtuustossa kolme miestä, ja naisten osuus on vastaavasti 100 % ja 0 %.

Toiseksi ylimmän rivin kuvioissa naisten osuutta puolueensa valtuustoryhmässä (vaaka-akselit) tarkastellaan suhteessa naisten osuuteen koko valtuustossa (pystyakseli). Kuvioiden pystyreunoille kertyneet pisteet esittävät kuntia, joissa puolueen kaikki valtuustopaikat ovat naisilla (oikea reuna, naisten osuus 100 %) tai miehillä (vasen reuna, naisten osuus 0 %).

Ensinnäkin huomion kiinnittää Keskustan kuvio, jossa on eniten positiivista riippuvuutta naisten koko valtuusto-osuuden ja puolueen naisosuuden välillä. Positiivisesta riippuvuudesta ei kuitenkaan voi suoraan päätellä, että näiden muuttujien välillä olisi syy-seuraus-suhde!

Sen sijaan SDP:n ryhmässä naisilla on suuri osuus useammassa sellaisessakin kunnassa, jossa naisten osuus koko valtuustossa on pieni, sekä päinvastoin.

Toiseksi huomion kiinnittää Vihreiden kuvio, jossa lähes kaikki punaiset pisteet ovat pakkautuneet vasempaan laitaan, eli Vihreiden naisten osuus on nolla varsinkin kunnissa, joissa naisten osuus valtuustopaikoista on pieni. Seuraavilla riveillä puolueiden välisissä kuvioissa ei ole havaittavissa vahvoja trendejä.

Naisten osuutta Vihreiden valtuustoryhmässä esittävä histogrammi ja hajontakuvat poikkeavat selvästi toisten puolueiden kuvaajista. Sekä histogrammi että hajontakuvat matriisin oikean reunan sarakkeessa kertovat, että useassa kunnassa naisten osuus Vihreiden valtuustoryhmässä on nolla. (Jos mukana olisi muuttuja Vihreiden valtuustopaikkojen määrästä, nähtäisiin että monessa näistä kunnista ei ole Vihreitä edustajia lainkaan).

Toisaalta nähdään, että Vihreiden valtuustoryhmä on muiden puolueiden valtuustoryhmiä useammin kokonaan naisten hallussa (pisteet kuvien oikeassa reunassa).

Kunnan äänioikeutettujen määrän ja Vihreiden naisten valtuustoryhmäosuus välinen yhteys näkyy täyttökuvassa matriisin vasemmassa alakulmassa. Tumman violetit pikselit (kunnat, joissa suuri äänioikeutettujen määrä) ovat kerääntyneet kuvan yläreunaan (jossa naisten osuus valtuustopaikoista on suurin). Samansuuntainen asetelma, joskaan ei yhtä selvänä, on täyttökuvassa Keskustan naisosuuden ja naisten kokonaisosuuden välillä toiseksi alimmalla rivillä toisena vasemmalta.

Dipl.ins. Antti Castrén työskentelee Merenkulkulaitoksessa merikartoitustietojen parissa. Hän toimi juuri päättyneen lukuvuoden opetusassistenttina Teknillisessä korkeakoulussa. TkT Paula Ahonen-Rainio on kartografian lehtori Teknillisessä korkeakoulussa, sähköposti: paula.ahonen-rainio[at]tkk.fi
 

21.6.2010 00:48