tiistai 28. maaliskuuta 2023

Virheellisten vaalikoneiden valta

Vaalikoneilla on paljon vaikutusvaltaa vaaleissa. On selvää, että sillä on vaikutusta, minkälaisia kysymyksiä vaalikoneissa käsitellään tai mitä kysymyksiä kysymyspatteristossa painotetaan. Mutta iso merkitys on myös sillä, miten algoritmit tulkitsevat vastauksien vastaavuuden ehdokkaiden vastausten kanssa. Tähän vaalikoneen käyttäjällä on suhteellisen heikko näkyvyys, mutta kokeilemalla eri tekijöiden vaikutusta voi jossain määrin tutkia. Ja outouksia niistä on löytynyt. Katsotaanpa esimerkkejä aloittaen tämänhetkisistä vaaleista ja siirtyen aiempiin vaaleihin.

Vuoden 2023 eduskuntavaalien vaalikoneet:


Jocka Träskbäck huomasi Helsingin Sanomien vaalikoneesta virheen (kts. “Hesarin vaalikoneessa virhe - ideologia ohitti matematiikan ), minkä seurauksena sukupuolen moninaisuutta käsittelevä kysymys sai erittäin korkean painotuksen vastaavuuksia määritettäessä. Helsingin Sanomat myönsi virheen kutsuen sitä bugiksi. Virhe sittemmin korjattiin, ja HS myös avasi vaalikoneensa toimintaa. HS avasi pääsyn myös vaalikoneen koodiin, mutta valitettavasti koodista julkistettiin kuitenkin vain tuorein, korjattu versio, ei versiohistoriaa, josta olisi voinut helposti tarkastaa, mitä koodista varsinaisesti korjattiin. Ja tietysti yhdestä virheestä herää helposti kysymys, onko muitakin vastaavia virheitä.


Itse taas olen tämän vuoden vaalikoneita kokeillessani kiinnittänyt huomiotani siihen, että sekä Hesarin että MTV-uutisten vaalikoneissa on Helsingin vaalipiirissä yksi mustan aukon lailla toimiva ehdokas, nimittäin Venäjä-mielinen Johan Bäckman. Valitsemalla moneen kysymykseen keskimmäisen vaihtoehdon eli “Ei samaa eikä eri mieltä” (HS) tai “En osaa sanoa” (MTV), hän saattaa hyvinkin nousta yhteensopivimpien listalle, ellei jopa yhteensopivimmaksi ehdokkaaksi. Tähän on periaatteessa yksinkertainen syy: kun katsoo Bäckmanin vastauksia, hän on poikkeuksetta jättänyt kysymykseen vastaukseksi keskimmäisen vaihtoehdon, ja perusteluina on löytynyt vain vihaisia kommentteja, joissa haukutaan vaalikoneen kysymykset ilman kummempia perusteluja esim. näin: “Hävyttömän johdatteleva ja vääristelevä kysymys.” Käytännössä Bäckman ei siis ole edes valinnut mitään vastauksia, kunhan vain on mukana vaalikoneessa, jotta olisi esillä.


No, nyt voi tietysti kysyä, että eikö olekin oikein, että jos vastaa samalla tavalla kuin ehdokas, pitäisi ehdokkaan näkyäkin yhteensopivana ehdokkaana? Osin toki näin. Tässä on kuitenkin useampi mutta: 

  • Keskimmäisen vaihtoehdon valitseminen tarkoittaa usein sitä, että ei ole asian suhteen vahvaa mielipidettä tai ei koe tuntevansa asiaa riittävästi. Se taas viittaa siihen, että aihe ei luultavasti ole äänestäjälle niin merkityksellinen. Tällaisen vastausten yhteensopivuus ehdokkaan ja äänestäjän välilläkin on todennäköisesti selvästi merkityksettömämpi kuin sellaisissa kysymyksissä, joiden osalta on vahvempia mielipiteitä.

  • Monen äänestäjän kohdalla voi olla paljon kysymyksiä, joihin ei oikein osaa ottaa suuremmin kantaa, jolloin keskivaihtoehto saattaa vetää puoleensa.

  • Varsinaisilta ehdokkailta sen sijaan toivoisi lähtökohtaisesti jonkinlaista kannanottoa asioihin, ellei sitten paljon ristiriitaisuuksia kysymyksenasettelu tee sitä liian hankalaa.

  • Sekä HS:n että MTV:n vaalikoneet tarjoavat mahdollisuuden ohittaa kysymyksen, mutta se on sijoitettu selvästi huomaamattomammin varsinaisiin vaihtoehtoihin verrattuna, eikä käyttäjä välttämättä osaa aavistaa “En osaa sanoa”-vaihtoehtojen ohjaavan vaalikoneen valintaa sellaisten ehdokkaisen suuntaan, jotka eivät ota kantaa juuri mihinkään kysymykseen.

    • Esimerkiksi Ylen vaalikoneessa ylläolevaa ongelmaa ei ole, sillä missään kysymyksessä ei ole keskivaihtoehtoa, joten joko on otettava kantaa tai sitten valittava selkeämmin esillä oleva “Ohita kysymys”-vaihtoehto.


Helsingin Sanomien vaalikone rankaisee sinänsä ehdokasta siitä, jos ehdokas ei valitse mitään, mikä ilmenee vaalikoneen lähdekoodin kommenteista: “If candidate hasn't answered, we can't know their position on the matter, * so we add penalty so that you can't get close matches by only answering * few questions.”. Tämä on sinänsä oikein. Mutta jos muuten ehdokkaiden yhteensopivuus määritetään yksinkertaisesti niin sanottuna Manhattan-etäisyytenä, näkisin, että järjestelmä palkitsee ehdokkaita neutraaleista kannoista tavalla, joka ei ole mielekästä ehdokkaan merkityksellistä yhteensopivuutta määritettäessä.


En tiedä käyttääkö MTV vaalikoneessaan Manhattan-etäisyyttä, mutta Helsingin Sanomat ilmeisesti ainakin käyttää, joskaan ei suoraan kysymyksien, vaan “ideologisten ulottuvuuksien” pingottamassa avaruudessa. Yleisesti ottaen vaalikoneen uuden algoritmin kuvauksesta syntyy kuitenkin äkkiseltään vaikutelma, että siinä missä on pyritty merkityksellisempien vastaavuuksien löytymiseen, on samalla saattanut syntyä tilanne, jossa järjestelmän aiempaa suurempi monimutkaisuus synnyttääkin osin epätarkoituksenmukaisia yhteensopivuuden määrittymisen mekanismeja ja aiempaa suuremman merkityksen sille, miten paitsi itse kysymykset, myös miten niiden “ideologiset ulottuvuudet” on aseteltu. HS:n vaalikone tarjoaa sinänsä mielestäni hyvät työkalut katsoa ehdokkaan tai puolueen mukaan, vertailla useita ehdokkaita kerralla, ja arvokarttavertailut ovat omalla tavallaan mielenkiintoisia tai jopa hyödyllisiä, mutta en ole vakuuttunut, että valittu malli tuottaa muuten äänestäjän kannalta parhaan lopputuloksen.




Vuoden 2019 eduskuntavaalien HS:n vaalikone:


Viime eduskuntavaalien osalta kummastusta herätti se, miten HS:n vaalikone toi esille nimenomaisesti osuvimman puolueen, ja sen osuvimman ehdokkaan, eikä niinkään yleisellä tasolla osuvinta ehdokasta, mistä seurasi se, että vaikka valitsisi täsmälleen samat vastaukset kuin ehdokas X, tämä ehdokas X ei välttämättä näkynyt tulosten kärjessä. Kokoomuksen Tere Sammallahti tuo Youtube-videossaan (kts. Yhdellä puolueella juuri oikeat vastaukset ) esille myös sen, miten Feministisen puolueen olivat vastanneet nimenomaan HS:n vaalikoneessa keskenään samalla tavalla ja miten puolue pääsi siten monien vaalikonetuloksissa kärkeen.



Vuoden 2012 kunnallisvaalien HS:n vaalikone: 


Vuoden 2012 kunnallisvaaleista on jo yli vuosikymmen aikaa, mutta haluan silti tuoda esille silloin tekemäni havainnon, mikä tuo hyvin esille sen, miten omituisesti vaalikoneet voivat toisinaan käyttäytyä. Tuohon mennessä Helsingin Sanomissa oli julkaistu jo toistakymmentä mielipidekirjoitustani, mutta alla olevaa mielipidekirjoitustani ei julkaistu, enkä tullut julkaisseeksi sitä tuolloin edes tässä blogissani. Vaalikoneen toimintaa kuvaava osuus on keskimmäisessä kappaleessa, erikoisin osuus lihavoituna:


Internetin vaalikoneet ovat lähtökohtaisesti varsinkin oikein käytettynä mielestäni loistavia apuvälineitä sopivan ehdokkaan löytämiseksi. Monille vaalikoneet antavat kuitenkin välillä hyvinkin yllättäviä tai jopa huvittavia tuloksia. Mielipiteiden samankaltaisuuksia voi toki löytyä aidostikin yllättäviltä tahoilta, mutta Helsingin Sanomien vaalikoneen kohdalla yllätyksille näyttää olevan selvä syy. 


Tarkemmalla vaalikoneen tutkimisella huomaa, että monessa kysymyksessä vain täysin samasta vastauksesta saa yhteensopivuuspisteitä ehdokkaan kanssa. Tämä tarkoittaa sitä, että jos olit "täysin samaa mieltä" väitteen kanssa, sillä ei ole merkitystä, oliko ehdokas "jokseenkin samaa mieltä" vai "täysin eri mieltä" väitteen kanssa, sillä molemmissa tapauksissa yhteensopivuuspisteitä tulee vain 0. Ei ihme, ettei tällainen pisteytys tuota tarkkoja tuloksia. Vielä eriskummallisempia tuloksia vaalikone antaa, jos erehdyit valitsemaan olevasi "Jokseenkin samaa mieltä". Tästä "Täysin eri mieltä" oleva ehdokas saa 0 yhteensopivuuspistettä, mutta täysin samaa mieltä oleva ehdokas nappaakin kysymyksen painotuksesta riippuvan määrän negatiivisia yhteensopivuuspisteitä. Jos äänestäjä ja ehdokas ovat väitteen kanssa samaa mieltä, mutta eriasteisesti, ehdokas sopii vaalikoneen mukaan siis heikommin kuin jos ehdokas olisi äänestäjän kanssa selvästi eri mieltä! Ei enää ihmetytä, jos osa tuloksista on pahastikin ristiriidassa äänestäjän ajatusten kanssa.


Vaalikoneita käyttäessä on toki aina hyvä katsoa, mitä ehdokkaat ovat vastanneet, ja tehdä omat päätöksensä vasta sitä kautta. Mitä mielivaltaisempaan järjestykseen vaalikone ehdokkaat asettaa, sitä enemmän vaivannäköä näiden vastausten kaivaminen äänestäjältä kuitenkin vaatii, ja into vastausten tutkimiseen saattaa lopahtaa. Siksi toivoisinkin, että vaalikoneen pisteytys mietittäisiin huolella seuraavia vaaleja varten!



Lopuksi:


Yksi oleellinen kysymys vaalikoneiden merkitystä ajatellen on se, kuinka suuri osa ihmisistä käyttää vaalikoneita. Viime eduskuntavaalien kohdalla osuus oli tilastokeskuksen mukaan noin joka toinen äänestysikäisistä (kts. Vaalikoneen käyttö internetissä), mikä on merkittävä luku jo sellaisenaan, mutta jos sen suhteuttaa vaalien noin 70%:n äänestysprosenttiin, äänestäneistä vaalikonetta lienee käyttänyt jo selvä enemmistö. Vaalikoneiden vaikutusalue äänestäjien keskuudessa on siis ainakin huomattavan laaja.


Mitä merkitystä vaalikoneiden epäjohdonmukaisuuksilla tai suoranaisilla virheillä sitten on? Jos vaalikoneiden virheet ovat sattumanvaraisia ja saavat tulokset heittelemään sattumanvaraisesti eri suuntiin, vaikutus on rajallisempi: silloin kärsii ennen kaikkea luottamus vaalikoneita kohtaan ja vaalikoneiden tulosten varassa äänestävien äänet saattavat hajautua sattumanvaraisemmin. Mielipidekirjoituksellani kommentoimassani vuoden 2012 vaalikoneessa vaikutti olevan kyse vähintäänkin tästä, mutta mahdollisesti enemmästäkin.


Ongelmallisemmaksi vaalikoneiden outoudet muuttuvat, jos niiden vaikutus on systemaattisesti johonkin suuntaan vinossa. Näin näyttää olleen Tere Sammallahden analysoimassa Vuoden 2018 vaaleissa.


Kaikista pahin vaihtoehto on kuitenkin se, jos vaalikone tuottaa systemaattisia virheitä, jotka ovat lisäksi tarkoituksellisia. Tämän vuoden Hesarin vaalikoneesta löytynyt virhe antoi valtavan painon sukupuolten moninaisuutta käsittelevälle kysymykselle, mitä enemmistö pitää luultavasti kuitenkin yhteiskunnallisesti aika vähäpätöisenä kysymyksenä. En sinänsä näe syytä epäillä, etteikö tuo olisi ollut aito vahinko, mutta epäilyksen siemenen tuollainen näyttää silti monessa synnyttäneen.


Vaalikoneet ovat yleisesti ottaen mielestäni tärkeä työkalu äänestämisessä. On myös hyvä, että on useampia vaalikoneita käytettävissä, ja niiden välillä saa tietysti olla eroja kysymysten lisäksi myös toimintaperiaatteiden suhteen. Yksikään vaalikone ei kuitenkaan voi toimia täydellisesti ainakaan jokaiselle käyttäjälle. Yllättäviä ja välillä jopa omituisia tuloksia vaalikoneet tarjoavat varmasti jatkossakin, ja toisinaan niissä tulee esiintymään myös suoranaisia virheitä. Yleisellä tasolla toivoisin kuitenkin enemmän avoimuutta vaalikoneiden toimintaperiaatteiden suhteen. Uskoisin, etteivät vaalikoneiden algoritmit ole yleisesti ottaen niin monimutkaisia, etteikö vaalikoneiden etusivuilla voisi tarjota halukkaille mahdollisuutta lukea, miten kyseinen vaalikone määrittää sopivimmat ehdokkaat ja puolueet. Tällaisen avoimuuden luulisi tekevän vaalikoneiden paikoin yllättävistä tai jopa oudoista tuloksista ymmärrettävämpiä, ja muutenkin auttavan kehittämään vaalikoneita entistä paremmiksi.






Klikkaa tästä lukeaksesi koko jutun >>