Tilastojen manipulointi on yleisempää kuin luulet
UN Womenin tutkimuksen mukaan 71 prosenttia naisista on kokenut seksuaalista häirintää. Luettuasi tämän jutun ymmärrät, kuinka käppyrät voivat johtaa sinua harhaan.
Yhdistyneiden kansakuntien tasa-arvojärjestö UN Women julkaisi maaliskuussa 2021 tutkimuksen, jossa brittinaiset kertoivat kokemastaan seksuaalisesta häirinnästä.
Tulokset kylmäsivät: 71 prosenttia vastanneista kertoi kokeneensa seksuaalista häirintää julkisella paikalla. 18–24-vuotiaiden ikäryhmässä vastaava luku on 86 prosenttia.
Tutkimus nousi välittömästi julkiseen keskusteluun ja nähdäkseni reaktiot jakautuivat karkeasti kahteen leiriin. Osa uskoi saatujen tulosten kertovan luotettavasti nykytilanteesta, kun taas toiset kyseenalaistivat tulosten oikeellisuuden.
Tilastolukutaitoinen tietää, että tulokset kieltävä ryhmä oli mitä todennäköisimmin väärässä. Mutta miksi? Otetaan selvää.
Kuinka monen brittinaisen sana riittää?
Lienee sanomattakin selvää, ettei UN Women haastatellut tutkimusta varten joka ikistä brittinaista. Sen sijaan tutkittavasta joukosta otettiin otos, joka edustaa koko joukkoa.
UN Womenin tutkimukseen osallistui 1089 naista, eli he ovat tutkimuksen otos. Kaikki 33,94 miljoonaa brittinaista ovat tässä tapauksessa populaatio, josta otos on otettu.
Tässä kohdin tutkimusta on kritisoitu: 1089 osallistujaa tuntuu pieneltä verrattuna Britannian kaikkiin naisiin.
Kritiikki on mielestäni aiheetonta. Ai miksi?
Osallistujamääriin liittyen on hyvä muistaa numero 200. Kaksisataa on nyrkkisääntö, jolla voi pikaisesti hahmottaa, onko otos tarpeeksi suuri tilastollisen merkitsevyyden saavuttamiseksi. Kun otos on yli 200, merkitsevyydestä ei yleensä tarvitse huolehtia.
Tilastollinen merkitsevyys ei välttämättä tarkoita faktaa
Tilastollinen merkitsevyys on keskeinen termi. Se kertoo, että tuloksen ei pitäisi olla sattumaa, mutta ei myöskään tarkoita, että tulos pitää täysin varmasti paikkansa.
Tilastollista merkitsevyyttä voidaan mitata eri tasoilla. Yksi yleisimmin käytetyistä tasoista on viiden prosentin merkitsevyystaso.
Jos tulos on tilastollisesti merkitsevä viiden prosentin tasolla, tulos on vain viiden prosentin todennäköisyydellä sattumaa.
Sama pätee myös yhden tai kymmenen prosentin merkitsevyystasolla. Mitä pienempi merkitsevyystaso on, sitä luotettavampi tulos on. 0,1 prosenttia tai sitä pienempi tarkkuus on merkki todella luotettavista tuloksista.
Kun törmäät tutkimuksiin tai uutisointiin tutkimuksista, kiinnitä huomiota tilastolliseen merkitsevyyteen. Millä tasolla tutkimus on tilastollisesti merkitsevä? Onko merkitsevyyttä ilmoitettu ollenkaan?
Erityisesti tiedon ilmoittamatta jättäminen on vaaran merkki ja syö tutkimuksen luotettavuutta huomattavasti.
Kaikki tutkittu tieto ei ole luotettavaa tietoa
UN Women ilmoittaa tutkimusraportissaan, että osallistujia on useasta eri ikäluokasta. UN Women ei kuitenkaan ilmoita vastaajajoukon koulutustaustaa tai etnisyyttä. Se on harmi, sillä edellä mainitut tiedot raportoimalla tutkimus saisi huomattavasti lisää uskottavuutta. Nyt otoksen monipuolisuus jää pimentoon.
Vaikka UN Womenin tutkimus vaikuttaa melko luotettavalta – edellä mainitusta huolimatta – on hyvä muistaa, että kaikki tutkimukset eivät sitä ole.
Tietoa ja tutkimustuloksia voidaan muokata. Tutkimuksen rahoittaja tai jokin muu asiaansa ajava taho voi käännellä ja väännellä saatuja tuloksia haluamaansa suuntaan. Tarkoituksella valittu huono otos on yksi tapa tehdä niin.
Saamme siis hyvin erilaisia tuloksia riippuen siitä, keneltä kysymme.
Otetaan esimerkki: haluamme tutkia ihmisten tyytyväisyyttä nykyiseen hallitukseen. Voi arvata, että hallituspuolueita kannattavat ihmiset ovat melko tyytyväisiä hallitukseen. Vastaavasti oppositiopuolueiden äänestäjät todennäköisemmin eivät ole.
Epäilyksen herätessä kysy itseltäsi, miten tutkimuksen osallistujat on valittu ja voidaanko valinnalla ajaa jotain tiettyä agendaa.
Vaikutuitko käppyrästä? Vältä kuvaajien sudenkuopat
Myös kuvaajien avulla vääristellään totuutta. Vaikka kuvattu data voi itsessään olla täysin oikein, itse kuvaajasta on voitu tehdä harhaanjohtava.
Jos epäilet jotain kuvaajaa, tarkista skaala. Onko kuvaajan alareunassa nolla vai jokin muu numero? Pienikin ero saadaan näyttämään suurelta, jos liikkeelle lähdetään jostain muusta kuin nollasta. Skaalan löytää useimmiten vasemmasta pystyreunasta, eli y-akselilta.
Katsotaan korkotasoja! Niissä ei ole pitkään aikaan tapahtunut dramaattisia muutoksia, mutta pienistäkin muutoksista saadaan massiivisen näköisiä.
Alla olevissa kuvaajissa on sama data: 12 kk Euribor -korko. Mutta koska kuvaajissa on käytetty eri skaalaa, oikeanpuoleinen käppyrä on paljon dramaattisemman näköinen.
Tilastolukutaitoinen sijoittaa paremmin
Pörssiuutisissa törmäämme jatkuvasti tilastoihin, kuvaajiin ja numeroihin. Niitä tarkastellessa kannattaa pysyä valppaana.
Mieti, kenen dataa tarkastelet. Bensa-autojen valmistaja tai öljyntuottaja saattaa haluta ihmisten uskovan bensa-autojen olevan ympäristöystävällisempiä kuin sähköautojen. Sähköautojen valmistaja taas luontaisesti lupaa täysin päinvastaista.
Laaja yleissivistys sekä media- ja tilastolukutaito ovat sinulle hyödyksi – ja saattavat johtaa parempiin sijoituspäätöksiin.
Kun ymmärrät maailmaa ja seuraat sen tapahtumia mahdollisimman neutraalisti, et sijoita rahojasi harhaanjohtavien käppyröiden manipuloimana.