Tilastomatematiikan peruskäsitteitä pähkinänkuoressa

 

Aineiston kuvaamiseen käytettyjä tunnuslukuja

Tutkimuksen perustaksi tarvitaan aina jokin aineisto. Aineisto on siis tutkimustarkoituksessa kerättyä tietoa.

Lääketieteessä tutkimus koostuu joko terveistä koehenkilöistä tai potilaista, joiden terveydentilaa mitataan eri tavoin.

Nämä erilaiset mittaustulokset muodostavat aineiston. Mittaustuloksista käytetään usein myös termiä muuttuja, kun puhutaan aineiston tilastollisesta analysoinnista.

Otanta

Otoskoko

Frekvenssi

Keskiarvo

Moodi (Mo) ja mediaani (Md)

Keskihajonta

Luottamusväli

Jakauma

Hypoteesi

P-arvo

Korrelaatio

Syy-seuraussuhde

Kohortti

Tapaus-verrokkitutkimus

Sokkotutkimukset

Number needed to treat

Suhteellinen riski

Odds ratio eli ristitulosuhde

Meta-analyysi

Otanta

Kun halutaan tutkia vaikka suomalaisten naisten pituutta, ei voida mitata ihan jokaista suomalaisnaista. Sen sijaan mitataan joukko ihmisiä, jolloin saadaan edustava otos koko väestöstä.

Kun tutkimuksessa käytetty otos on edustava, tulokset voidaan yleistää koko populaatioon.

Mitattavat henkilöt valitaan usein satunnaisotannalla, eli arpomalla. Se, mistä joukosta otos otetaan, riippuu tutkimuksen tavoitteista. Tässä tapauksessa arvonta suoritetaan suomalaisten naisten joukosta.

Otoskoko

Otoskoko tarkoittaa sitä, kuinka monta tutkittavaa yksikköä aineistossa on. Esimerkiksi tutkittaessa ihmisten pituutta otoskoko kertoo, montako henkilöä tutkimuksessa on mitattu.

Otoskoko lyhennetään usein kirjaimella n tai N.

Otoskoko on tärkeää tarkistaa tutkimuksen luotettavuutta arvioidessa. Yleisesti ottaen enemmän on parempi.

Esimerkiksi pituuskasvua tutkittaessa pitäisi mitata muutaman ihmisen sijaan satoja, jotta aineistoa voitaisiin pitää luotettavana otoksena tutkitusta väestöryhmästä.

Jos mitataan vain muutama yksilö, otoksessa oleva sattumanvarainen vaihtelu vääristää helposti tuloksia. Voi käydä vaikka niin, että otokseen sattumalta valikoituu useita lyhyitä naisia.

Riittävän isossa otoksessa vaihtelu tasoittuu, ja otos kuvaa paremmin koko tutkittavaa populaatiota.

Otoskoko vaihtelee tutkimustyypin ja tutkimuksen tavoitteiden mukaan. Yksinkertaisia mittauksia tai kyselyjä voidaan tehdä tuhansista tai kymmenistä tuhansista ihmisistä, mutta henkilökohtaisia haastatteluja ei ole mahdollista suorittaa isoja määriä.

Tyypillisesti niin sanotussa määrällisessä tutkimuksessa otoskoot ovat suuremmat kuin laadullisessa tutkimuksessa.

Frekvenssi

Frekvenssillä tarkoitetaan sitä, kuinka monta kertaa joku luku esiintyy aineistossa.

Esimerkiksi lukusarjassa 2, 8, 4, 3, 9, 5, 2, 2, 9, 2, 4 luvun kaksi frekvenssi on 4, lukujen yhdeksän ja neljä frekvenssi on 2 ja lukujen kahdeksan, kolme ja viisi frekvenssi on 1.

Keskiarvo

Kun halutaan kuvata jonkin muuttujan keskimääräistä arvoa, käytetään niin sanottuja keskilukuja. Näistä tavallisin on keskiarvo. Muita tavallisia keskilukuja ovat moodi ja mediaani.

Keskiarvo saadaan siten, että lasketaan yhteen kaikki aineiston luvut ja jaetaan se sitten lukujen määrällä.

Esimerkiksi kymmenen ihmisen pituusmittojen keskiarvo saadaan laskemalla mitat ensin yhteen ja jakamalla sitten tulos kymmenellä:

156 + 178 + 167 + 165 + 149 + 176 + 169 + 161 + 159 + 170 = 1650

1650 / 10 = 165

Eli näiden kymmenen henkilön keskimääräinen pituus on 165 senttimetriä.

Keskiarvolla on sellainen ominaisuus, että se muuttuu melko herkästi, jos aineistossa on muutama poikkeavan suuri tai pieni luku. Tällöin keskiarvo voi antaa hieman harhaanjohtavan kuvan muuttujan keskimääräisestä koosta.

Tällaista muista suuresti poikkeavaa mittaustulosta kutsutaan usein termillä outlier. Aineistossa voi olla aidosti poikkeavia muuttujia, mutta poikkeama voi johtua myös mittaus- tai kirjoitusvirheestä.

Keskiarvon lyhenne on ka tai 

Moodi (Mo) ja mediaani (Md)

Keskiarvon lisäksi usein käytettyjä keskilukuja ovat moodi ja mediaani. Keskiarvoa ja mediaania ei voida laskea esimerkiksi silloin, kun käytetty muuttuja ei ole luku (kuten “punainen” ja “sininen” tai sukupuoli). Silloin käytetään moodia.

Moodi on aineistossa useimmin esiintyvä arvo, eli arvo, jolla on suurin frekvenssi.

Esimerkiksi hedelmäkulhossa voi olla 6 omenaa, 1 banaani ja 2 appelsiinia. Tällöin aineistoa kuvaa edustavimmin termi omena, jonka frekvenssi on suurempi kuin appelsiinin tai banaanin.

Mediaania ja keskiarvoa voidaan käyttää silloin, kun luvut voidaan järjestää suuruusjärjestykseen. Jos lukujen jakauma on kovin vino, mediaani kuvaa aineistoa paremmin kuin keskiarvo.

Mediaani on suuruusjärjestykseen järjestettyjen lukujen keskimmäinen.

Esimerkiksi ihmisten pituutta mitatessa lukujen 149, 156, 159, 161, 165, 167, 169, 170, 176 ja 178 keskimmäiset luvut ovat 165 ja 167. Jos keskimmäisiä lukuja on kaksi, saatetaan ilmoittaa niiden keskiarvo, joka tässä tapauksessa on 166 cm.

Koska esimerkin lukujen jakauma on melko symmetrinen, tässä tapauksessa mediaani ja keskiarvo ovat suunnilleen samat.

Keskihajonta

Keskiluvut kuvaavat hyvin aineiston tavallisinta lukua, mutta ne eivät kerro mitään siitä, kuinka suuria ja pieniä arvoja aineistossa on, eli kuinka samanlaisia mittaustulokset ovat keskenään. Sen vuoksi keskiarvon lisäksi ilmoitetaan usein keskihajonta.

Keskihajonta (josta käytetään lyhennettä s) on pieni silloin, kun mitatut muuttujat ovat keskenään melko samansuuruisia. Jos luvut ovat hyvin erisuuruisia, keskihajonta on suuri. Keskihajonnassa yksittäisiä lukuja verrataan koko aineiston keskiarvoon.

Esimerkiksi kymmenen ihmisen pituutta mitatessa keskihajonta lasketaan näin:

Mitatut pituudet (cm): 156, 178, 167, 165, 149, 176, 169, 161, 159, 170.

Lukujen keskiarvo on 165 cm.

Jokaisesta yksittäisestä mittaustuloksesta vähennetään keskiarvo, minkä jälkeen saatu luku nostetaan toiseen potenssiin eli kerrotaan itsellään:

Seuraavaksi lasketaan yhteen saadut tulokset, jolloin saadaan luku 724. Tämä jaetaan n -1:llä joka on havaintojen määrä vähennettynä yhdellä. Tässä tapauksessa n - 1 on 10 - 1 = 9.

Tulos 80.44 on aineiston varianssi (s2). Siitä saadaan keskihajonta, kun luvusta otetaan neliöjuuri. Tämän aineiston keskihajonta on 8.97 cm.

Varianssilla ei ole yksikköä. Sitä tarvitaan useissa tilastollisissa testeissä. Kun halutaan ilmaista aineiston hajonta samassa yksikössä kuin alkuperäiset mitat, käytetään keskihajontaa.

Jos mitattaisiin vaikka kymmenen hyvin erikokoisen ihmisen painot, aineisto voisi olla (kg): 49, 85, 121, 54, 65, 78, 59, 99, 106, 60.

Tällöin mittausten keskiarvo on 77 kg ja keskihajonta on 24.48 kiloa. Näissä esimerkeissä painoilla on siis suurempi hajonta kuin pituuksilla.

Luottamusväli

Satunnaisotokseen sisältyy aina virhettä, sillä otos edustaa tutkittavaa populaatiota aina epätäydellisesti. Virhemarginaalin kuvaamiseen käytetään luottamusvälejä (englanniksi confidence interval, CI). Luottamusväli ilmoitetaan otoksesta arvioidulle tunnusluvulle, kuten keskiarvolle.

Yleensä ilmoitetaan 95% luottamusväli. Sen voi tulkita siten, että ollaan 95 prosenttisen varmoja siitä, että saatu tulos pitää paikkansa.

Toisin sanoen, luottamusväli kertoo, mille välille otoksesta mitattava tunnusluku sijoittuisi 95 kertaa, jos otosta toistettaisiin sata kertaa.

Jakauma

Termiin jakauma törmää usein tieteellisissä artikkeleissa. Jakauman avulla voidaan kuvata erilaisia lukujoukkoja.

Normaalijakauma (kutsutaan myös nimillä Gaussin käyrä tai kellokäyrä) on symmetrinen, kellon muotoinen käyrä. Hyvin monet mitattavat ominaisuudet, kuten ihmisten pituus tai paino, ovat normaalisti jakautuneita.

Keskiarvo on normaalijakauman huippu, ja keskihajonta kertoo, kuinka leveä jakauma on. Mitä suurempi keskihajonta, sitä leveämpi on jakauma.

Jakaumia on monenlaisia. Joskus aineistossa on suhteellisen paljon pieniä tai suuria lukuja. Tällöin jakauma ei ole symmetrinen, vaan vino. Vinoa jakaumaa kuvaa keskiarvon sijaan paremmin mediaani.

Jakauman muoto määrää osaltaan millaista tilastollista testausmenetelmää aineistolle voidaan käyttää. Tämän vuoksi se mainitaan usein tutkimusartikkelien menetelmäosassa.

Tilastollinen päättely ja testaaminen

Hypoteesi

Tieteellisessä ajattelussa havaitulle ilmiölle pyritään löytämään selitys. Ehdotettua selitystä kutsutaan luonnontieteissä ja lääketieteessä hypoteesiksi. Tieteeseen kuuluu, että hypoteesi on testattavissa.

Usein törmää termiin nollahypoteesi (H0), jota on testattu jotain muuta hypoteesia (H1) vastaan. Nollahypoteesi kuvaa tilannetta, jossa mitään ei tapahdu: “havainnot ovat täysin sattuman tuottamia”.

Toisin sanoen, havaintojen taustalla ei vaikuta mitään prosessia, joka loisi eroja esimerkiksi eri ryhmien välille.

Vaihtoehtohypoteesi on tutkijoiden ehdottama selitys ilmiölle. Sen mukaan havaintojen taustalla on jokin muu kuin sattuma.

Esimerkiksi lääketutkimuksissa nollahypoteesi voi olla se, että lääkkeellä ei ole mitään vaikutusta sairauden kulkuun. Yksinkertainen vaihtoehtohypoteesi on esimerkiksi sellainen, että testattava lääke vähentää sairauden oireita.

Hypoteesia testattaessa mitataan esimerkiksi veriarvoja tai ihottuman laajuutta, ja verrataan tilastollisten testien avulla mittaustuloksia niiden välillä, jotka saivat ja eivät saaneet lääkettä.

P-arvo

Testejä tarvitaan, kun halutaan luotettavasti selvittää, onko tutkittujen ryhmien välillä tilastollisesti merkitsevää eroa. Merkitsevyyden mittarina käytetään usein p-arvoa.

Sitä tulkitaan niin, että mitä pienempi p-arvo on, sitä todennäköisemmin ryhmien välillä havaittu ero ei johdu pelkästään sattumasta.

Usein tilastollisen merkitsevyyden rajana pidetään arvoa 0.05, mutta arvo voi olla jokin muukin. Ryhmien väliset erot tulkitaan merkitseviksi, mikäli p on 0.05 tai sitä pienempi luku. Tilastollisessa testauksessa tasapainoillaan kahden mahdollisen virheen välillä:

I-tyypin virhe: tilastollinen testi osoittaa eron ryhmien välillä, vaikka todellisuudessa ero on pelkkää sattumaa. Eli nollahypoteesi on oikein, mutta se hylätään väärin perustein. Tätä kutsutaan myös hylkäysvirheeksi.

II-tyypin virhe: nollahypoteesi ei ole oikein, mutta testi hyväksyy sen. Eri ryhmien välillä on todellisuudessa ero, mutta se jää havaitsematta. Tätä kutsutaan hyväksymisvirheeksi.

Yleensä pyritään minimoimaan tyypin I virheen mahdollisuus. Rajana käytetty 0.05 tarkoittaa sitä, että on 5 prosentin mahdollisuus tehdä tyypin I virhe.

Esimerkki hylkäysvirheestä: lääketutkimuksessa lääkettä nauttineiden ja lumelääkettä nauttineiden potilaiden paranemisajassa tai taudinkuvassa ei todellisuudessa ole merkitsevää eroa, mutta tilastollisen testin perusteella joudutaan hylkäämään nollahypoteesi.

Tällöin väitetään, että lääke toimii sairauden hoidossa ja tehdään I-tyypin virhe. Lääke otetaan käyttöön, vaikka sillä ei ole todellisia vaikutuksia.

Esimerkki hyväksymisvirheestä: lääkkeellä on vaikutusta sairauden kulkuun, mutta tilastollinen testaus ei osoita eroa. Tällöin tapahtuu II-tyypin virhe ja toimiva lääke jää löytymättä ainakin kyseisessä tutkimuksessa.

Otoskoko ja aineiston keskihajonta vaikuttavat siihen, kuinka pieniä eroja voidaan luotettavasti havaita. Mitä suurempi otos, sitä pienemmät erot ovat testin mukaan merkitseviä.

Se, että ero on tilastollisesti merkitsevä, ei tarkoita suoraan, että havaitulla erolla olisi todellista vaikutusta. Jos testataan hyvin suuri joukko, voidaan löytää niin pieniä eroja, että ne eivät käytännössä vaikuta ihmisten elämään.

Tässä kohtaa tutkijan tulkinta tulosten merkityksestä on oleellinen.

Korrelaatio

Tutkimuksissa halutaan usein selvittää, missä suhteessa kaksi mitattua tekijää ovat keskenään. Tällöin mitataan enemmän kuin yhtä muuttujaa.

Korrelaation avulla tutkitaan, ovatko mitatut tekijät riippuvaisia toisistaan. Korrelaatio mittaa vain lineaarista riippuvuutta.

Lineaarinen riippuvuus tarkoittaa esimerkiksi sitä, että muuttujan 1 arvojen kasvaessa muuttujan 2 arvot kasvavat samassa suhteessa. Suhde voi olla myös käänteinen: muuttujan 1 arvojen kasvaessa muuttujan 2 arvot pienenevät suunnilleen samassa suhteessa.

Esimerkiksi ihmisen pituuden lisäksi voidaan mitata siihen mahdollisesti vaikuttavia tekijöitä, kuten vanhempien pituutta. Jos huomataan, että pitkien naisten äidit ovat myös pitkiä ja lyhyiden naisten äidit lyhyitä, voidaan todeta että nämä kaksi ominaisuutta korreloivat keskenään.

Jos kävisi ilmi, että pitkien ihmisten äidit ovat lyhyitä ja päinvastoin, nämä kaksi ominaisuutta korreloisivat keskenään negatiivisesti.

Korrelaation mittana käytetään usein korrelaatiokerrointa, joka saa arvon 0, jos lineaarista riippuvuutta ei ole ollenkaan, ja arvon 1 tai -1, jos kahden muuttujan välinen riippuvuus on täydellistä.

Vaikka korrelaatiokerroin on 0, voi muuttujien välillä olla riippuvuus: se vain ei ole silloin lineaarinen.

Syy-seuraussuhde

Korrelaatio on houkuttelevaa tulkita siten, että vahvasti korreloivien muuttujien välillä olisi kausaalinen suhde eli syy-seuraussuhde. Korrelaatio ei kuitenkaan kerro mitään kausaalisuudesta

Vaikka äidin ja lapsen pituuksissa havaittaisiin voimakas positiivinen korrelaatio, ei voida väittää, että äidin pituus suoraan aiheuttaisi lapsen pituuden.

Ilmiön taustalla voi nimittäin olla jokin muu tekijä (esimerkiksi ravinto), joka vaikuttaa molempiin mitattuihin asioihin ja aiheuttaa korrelaation näiden välille.

Voisi esimerkiksi olla niin, että pitkät naiset menevät usein naimisiin pitkien miesten kanssa, ja isän pituus onkin se tekijä, joka määrää lapsen tulevan pituuden.

Kohortti

Isoissa terveystutkimuksissa seurataan usein yhtä ikäluokkaa useiden vuosien ajan. Tällöin on kyseessä ikäkohortti.

Yleisemmin ajateltuna kohortti tarkoittaa tutkimuksessa seurattavaa ihmisjoukkoa, joilla on jokin tutkimuksen kannalta yhteinen piirre. Tavoitteena on seurata samaa joukkoa tutkimuksen alusta loppuun, eli mukaan ei oteta uusia tutkittavia kesken tutkimuksen.

Kohorttitutkimuksissa selvitetään usein jollekin ympäristötekijälle altistumisen ja sairastumisen välistä yhteyttä. Altisteita on yleensä yksi, mutta sen aiheuttamia sairauksia voi olla useita.

Ympäristötekijä on mikä tahansa tekijä, joka ei ole perinnöllinen. Ympäristötekijöitä ovat esimerkiksi henkilön ruokavalio, tupakointi, alkoholi, kemikaalit tai asuinpaikan ominaisuudet.

Esimerkkejä kohorttitutkimuksista:

Kohortti 1966

Säteilyn vaikutus Hiroshman ja Nagasakin väestöön

Tapaus-verrokkitutkimus

Kohorttitutkimuksessa verrataan altistuneiden ja altistumattomien ryhmiä. Tapaus-verrokkitutkimuksessa keskitytään itse sairauteen, jolloin verrataan toisiinsa sairastuneita ja terveitä. Terveitä nimitetään verrokeiksi ja sairastuneita tapauksiksi.

Tutkimuksessa verrataan tapaus- ja verrokkiryhmän aiemmin kohtaamia altisteita, ja etsitään sairauden syytä. Altisteita voi olla useita erilaisia.

Sokkotutkimukset

Tutkittavat henkilöt jaetaan satunnaisesti eri tutkimusryhmiin, jotta heidän ominaisuutensa (ikä, sukupuoli, paino tai muu sellainen) eivät aiheuttaisi harhaa eli vinoumaa (bias) tutkimustuloksiin.

Satunnaistamisen lisäksi on tärkeää vähentää tutkijan ja tutkittavien ennakko-odotusten vaikutusta tuloksiin. Esimerkiksi lumevaikutus eli plaseboefekti on hyvin tunnettu ilmiö, joka on otettava huomioon lääketutkimuksissa.

Sokkouttamisella estetään näitä vaikutuksia. Yksöissokkotutkimuksessa (single-blind) tutkittava ei tiedä, mihin ryhmään hän kuuluu, eli saako hän oikeaa lääkettä vai lumelääkettä. Tutkija kuitenkin tietää, kumpaa lääkettä potilas saa.

Kaksoissokkotutkimuksessa (double-blind) kumpikaan, tutkija ja tutkittava, ei tiedä mihin ryhmään tutkittava kuuluu. Tutkittavan tiedot yhdistetään hänelle annettuun lääkkeeseen vasta tutkimuksen loputtua.

Avoimessa tutkimuksessa sekä tutkittava että tutkija tietävät, mihin tutkimusryhmään potilas kuuluu.

Number needed to treat

Number needed to treat (NNT-luku) on potilasmäärä, joka on hoidettava, jotta yksi potilas hyötyisi. Luku siis kertoo, kuinka monta potilasta on hoidettava, jotta yksi päätetapahtuma (kuolema, sydäninfarkti, leikkauskomplikaatio tai muu vastaava) estyisi. NNT:tä käytetään havainnollistamaan hoidon hyötysuhdetta.

NNT lasketaan  hoito- ja verrokkiryhmän absoluuttisen riskin erotuksen käänteislukuna 1/(CER-EER).

Eli jos verrokkiryhmässä absoluuttinen päätetapahtuman riski on 15% eli CER = 0.15 ja uutta hoitoa kokeilevien ryhmässä riski on vain 1%

EER = 0.01, NNT = 1/(0.15 - 0.015) = 1/0.14 = 7.14.

Eli 7 henkilöä on hoidettava, jotta yksi päätetapahtuma estyy.

Samalla tavalla voidaan laskea NNH (Number Needed to Harm), eli se määrä potilaita, joita hoitamalla yhdelle tulee negatiivinen vaikutus eli jotain haittoja hoidosta.

Edullinen ja harmiton hoito voi kannattaa, vaikka NNT-luku olisi suuri, koska siitä ei juuri koidu kustannuksia eikä haittoja. Jos hoito on kallista ja potentiaalisesti vaarallista, NNT-luvun on oltava pieni, jotta hoitoa kannattaa suositella.

Suhteellinen riski

Kohorttitutkimuksissa voidaan laskea suhteellinen riski (relative risk, RR) sairastumiselle. Riski on tapausten määrä altistuneilla jaettuna tapausten määrällä altistumattomilla.

Esimerkiksi tutkittaessa alkoholin suurkuluttajien riskiä sairastua akuuttiin haimatulehdukseen, havaittiin, että suurkuluttajilla haimatulehdustapauksia oli 80 sataatuhatta henkilöä kohti ja vähän alkoholia kuluttavilla tapauksia oli 20 / 100 000 henkilöä.

Suhteellinen riski on 80/20 = 4.

Eli tässä kuvitteellisessa esimerkissä alkoholin suurkuluttajilla on nelinkertainen riski sairastua haimatulehdukseen verrattuna niihin, jotka käyttävät alkoholia enintään kohtuullisesti.

Odds ratio eli ristitulosuhde

Tapaus-verrokkitutkimuksissa voidaan laskea ristitulosuhde (OR), joka kertoo, kuinka paljon enemmän tai vähemmän altistuneita on tapausryhmässä kuin verrokkiryhmässä.

Esimerkiksi valitaan 100 akuuttia haimatulehdusta sairastavaa (tapausryhmä) ja 100 henkilöä, joilla ei ole akuuttia haimatulehdusta (verrokkiryhmä).

Ryhmiä tutkittaessa selviää, että haimatulehdusta sairastavista 75 käyttää alkoholia runsaasti ja verrokkiryhmässä alkoholin suurkuluttajia on 9.

OR = (75/25) / (10/90) = 27. Eli haimatulehdukseen sairastuneissa on esimerkin mukaan 27 kertaa enemmän alkoholin suurkuluttajia, kuin terveessä verrokkiryhmässä.

Esimerkki ristitulosuhteen käytöstä

Meta-analyysi

Yksittäisten tutkimusten tulokset voivat vaihdella paljonkin riippuen esimerkiksi käytetyn aineiston koosta. Jotta jostain ilmiöstä saataisiin luotettavampi kuva, voidaan yhdistää useiden eri tutkimusten tulokset. Tätä kutsutaan meta-analyysiksi.

Meta-analyysissä käytettävien tutkimustulosten ei tarvitse olla keskenään samansuuntaisia, vaan analyysiin otetaan mukaan kaikki aihetta koskevat tutkimukset, jotka on toteutettu ja raportoitu riittävän hyvin.

Lähteitä:

Finnanest

Lääkärilehti

Duodecim

Tilastokeskuksen tilastokoulu

Opetushallituksen tilastomatematiikka-sanasto

Menetelmäopetuksen tietovaranto

Itä-Suomen Yliopisto


 

Löydä lisätietoa hakusanalla

Mitä seuraavaksi?

Verkkovastaanotto

Kysy lääkärin mielipidettä kätevällä etävastaanotolla. Mikäli et tarvitse vastausta heti, lähetä kysymys jollekin kymmenistä Terve.fi:n asiantuntijoista.

Varaa aika lääkärille

Varaa aika lääkärin tai muun terveydenhuollon ammattilaisen vastaanotolle: