Moodi (tilastotiede)

Moodi (Mo) eli tyyppiarvo[1] on havaintoaineiston useimmin esiintyvä arvo tai luokitellun aineiston luokkakeskus, jolla on suurin frekvenssi eli esiintymistiheys.

Moodi on aritmeettisen keskiarvon ja mediaanin ohella keskiluku, jolla ilmaistaan tietoa satunnaismuuttujasta tai populaatiosta. Kvalitatiivista muuttujaa kuvatessa moodi on keskiluvuista käyttökelpoisin, koska luvuilla ei ole järjestystä eikä määrätyn arvon voida sanoa olevan toiseen verrattuna enempää "keskellä". Kvantitatiivisessa aineistossa moodi kuvaa aineistoa parhaiten, jos jakauma ei ole kovin epäsäännöllinen.[2]

Aritmeettisen keskiarvon, mediaanin ja moodin vertailu

Katso myös: aritmeettinen keskiarvo ja mediaani
Yleisten keskilukujen vertailu { 1, 2, 2, 3, 4, 7, 9 }
Tyyppi Kuvaus Esimerkki Tulos
Aritmeettinen keskiarvo Joukon jäsenten summa jaettuna sen jäsenten lukumäärällä: x ¯ = 1 n i = 1 n x i {\displaystyle \scriptstyle {\bar {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}} (1+2+2+3+4+7+9) / 7 4
Mediaani Mediaani on järjestetyn joukon keskimmäinen alkio. 1, 2, 2, 3, 4, 7, 9 3
Moodi havaintoaineiston useimmin esiintyvä arvo. 1, 2, 2, 3, 4, 7, 9 2
Käyttöesimerkki

Kommuunissa asuu 6 henkilöä: 4 naista ja 2 miestä. Muuttuja "sukupuoli" jakaantuu arvoihin "nainen" (frekvenssi 4) ja "mies" (frekvenssi 2). Arvot "mies" ja "nainen" eivät ole lukuja, minkä vuoksi keskiarvon laskeminen ei ole mahdollista. Niillä ei ole määrättyä järjestystä, eikä näin ollen myöskään mediaania. Aineiston ainoa mielekäs keskiluku on moodi, joka kuvaa aineiston dominoivaa arvoa. Moodi on "nainen".

Luokitellun aineiston moodi

Luokitellun aineiston tapauksessa moodi kuvaa frekvenssiltään suurinta luokkaa. Tasavälisellä luokituksella frekvenssijakauman moodi on siinä luokassa, jota vastaava frekvenssi on suurin tai sitä vastaava histogrammi saavuttaa maksiminsa. Vastaavasti, kun luokitus ei ole tasavälinen, ei myöskään jakauman moodi välttämättä ole suurimman frekvenssin luokassa. [3]

Moodi havaintoarvojen jakauman kuvaajana

Luokittelemattomassa aineistossa moodi on sen muuttujan arvo, jonka frekvenssi on suurin [2]. Havaintoarvojen jakauman ollessa symmetrinen ja yksihuippuinen, havaintoarvojen keskiluvut moodi, mediaani ja aritmeettinen keskiarvo ovat identtiset [4]. Kahden identtisen huippuarvon esiintyessä kyseessä on kaksihuippuinen (bimodal) aineisto ja molemmat arvot ovat aineiston moodeja. Useamman kuin kahden arvon esiintyessä korkeimmalla tiheydellä kutsutaan havaintoaineistoa monihuippuiseksi (multimodal). Aineistolla ei sanota olevan moodia, jos yksikään arvo ei toistu. [5]

Moodi ja vinous

Keskilukujen vertailu (aritmeettinen keskiarvo, mediaani, moodi) kahdessa logaritmisessa normaalijakaumassa, joissa eri vinous.

Aritmeettisen keskiarvon M, mediaanin Me ja moodin Mo asettuminen vinossa, jatkuvan muuttujan frekvenssijakaumassa.[3]

(i) Vasemmalle vinoilla jakaumilla

M < Me < Mo

(ii) Symmetrisillä jakaumilla

M ≈ Me ≈ Mo

(iii) Oikealle vinoilla jakaumilla

Mo > Me > M


Lähteet

  1. Tilastotieteen ja todennäköisyyslaskennan englantilais–suomalainen sanasto (Arkistoitu – Internet Archive)
  2. a b Komulainen, Erkki & Karma. (2002): Tilastollisen kuvauksen perusteet käyttäytymistieteissä
  3. a b Ilkka Mellin. (2006): Tilastolliset menetelmät: Johdanto
  4. Lund Research, (2013): Measures of Central Tendency
  5. Triola, Mario F. (2015): "Essentials of statistics". Pearson, 2015. ISBN 0-321-92459-2"