Sentralmål
Sentralmål er statistiske verdier som beskriver midtpunktet eller den typiske verdien i et datasett. De tre mest brukte sentralmålene er gjennomsnitt, median og typetall (modus).
De tre sentralmålene
Gjennomsnitt
Summen av alle verdier delt på antall verdier.
Median
Den midterste verdien når alle verdier er sortert i stigende rekkefølge.
Odde antall verdier: Midterste verdi
Partall antall verdier: Gjennomsnittet av de to midterste verdiene
Typetall (Modus)
Den verdien som forekommer oftest i datasettet.
Eksempel: Mål per kamp
+Når bruker vi hvilket sentralmål?
Når bør du bruke gjennomsnitt?
- Når dataene er symmetrisk fordelt (like mange verdier over og under midtpunktet)
- Når det er få eller ingen ekstremverdier (uteliggere)
- Når du ønsker å gjøre videre matematiske beregninger med sentralmålet
- For kontinuerlige data som høyde, vekt, tid, etc.
Fordeler
- Tar hensyn til alle verdier i datasettet
- Matematisk presist og enkelt å beregne
- Kan brukes i videre statistiske analyser
Ulemper
- Påvirkes sterkt av ekstremverdier
- Kan gi et misvisende bilde dersom fordelingen er skjev
- Kan resultere i en verdi som ikke faktisk forekommer i datasettet
Eksempel fra idrett
Gjennomsnittlig antall mål per kamp i en fotballsesong. Hvis det scores 380 mål i 190 kamper, er gjennomsnittet 2 mål per kamp.
Når bør du bruke median?
- Når dataene er skjevt fordelt (asymmetrisk)
- Når det finnes ekstremverdier (uteliggere) som kan påvirke gjennomsnittet
- For data som ikke er kontinuerlige, men har en naturlig rekkefølge
- For mindre datasett
Fordeler
- Robust mot ekstremverdier (uteliggere)
- Gir et godt bilde av midtpunktet i skjeve fordelinger
- Representerer alltid en faktisk verdi fra datasettet (når det er odde antall observasjoner)
Ulemper
- Tar ikke hensyn til alle verdiene i datasettet
- Mer komplisert å beregne (krever sortering av data)
- Mindre nyttig for videre matematiske beregninger
Eksempel fra idrett
Median lønnsnivå for fotballspillere i en liga. Hvis et fåtall stjernespillere tjener svært mye, vil medianen gi et mer representativt bilde av den typiske spillerlønnen enn gjennomsnittet.
Når bør du bruke typetall?
- Når du ønsker å identifisere den mest vanlige verdien
- For kategoriske data (ikke-numeriske data)
- Når fordelingen har tydelige "topper" (multimodal fordeling)
- For data som er gruppert i klasser
Fordeler
- Enkelt å forstå - "det som forekommer oftest"
- Kan brukes for både numeriske og ikke-numeriske data
- Påvirkes ikke av ekstremverdier
Ulemper
- Et datasett kan ha flere typetall eller ingen tydelig typetall
- Tar ikke hensyn til alle verdiene i datasettet
- Kan være ustabil i små datasett
Eksempel fra idrett
Den mest populære idrettsgrenen i en skole (fotball, håndball, friidrett, etc.). Her er typetallet den idretten som flest elever deltar i.
Praktiske tips
Valg av sentralmål
- Sammenlign flere sentralmål for å få et mer komplett bilde av dataene.
- Se etter store forskjeller mellom gjennomsnitt og median. Dette kan indikere skjevhet i dataene eller uteliggere.
- For normalfordelte data vil gjennomsnitt, median og typetall være omtrent like.
- For smågrupper (under 30 observasjoner) er median ofte mer robust enn gjennomsnitt.
- Visuelle fremstillinger (som diagrammer) kan ofte gi bedre innsikt enn bare sentralmål.