Sentralmål

Sentralmål er statistiske verdier som beskriver midtpunktet eller den typiske verdien i et datasett. De tre mest brukte sentralmålene er gjennomsnitt, median og typetall (modus).

De tre sentralmålene

Gjennomsnitt

Summen av alle verdier delt på antall verdier.

Gjennomsnitt = (sum av alle verdier) / (antall verdier)

Median

Den midterste verdien når alle verdier er sortert i stigende rekkefølge.

Odde antall verdier: Midterste verdi

Partall antall verdier: Gjennomsnittet av de to midterste verdiene

Typetall (Modus)

Den verdien som forekommer oftest i datasettet.

NB: Et datasett kan ha flere typetall hvis flere verdier forekommer like ofte.

Eksempel: Mål per kamp

+

Når bruker vi hvilket sentralmål?

Når bør du bruke gjennomsnitt?

  • Når dataene er symmetrisk fordelt (like mange verdier over og under midtpunktet)
  • Når det er få eller ingen ekstremverdier (uteliggere)
  • Når du ønsker å gjøre videre matematiske beregninger med sentralmålet
  • For kontinuerlige data som høyde, vekt, tid, etc.

Fordeler

  • Tar hensyn til alle verdier i datasettet
  • Matematisk presist og enkelt å beregne
  • Kan brukes i videre statistiske analyser

Ulemper

  • Påvirkes sterkt av ekstremverdier
  • Kan gi et misvisende bilde dersom fordelingen er skjev
  • Kan resultere i en verdi som ikke faktisk forekommer i datasettet

Eksempel fra idrett

Gjennomsnittlig antall mål per kamp i en fotballsesong. Hvis det scores 380 mål i 190 kamper, er gjennomsnittet 2 mål per kamp.

Når bør du bruke median?

  • Når dataene er skjevt fordelt (asymmetrisk)
  • Når det finnes ekstremverdier (uteliggere) som kan påvirke gjennomsnittet
  • For data som ikke er kontinuerlige, men har en naturlig rekkefølge
  • For mindre datasett

Fordeler

  • Robust mot ekstremverdier (uteliggere)
  • Gir et godt bilde av midtpunktet i skjeve fordelinger
  • Representerer alltid en faktisk verdi fra datasettet (når det er odde antall observasjoner)

Ulemper

  • Tar ikke hensyn til alle verdiene i datasettet
  • Mer komplisert å beregne (krever sortering av data)
  • Mindre nyttig for videre matematiske beregninger

Eksempel fra idrett

Median lønnsnivå for fotballspillere i en liga. Hvis et fåtall stjernespillere tjener svært mye, vil medianen gi et mer representativt bilde av den typiske spillerlønnen enn gjennomsnittet.

Når bør du bruke typetall?

  • Når du ønsker å identifisere den mest vanlige verdien
  • For kategoriske data (ikke-numeriske data)
  • Når fordelingen har tydelige "topper" (multimodal fordeling)
  • For data som er gruppert i klasser

Fordeler

  • Enkelt å forstå - "det som forekommer oftest"
  • Kan brukes for både numeriske og ikke-numeriske data
  • Påvirkes ikke av ekstremverdier

Ulemper

  • Et datasett kan ha flere typetall eller ingen tydelig typetall
  • Tar ikke hensyn til alle verdiene i datasettet
  • Kan være ustabil i små datasett

Eksempel fra idrett

Den mest populære idrettsgrenen i en skole (fotball, håndball, friidrett, etc.). Her er typetallet den idretten som flest elever deltar i.

Praktiske tips

Valg av sentralmål

  • Sammenlign flere sentralmål for å få et mer komplett bilde av dataene.
  • Se etter store forskjeller mellom gjennomsnitt og median. Dette kan indikere skjevhet i dataene eller uteliggere.
  • For normalfordelte data vil gjennomsnitt, median og typetall være omtrent like.
  • For smågrupper (under 30 observasjoner) er median ofte mer robust enn gjennomsnitt.
  • Visuelle fremstillinger (som diagrammer) kan ofte gi bedre innsikt enn bare sentralmål.