Statistiek voor beginners (4/4): Centrummaten en spreidingsmaten

Bijleren: wiskunde, Frans,... 4 min read

Na de eerdere uitleg over de basisbegrippen van statistiek, variabelen en steekproef en populatie bekijken we wat statistische termen zoals standaardafwijking, gemiddelde en variantie precies betekenen.

We onderzoeken de grootte van honden in een hondenasiel. We nemen als steekproef 10 hondjes. We hebben ze allemaal genummerd en gemeten. De honden helpen jou centrummaten en spreidingsmaten in no time begrijpen!

Let op! Centrummaten en spreidingsmaten verschillen bij een steekproef of een populatie. Aangezien we in dit voorbeeld werken met een steekproef, gebruiken we de formules en notaties voor steekproeven. Indien er een andere notatie of formule is voor de populatie, vermeld ik dat per centrummaat/spreidingsmaat.

Centrummaten

Gemiddelde

Om het gemiddelde te berekenen tel je alle waarden op en deel je door het aantal waarden. In dit geval tellen we alle lengtes op en delen die door de tien gekozen honden uit het asiel. Het gemiddelde is hier 77,50 cm.

Indien we werken met de volledige populatie (alle honden van het asiel in dit voorbeeld), krijgt het gemiddelde niet dezelfde notatie:

Waarbij n = de steekproefgrootte en N = de populatiegrootte is.

Mediaan

De mediaan verkrijg je door de waarden te ordenen op grootte. Neem daar dan de middelste waarde van.

Indien er twee middelste waarden zijn, neem je het gemiddelde van die waarden. De mediaan is 78,50 cm.

Modus

De modus is de waarde die het meest voorkomt (dus de hoogste frequentie heeft). Aangezien elke waarde één keer voorkomt, kunnen we niet spreken over een modus.

Zou bijvoorbeeld hondje nummer 1 niet 118cm groot zijn, maar 122cm (hetzelfde als hondje nummer 8 ), dan zijn er twee honden met dezelfde grootte: 122cm. 122cm is dan de meest voorkomende waarde, en zou dan de modus zijn.

centrummaten spreidingsmaten statistiek

Spreidingsmaten

Range

De range is het verschil tussen de hoogste en de laagste waarde. Het is de eenvoudigste spreidingsmaat. Synoniemen zijn variatiebreedte, spreidingsbreedte of bereik.
In ons voorbeeld is de hoogste waarde x₈ gelijk aan 122 cm. De laagste waarde x₇ is gelijk aan 34 cm. De range is 88 cm.

x₈ - x₇ = 122 - 34 = 88

Kwartielen

Als we alle bekomen getallen ordenen van laag naar hoog, is de middelste waarde de mediaan. We noemen de mediaan ook wel het tweede kwartiel Q2. Medianen verdelen reeksen getallen in twee gelijke groepen. Uit die groepen nemen we nog eens de middelste waarde. We bekomen dan het eerste kwartiel Q1 en het derde kwartiel Q3. De kwartielen zijn hier: Q1=55, Q2=78,50 en Q3=100.

Kwartielen gebruiken we om wat meer te zeggen over de spreiding van de waarden.

Interkwartielafstand

De interkwartielafstand is het verschil tussen het derde kwartiel en het eerste kwartiel. De interkwartielafstand in ons voorbeeld is 45 cm.

Semi-interkwartielbereik

Het semi-interkwartielbereik is de helft van de interkwartielafstand. De interkwartielafstand is 45 cm, dus het semi-interkwartielbereik is 22,5cm.

Decielen

Net zoals kwartielen de reeks getallen delen door 4, delen decielen de reeks door 10. Dat heeft de notatie: D1, D2, ... , D10. Aangezien we in ons voorbeeld 10 waarden hebben, is elke waarde een deciel.

Percentielen

Bij een grotere reeks getallen kunnen we de reeks delen door 100: percentielen (P1, P2, ..., P10).

Vijf-getallen-samenvatting

De vijf-getallen-samenvatting bestaat uit: minimum waarde, eerste kwartiel, mediaan, derde kwartiel, maximum (altijd die volgorde!). We geven dat visueel weer door de boxplot.

De vijf-getallen-samenvatting is hier 34 cm, 55 cm, 78,50 cm, 100 cm, 122 cm.

Variantie

De variantie zegt ons in welke mate de gegevens verspreid zijn. Liggen de gegevens dicht bij elkaar? Samen met het gemiddelde geeft de variantie een goed beeld over de cijfers. Hoe groter de variantie, hoe meer ruimte tussen de waarden. Is er een lage variantie bij de hondjes? De hondjes zijn dan bijna allemaal even groot.

We berekenen de variantie door volgende berekeningen:

We berekenen de variantie door die berekeningen toe te passen:
1. Het gemiddelde hebben we hierboven berekend; het is gelijk aan 77,50.
2. We berekenen het verschil van het gemiddelde met elke lengtemaat van onze hondjes.

3. De berekende verschillen kwadrateren we nu.

4. We nemen de som van de waarden.

5. We delen door n-1. (n = de steekproefgrootte)

De variantie bedraagt hier 1004,95.

Let op! We hebben hier de steekproefvariantie uitgerekend aangezien we een steekproef hebben genomen en niet de volledige populatie (alle honden van het dierenasiel). Indien we de volledige populatie hadden genomen, berekenen we de variantie via een andere formule:

Waarbij n = de steekproefgrootte en N = de populatiegrootte is.

Standaardafwijking

De standaardafwijking s is de vierkantswortel van de variantie. Je keert terug naar de oorspronkelijke meeteenheid. De standaardafwijking bedraagt hier 31,70 cm.

Indien we werken met een volledige populatie, gebruiken we de notatie en formule:

Variatiecoëfficiënt

De variatiecoëfficiënt (VC) gebruik je om de resultaten van verschillende onderzoeken te vergelijken met elkaar. De VC druk je uit in een percentage. Hoe hoger de variatiecoëfficiënt, hoe groter de spreiding rond het gemiddelde.

De variatiecoëfficiënt is de verhouding tussen de standaardafwijking en het gemiddelde. De variatiecoëfficiënt bedraagt hier 41%.

Er is in een ander asiel, asiel B, ook een steekproef gedaan waarbij de variatiecoëfficiënt 25% bedraagt. We stellen vast dat de resultaten bij ons asiel een grotere spreiding rond het gemiddelde hebben.

Nouchka van BijlesHuis heeft een voorliefde voor cijfers en berekeningen. In deze reeks helpt ze jou om enkele concepten van statistiek beter te begrijpen. Vragen over dit artikel? Stuur een mailtje naar nouchka@bijleshuis.be en ze geeft je met plezier meer uitleg! Op zoek naar individuele bijles voor wiskunde? Neem dan een kijkje bij BijlesHuis.

Laat hieronder je gegevens achter en blijf zo op de hoogte van onze nieuwste artikels! Je ontvangt verder geen reclame of andere e-mails.

statistiek uitleg centrummaten spreidingsmaten standaardafwijking gemiddelde statistiek voor beginners variantie