Steekproefgrootte berekenen

30 juni 2023

Als je begint met je afstudeeronderzoek is het cruciaal om te snappen waarom het concept "steekproefgrootte" zo belangrijk is. De gekozen steekproefgrootte bepaalt namelijk de nauwkeurigheid en betrouwbaarheid van je onderzoeksresultaten.

In dit artikel zullen we de basisprincipes van het berekenen van steekproefgroottes bespreken. Daarnaast beschrijven we zowel (1) een aantal eenvoudige vuistregels als (2) exacte formules die je kunt gebruiken.

Wat is steekproefgrootte?

Steekproefgrootte verwijst naar het aantal eenheden (meestal individuen, maar kan ook gaan om objecten of gebeurtenissen) dat je selecteert uit de populatie voor je onderzoek. Vaak wordt dit genoteerd als ‘N’ (bijvoorbeeld N=120). Je gebruikt een steekproef met als doel om iets over de gehele populatie te zeggen, ofwel om algemene conclusies te trekken. Een correcte steekproefgrootte is essentieel om nauwkeurige en betrouwbare resultaten te verkrijgen.

Waarom is de juiste steekproefgrootte belangrijk?

Een te kleine steekproef kan leiden tot vertekende resultaten en generalisatieproblemen, waarbij de bevindingen mogelijk niet representatief zijn voor de hele populatie. Je kan je voorstellen dat als je de gemiddelde lengte meet van (slechts) 3 mensen dat dit geen goede reflectie geeft van de populatie (in Nederland). Daarnaast is er een grote kans dat je (scriptie-) onderzoek afgekeurd wordt als je steekproefgrootte te klein is.

Aan de andere kant kan een te grote steekproef onnodige tijd en middelen vergen. Het is dus belangrijk om de juiste steekproefgrootte te bepalen om een evenwicht te vinden tussen nauwkeurigheid en efficiëntie.

Factoren die van invloed zijn op steekproefgrootte

Bij het berekenen van de steekproefgrootte zijn er verschillende factoren waarmee rekening moet worden gehouden. Een belangrijke factor is het betrouwbaarheidsniveau dat je wilt bereiken. Dit wordt vaak uitgedrukt als een percentage, zoals 95% betrouwbaarheid. Daarnaast speelt het precisieniveau een rol, wat aangeeft hoe nauwkeurig je schatting moet zijn. Ook de mate van variabiliteit binnen de populatie kan van invloed zijn op de steekproefgrootte.

Vuistregels voor steekproefgrootte

Naast het gebruik van formules zijn er ook enkele vuistregels die je kunt hanteren bij het bepalen van de steekproefgrootte voor verschillende soorten onderzoeken. Deze vuistregels kunnen dienen als richtlijnen wanneer je geen specifieke berekeningen wilt uitvoeren. Laten we enkele van deze vuistregels bespreken:

Standaard onderzoek

Voor standaard onderzoek, waarbij je algemene inzichten wilt verkrijgen zonder specifieke vergelijkingen of analyses, wordt vaak een vuistregel van 200 respondenten gehanteerd. Dit aantal biedt over het algemeen een redelijk betrouwbaar beeld van de populatie.

Vergelijking van groepen

Als je groepen wilt vergelijken, bijvoorbeeld om te bepalen of er significante verschillen zijn tussen twee groepen, dan is het raadzaam om ten minste 40 respondenten per groep te hebben. Deze vuistregel zorgt ervoor dat je een voldoende grote steekproef hebt om betrouwbare conclusies te trekken over de verschillen tussen de groepen.

Moderatoren in het onderzoek

Als je moderatoren wilt onderzoeken, wat betekent dat je wilt nagaan of bepaalde factoren de relatie tussen twee variabelen beïnvloeden, dan is het aan te raden om per moderator 2 keer zoveel respondenten te hebben. Stel dat je twee groepen wilt vergelijken met twee moderatoren, dan zou je minimaal 40 respondenten per groep extra moeten hebben (40 * 2 * 2 * 2 = 320). Door deze extra steekproefgrootte zorg je ervoor dat er voldoende statistische kracht is om de interactie tussen de variabelen en de moderatoren te onderzoeken.

Factoranalyse van vragenlijst

Als je een factoranalyse wilt uitvoeren op een vragenlijst, wat inhoudt dat je de onderliggende dimensies of factoren van de vragen wilt identificeren, dan wordt vaak een grotere steekproefgrootte aanbevolen. Een vuistregel is om minimaal 600 respondenten te hebben voor een factoranalyse. Dit grotere aantal respondenten zorgt voor meer robuuste resultaten bij het identificeren van de factoren in de vragenlijst.

Hoewel deze vuistregels handig kunnen zijn, is het belangrijk om te benadrukken dat ze algemene richtlijnen zijn en dat de specifieke context van je onderzoek ook moet worden overwogen. Afhankelijk van de complexiteit van je onderzoeksvragen, de gewenste statistische power en andere overwegingen, kan het nodig zijn om de steekproefgrootte verder aan te passen.

Hoe je de steekproefgrootte berekent

Om de steekproefgrootte te berekenen, kun je gebruikmaken van een formule. Er zijn verschillende formules beschikbaar, afhankelijk van het type/meetniveau van de data die je bestudeert.

Formule voor proporties

Een veelgebruikte formule is de formule voor proporties, die van toepassing is op situaties waarin je een categorische variabele bestudeert, zoals man/vrouw of roker/niet-roker. Deze formule houdt rekening met het betrouwbaarheidsniveau, precisieniveau en de geschatte proportie of verwachte frequentie van de categorie die je wilt onderzoeken. Laten we de formule illustreren met een voorbeeld:

Stel je voor dat je een onderzoek wilt doen naar de tevredenheid van studenten over een bepaalde dienst op je universiteit. Je wilt een enquête uitvoeren en een betrouwbaarheidsniveau van 95% hebben met een precisieniveau van 5%. Je hebt geen eerdere informatie over de geschatte proportie van tevreden studenten, dus je kunt een conservatieve schatting van 50% gebruiken, wat het meest conservatieve scenario is.

Nu kunnen we de formule invullen en de steekproefgrootte berekenen:

n = (Z^2 * p * (1-p)) / (E^2)

In dit geval:

Z is de Z-score die hoort bij het betrouwbaarheidsniveau van 95%. Bij een betrouwbaarheidsniveau van 95% komt dit overeen met een Z-score van 1,96.

p is de geschatte proportie van tevreden studenten. We gebruiken 0,5 (50%) als een conservatieve schatting.

E is de gewenste precisie, ook wel de marge van fout genoemd. We gebruiken 0,05 (5%).

Laten we deze waarden in de formule plaatsen:

n = (1,96^2 * 0,5 * (1-0,5)) / (0,05^2)

n = (3,8416 * 0,25) / 0,0025

n = 0,9604 / 0,0025

n ≈ 384,16

Het resultaat van deze berekening is 384,16. Aangezien we geen fractie van een persoon kunnen hebben, moeten we afronden naar het dichtstbijzijnde gehele getal. Dus, de aanbevolen steekproefgrootte voor dit onderzoek zou ongeveer 384 respondenten zijn.

Het is belangrijk op te merken dat deze berekening gebaseerd is op de aannames die we hebben gemaakt, zoals de conservatieve schatting van 50% en de gewenste precisie van 5%. Als je over meer informatie beschikt of andere aannames wilt maken, kunnen de berekeningen anders uitvallen.

Formule voor gemiddelden

De formule voor gemiddelden is een andere benadering die je kunt gebruiken als je werkt met metingen waarbij het gemiddelde van belang is, zoals het aantal deeltjes testosteron in het bloed of het aantal sigaretten per week. In tegenstelling tot de formule voor proporties, houdt de formule voor gemiddelden rekening met het betrouwbaarheidsniveau, de standaarddeviatie en de gewenste precisie.

Laten we een voorbeeld geven om de formule voor gemiddelden te illustreren:

Stel dat je een onderzoek wilt uitvoeren naar het gemiddelde aantal uren slaap dat volwassenen per nacht krijgen. Je wilt een betrouwbaarheidsniveau van 95% hanteren met een precisieniveau van 0,5 uur. Je hebt geen eerdere informatie over de standaarddeviatie van het aantal uren slaap, dus je kunt een conservatieve schatting van 6 uur gebruiken, wat een breed bereik aan mogelijke waarden omvat.

Nu kunnen we de formule voor gemiddelden invullen en de steekproefgrootte berekenen:

n = (Z^2 * σ^2) / (E^2)

In dit geval:

Z is de Z-score die hoort bij het betrouwbaarheidsniveau van 95%. Bij een betrouwbaarheidsniveau van 95% komt dit overeen met een Z-score van 1,96.

σ is de standaarddeviatie van het aantal uren slaap. We gebruiken 6 uur als een conservatieve schatting.

E is de gewenste precisie. We gebruiken 0,5 uur.

Laten we deze waarden in de formule plaatsen:

n = (1,96^2 * 6^2) / (0,5^2)

n = (3,8416 * 36) / 0,25

n = 138,2976 / 0,25

n ≈ 553,19

Het resultaat van deze berekening is 553,19. Aangezien we geen fractie van een persoon kunnen hebben, moeten we afronden naar het dichtstbijzijnde gehele getal. Dus, de aanbevolen steekproefgrootte voor dit onderzoek zou ongeveer 553 respondenten zijn.

Net als bij de formule voor proporties, is het belangrijk om te onthouden dat de berekeningen gebaseerd zijn op de aannames die we hebben gemaakt, zoals de conservatieve schatting van de standaarddeviatie en de gewenste precisie. Als je over meer informatie beschikt of andere aannames wilt maken, kunnen de berekeningen anders uitvallen.

Conclusie

Het berekenen van de juiste steekproefgrootte is van essentieel belang voor een succesvol afstudeeronderzoek. Door een passende steekproefgrootte te bepalen, kun je nauwkeurige en betrouwbare resultaten verkrijgen. Eenvoudive vuistregels zijn beschikbaar, maar exact berekenen met formules is vaak beter.

Met behulp van formules, zoals de formules voor proporties of gemiddelden, kun je de steekproefgrootte berekenen op basis van het gewenste betrouwbaarheidsniveau, precisieniveau en de geschatte proportie of gemiddelde. Er zijn online calculators beschikbaar zijn om dit proces te vergemakkelijken.

Vergeet niet om de steekproefgrootte aan te passen aan de beschikbare middelen en de aard van het onderzoek. Met de juiste steekproefgrootte leg je een stevige basis voor een succesvolle afstudeerscriptie.

Place comment