Betrouwbaarheidsinterval bij grote steekproef
Geplaatst: 28 aug 2021, 12:57
Stel we hebben een spel kaarten zonder jokers en we onderzoeken het kenmerk: "de kaart is rood", oftewel alle harten en ruiten kaarten. We weten dat de populatieproportie hiervan 26/52 = 0,5 exact is. Maar neem nu aan dat we een steekproef nemen met steekproefomvang n = 52. Dan is standaardafwijking sd = wortel ( p * (1-p) / n) = wortel (0,5*0,5/52) = 0,069, oftewel 2 sd= 0,139 en het 95% betrouwbaarheidsinterval van de populatieproportie is [ 0,361 ; 0,639]. Dat is een heel brede betrouwbaarheidsinterval, terwijl we weten dat de populatieproportie exact gelijk is aan 0,5. Een vergelijkbare redenatie kun je opzetten met n=51, die heeft een steekproefproportie van 25/51 = 0,490 of 26/51 = 0,510, terwijl het 95% betrouwbaarheidsinterval weer heel breed is. De formule van sd = wortel ( p * (1-p) / n) is hier dus niet heel bruikbaar om het 95% betrouwbaarheidsinterval mee op te stellen. Hoe moet ik deze situatie interpreteren? De formule voor het betrouwbaarheidsinterval lijkt hier niet erg bruikbaar, want ik zou een klein (nauwkeurig) betrouwbaarheidsinterval verwachten als ik 51 van de 52 kaarten trek in een steekproef.
Of stel dat ik de steekproefomvang wil bepalen als ik een 95% betrouwbaarheidsinterval van [0,48 ; 0,52] wil bereiken, oftewel sd=0,01. Dan krijg je 0,01 = wortel (0,5*0,5 / n), oftewel n = 2500, dus ik moet 2500 kaarten trekken om dit betrouwbaarheidsinterval te bereiken, terwijl de populatie maar 52 kaarten kent. Intuitief zou ik verwachten dat bijvoorbeeld n=51 ook al ruim voldoende zou zijn, omdat de steekproefproportie dan 0,490 of 0,510 zal zijn.
Of stel dat ik de steekproefomvang wil bepalen als ik een 95% betrouwbaarheidsinterval van [0,48 ; 0,52] wil bereiken, oftewel sd=0,01. Dan krijg je 0,01 = wortel (0,5*0,5 / n), oftewel n = 2500, dus ik moet 2500 kaarten trekken om dit betrouwbaarheidsinterval te bereiken, terwijl de populatie maar 52 kaarten kent. Intuitief zou ik verwachten dat bijvoorbeeld n=51 ook al ruim voldoende zou zijn, omdat de steekproefproportie dan 0,490 of 0,510 zal zijn.