Stratifikovaný výběr vs klastrový vzorkování
Ve statistice, zejména při provádění průzkumů, je důležité získat nezaujatý vzorek, takže výsledek a předpovědi týkající se populace jsou přesnější. Ale v jednoduchém náhodném výběru existuje možnost vybrat členy vzorku, který je zkreslený; jinými slovy, nereprezentuje populaci spravedlivě. Proto se stratifikované vzorkování a shlukové vzorkování používají k překonání problémů zkreslení a účinnosti jednoduchého náhodného vzorkování.
Stratifikovaný výběr
Stratifikovaný náhodný výběr je metoda výběru, při které je soubor nejprve rozdělen do vrstev (vrstva je homogenní podmnožina základního souboru). Poté se z každé vrstvy odebere jednoduchý náhodný vzorek. Výsledky z každé vrstvy dohromady tvoří vzorek. Níže jsou uvedeny příklady možných vrstev v populacích
• Pro populaci státu, mužské a ženské vrstvy
• Pro lidi pracující ve městě, rezidentní a nerezidentní vrstvy
• Pro studenty na vysoké škole, bílé, černé, hispánské a asijské vrstvy
• Pro publikum debaty o teologii, protestantských, katolických, židovských a muslimských vrstvách
V tomto procesu, spíše než náhodné odběry vzorků přímo z populace, je populace rozdělena do skupin pomocí vlastní charakteristiky prvků (homogenní skupiny). Poté jsou ze skupiny odebrány náhodné vzorky. Množství náhodných vzorků odebraných z každé skupiny závisí na počtu prvků ve skupině.
To umožňuje vzorkování, aniž by vzorek jedné skupiny byl větší než počet vzorků požadovaný z této konkrétní skupiny. Pokud je počet prvků z určité skupiny větší než požadované množství, může zkreslení v distribuci vést k chybným interpretacím.
Stratifikovaný výběr umožňuje použití různých statistických metod pro každou vrstvu, což pomáhá zlepšit efektivitu a přesnost odhadu.
Vzorkování clusteru
Náhodný výběr shluků je metoda vzorkování, při které je populace nejprve rozdělena do shluků (shluk je heterogenní podmnožina populace). Poté je odebrán jednoduchý náhodný vzorek shluků. Všichni členové vybraných shluků společně tvoří vzorek. Tato metoda se často používá, když jsou přirozené seskupení zřejmé a dostupné.
Jako příklady zvažte průzkum pro hodnocení zapojení středoškolských studentů do mimoškolních aktivit. Spíše než výběr náhodných studentů ze studentské populace je výběr třídy jako vzorků pro průzkum klastrovým vzorkováním. Poté je pohovor s každým členem třídy. V tomto případě jsou třídy shluky studentské populace.
Při vzorkování shluků se náhodně vybírají shluky, nikoli jednotlivci. Předpokládá se, že každý shluk sám o sobě představuje nezaujatou reprezentaci populace, což znamená, že každý shluk je heterogenní.
Jaký je rozdíl mezi stratifikovaným vzorkováním a klastrovým vzorkováním?
• Ve stratifikovaném vzorkování je populace rozdělena do homogenních skupin nazývaných vrstvy pomocí atributu vzorků. Poté jsou vybráni členové z každé vrstvy a počet vzorků odebraných z těchto vrstev je úměrný přítomnosti vrstev v populaci.
• Při vzorkování shluků je populace seskupena do shluků, převážně na základě umístění, a pak je shluk náhodně vybrán.
• Při vzorkování shluků je shluk vybrán náhodně, zatímco u stratifikovaného vzorkování jsou členové vybíráni náhodně.
• Při stratifikovaném vzorkování zahrnuje každá použitá skupina (vrstvy) homogenní členy, zatímco při vzorkování shluků je shluk heterogenní.
• Stratifikované vzorkování je pomalejší, zatímco shlukové vzorkování je relativně rychlejší.
• Stratifikované vzorky mají méně chyb díky zohlednění přítomnosti každé skupiny v populaci a přizpůsobení metod k získání lepšího odhadu.
• Vzorkování clusteru má přirozeně vyšší procento chyb.