Rozdíl mezi rozptylem a kovariancí

Rozdíl mezi rozptylem a kovariancí
Rozdíl mezi rozptylem a kovariancí

Video: Rozdíl mezi rozptylem a kovariancí

Video: Rozdíl mezi rozptylem a kovariancí
Video: STATISTICS- Gaussian/ Normal Distribution 2024, Listopad
Anonim

Variance vs Covariance

Variance a kovariance jsou dvě míry používané ve statistice. Rozptyl je mírou rozptylu dat a kovariance udává míru změny dvou náhodných proměnných dohromady. Rozptyl je spíše intuitivní koncept, ale kovariance je definována matematicky, protože zpočátku není tak intuitivní.

Více o rozptylu

Variance je míra rozptylu dat od střední hodnoty rozdělení. Říká, jak daleko leží datové body od střední hodnoty rozdělení. Je to jeden z primárních deskriptorů rozdělení pravděpodobnosti a jeden z momentů rozdělení. Rozptyl je také parametrem základního souboru a rozptyl vzorku od základního souboru působí jako odhad rozptylu základního souboru. Z jedné perspektivy je definována jako druhá mocnina směrodatné odchylky.

Srozumitelným jazykem to lze popsat jako průměr druhých mocnin vzdálenosti mezi každým datovým bodem a střední hodnotu rozdělení. Pro výpočet rozptylu se používá následující vzorec.

Var(X)=E[(X-µ)2] pro populaci a

Var(X)=E[(X-‾x)2] pro vzorek

To lze dále zjednodušit tak, že dá Var(X)=E[X2]-(E[X])2.

Variance má některé vlastnosti podpisu a často se používá ve statistikách, aby bylo použití jednodušší. Rozptyl není záporný, protože se jedná o druhou mocninu vzdáleností. Rozsah rozptylu však není omezený a závisí na konkrétní distribuci. Rozptyl konstantní náhodné proměnné je nulový a rozptyl se nemění s ohledem na parametr umístění.

Více o Covarianci

Ve statistické teorii je kovariance měřítkem toho, jak moc se dvě náhodné proměnné společně mění. Jinými slovy, kovariance je mírou síly korelace mezi dvěma náhodnými proměnnými. Také to může být považováno za zobecnění konceptu rozptylu dvou náhodných proměnných.

Kovariance dvou náhodných proměnných X a Y, které jsou společně distribuovány s konečnou druhou hybností, je známá jako σXY=E[(X-E[X])(Y-E[Y])]. Z toho lze na rozptyl vidět zvláštní případ kovariance, kde jsou dvě proměnné stejné. Cov(X, X)=Var(X)

Normalizací kovariance lze získat lineární korelační koeficient nebo Pearsonův korelační koeficient, který je definován jako ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )

Graficky lze kovarianci mezi párem datových bodů vidět jako oblast obdélníku s datovými body v opačných vrcholech. Může být interpretován jako míra velikosti oddělení mezi dvěma datovými body. Pokud vezmeme v úvahu obdélníky pro celou populaci, překrytí obdélníků odpovídajících všem datovým bodům lze považovat za sílu oddělení; rozptyl dvou proměnných. Kovariance je ve dvou dimenzích kvůli dvěma proměnným, ale zjednodušením na jednu proměnnou získáme rozptyl jedné jako oddělení v jedné dimenzi.

Jaký je rozdíl mezi variance a kovariancí?

• Rozptyl je míra šíření/rozptylování v populaci, zatímco kovariance je považována za míru variace dvou náhodných proměnných nebo síly korelace.

• Rozptyl lze považovat za zvláštní případ kovariance.

• Rozptyl a kovariance jsou závislé na velikosti datových hodnot a nelze je porovnávat; proto jsou normalizovány. Kovariance je normalizována na korelační koeficient (dělený součinem směrodatných odchylek dvou náhodných veličin) a rozptyl je normalizován na směrodatnou odchylku (odmocninou)

Doporučuje: