Variabilitu lze vidět všude kolem nás. Jezdíte pravidelně do školy, či práce a vaše doba strávená na cestě se každý den lehce liší. Kupujete si k snídani pečivo a jeho váha určitě není pokaždé stejná. Určitá míra variability je v takových situacích naprosto normální. To, co může způsobit jisté problémy, jsou větší odchylky. Pokud na cestě do školy strávíte výrazně delší čas než obvykle, přijdete pozdě, stejně tak to bude s neobvykle malým kusem rohlíku, nebudete si ho chtít koupit. Pojďme se na variability podívat trochu víc do hloubky a vysvětlit si základní míry, kterými jsou například rozptyl, či směrodatná odchylka. 🙂
Míry variability nám říkají, jak jsou hodnoty v souboru rozptýleny okolo střední hodnoty. Nízká míra variability nám říká, že hodnoty mají tendenci být seskupeny blízko středu. Vysoká míra variability znamená opak (hodnoty jsou rozptýleny dále od středu) a je zde vyšší riziko výskytu odlehlých hodnot.
Variabilitu, podobně jako míry polohy, je možné měřit několika způsoby. Nejpoužívanějšími charakteristikami variability jsou rozptyl, směrodatná odchylka, rozpětí, mezikvartilové rozpětí a variační koeficient.
Rozpětí
Pojďme se podívat na tu nejednoduší míru a tou je rozpětí, přesněji variační rozpětí. Rozpětí se spočítá jako rozdíl maxima a minima. Stačí najít největší a nejmenší hodnotu a odečíst je od sebe.
R=x_{max}-x_{min}
Jedná se o rychlou a jednoduchou míru variability, která má jednu velkou nevýhodu a tou je vysoká citlivost na odlehlá pozorování.
Mezikvartilové rozpětí
Zatímco variační rozpětí nám říká rozpětí celého souboru, mezikvartilové rozpětí nám řekne rozpětí pouze poloviny hodnot. Výpočet je poměrně jednoduchý, stačí najít horní a dolní kvartil a provést jednoduchou matematickou operaci. Dolní kvartil (Q1) je hodnota, pod kterou leží 25 % hodnot, zatímco horní kvartil (Q3) je hodnota, pod kterou leží 75 % hodnot. Výpočet se pak provede jako rozdíl horního a dolního kvartilu.
IQR=Q3-Q1
Mezikvartilové rozpětí je robustní mírou variability, podobně jako je medián robustní mírou polohy. Díky této vlastnosti je vhodnou mírou variability pro soubory s odlehlými hodnotami, či pro zešikmená rozdělení. Jak vyplývá z principu výpočtu, je počítán pouze z 50 % prostředních hodnot.
[…] si zakoupíte 40 koblih a zvážíte je. Průměrná váha vám vyjde 62,6 gramů a směrodatná odchylka 6,99 gramů. Hladinu významnosti zvolíte standardně 5 %. V rámci našeho testování budeme […]