V tomto článku si řekneme, co jsou to statistické hypotézy, jak s hypotézami pracovat a naučíme se některé základní pojmy. Testování statistických hypotéz nám umožňuje vyvozovat závěry o populaci na základě reprezentativního vzorku. Zpravidla není možné získat data z celé populace a právě proto používáme inferenční statistiku, která nám dovolí na základě vzorku dat vyvozovat závěry pro celý populační soubor.
Pojďme si celý postup ukázat na jednoduchém příkladu:
Pravidelně chodíte do své oblíbené pekárny a kupujete si k snídani skvělé jahodové koblihy. Po určité době máte pocit, že se velikost a tím i váha koblih změnila, ačkoli pekárna stále uvádí původní váhu 65 g. Jelikož se právě učíte statistiku, zkusíte si udělat svůj vlastní výzkum.
V pekárně si zakoupíte 40 koblih a zvážíte je. Průměrná váha vám vyjde 62,6 gramů a směrodatná odchylka 6,99 gramů. Hladinu významnosti zvolíte standardně 5 %. V rámci našeho testování budeme předpokládat normální rozdělení dat.
Zde je potřeba si uvědomit, že když se jedná o náhodný výběr 40 koblih, lze jen těžko předpokládat, že by vám průměrná váha vyšla přesně 65 gramů. Otázka však je, kdy je rozdíl mezi zjištěnou (62,6 gramů) a předpokládanou hodnotou (65 gramů) opravdu významný. K tomu nám již pomůže statistika.
Další údaje nejsou potřeba a můžeme se společně pustit do testování!
Vždy je nutné stanovit nulovou a alternativní hypotézu.
Nulová a alternativní hypotéza
Nulová hypotéza obvykle uvádí, že nedošlo k žádné změně, či že mezi proměnnými není závislost. Tedy například:
- Výsledky skupin jsou shodné.
- Mezi pohlavím a užitím návykových látek není významná závislost.
- Korelační koeficient je statisticky nevýznamný.
- Podíl voličů odpovídá předpokladu.
V našem příkladu nulová hypotéza tvrdí, že střední hodnota váhy koblih je 65 gramů. V případě jednovýběrových testů, což je i náš příklad, dáváme do nulové hypotézy vždy předpokládanou hodnotu (původní tvrzení). Nulovou hypotézu potom značíme jako H0.
Alternativní hypotéza obvykle uvádí, že k nějaké změně došlo, například:
- Výsledky skupin jsou rozdílné.
- Mezi pohlavím a užitím návykových látek je významná závislost.
- Korelační koeficient je statisticky významný.
- Podíl voličů neodpovídá předpokladu.
U alternativních hypotéz máme menší rozšíření a to takové, že můžeme mít buď jednostrannou nebo oboustrannou alternativní hypotézu. V našem příkladu bychom se mohli ptát, zda se váha koblih významně snížila. V takovém případě by šlo o jednostrannou alternativní hypotézu (H1: mí < 65 g), stejně tak pokud bychom se ptali, zda se váha zvýšila (H1: mí > 65 g). Pokud se budeme ptát, zda došlo ke změně váhy, aniž bychom chtěli testovat, zda se má snížit, či zvýšit, tak se jedná o oboustrannou alternativní hypotézu (H1: mí ≠ 65 g). Jak jste si již mohli všimnout, tak alternativní hypotéza se zpravidla značí jako H1 nebo HA.
Chceme testovat, zda se váha změnila a tedy budeme pracovat s oboustrannou alternativní hypotézou.
H_{0}:\mu = 65
H_{1}:\mu \neq 65
Pojďme k dalšímu krok a tím je volba správného testu.
jednovýběrový test pro střední hodnotu
Typy testů a jejich volbu si vysvětlíme v nějakém dalším článku. V případě naší úlohy použijeme tzv. jednovýběrový test pro střední hodnotu a spočítáme testové kritérium (testovou statistiku). Výpočet lze vidět zde:
U=\frac{\overline{x}-\mu _{0}}{s}\sqrt{n}=\frac{62.6-65}{6.99}*\sqrt{40}=-2.17
Výsledek testové statistiky nám zaokrouhleně vyšel -2.17.
Nyní máme dvě možnosti, buď najdeme tzv. kritickou hodnotu nebo určíme p-hodnotu.
Pojďme si ukázat obě varianty. Jelikož naše data mají normální rozdělení (viz. náš příklad), můžeme si vše ukázat právě na křivce normálního rozdělení. (Pokud již o testování něco víte, tak bych jen ráda zmínila, že vzhledem k velikosti výběrového souboru je použito normální rozdělení, nad n > 30 je možné i při neznámém populačním rozptylu tuto aproximaci použít, kdyby byl vzorek menší, bylo by použito Studentovo t rozdělení. Výpočty a vysvětlení najdete v mnoha online kurzech).
Kritická hodnota
Kritická hodnota je hranice mezi oborem přijetí a kritickým oborem. Testové statistiky, které překročí kritickou hodnotu, spadnou do kritického oboru. Pokud testová statistika spadne do kritického oboru, tak nulovou hypotézu zamítáme. Pokud testová statistika tuto hodnotu nepřekročí, je v oboru přijetí, tak nulovou hypotézu nezamítáte. Kritická hodnota vychází z použitého rozdělení (v našem případě normálního) a z hladiny významnosti, v případě některých rozdělení hrají roli i stupně volnosti.
Hladina významnosti
Hladinu významnosti lze definovat jako pravděpodobnost zamítnutí nulové hypotézy, ačkoli je H0 pravdivá. Značí se zpravidla jako alfa (α) a představuje také chybu I. druhu. Například hladina významnosti 0,05 znamená, že je 5% pravděpodobnost, že dojde k nesprávnému zamítnutí nulové hypotézy (zamítnu H0, ačkoli platí). Čím nižší tato hladina je, tím je obtížnější H0 zamítnout.
Jak určíme naši kritickou hodnotu?
Hladina významnosti je 5 %, tedy alfa=0,05. Používáme oboustrannou hypotézu, proto musíme naší hladinu významnosti vydělit dvěma, tím dostaneme hodnotu 0,025. Znamená to, že kritický obor bude tvořit na levé straně grafu 2,5 % a na pravé straně 2,5 %. Ve statistických tabulkách si pak najdeme kvantil normovaného normálního rozdělení (normální rozdělení s nulovou střední hodnotou) a budeme hledat hodnotu 0,975 (1-0,025), hledáme 0,975, jelikož hodnoty jsou zpravidla uváděny od hodnoty 0,5 (rozdělení je symetrické). Pro tuto pravděpodobnost nacházíme hodnotu 1,96, jedná se o kvantil normovaného normálního rozdělení a naší kritickou hodnotu. Pro hodnotu 0,025 by tak šlo o kritickou hodnotu -1,96. (Pozn. pro studenty ČZU, v tabulkách ČZU jsou uváděny automaticky hodnoty pro oboustranné hypotézy, tedy hodnotu 1,96 najdete pod pravděpodobností 0,95).
V grafu níže lze vidět obor přijetí, kritickou hodnotu a kritický obor. Pokud si vezmeme naší hodnotu -2,17 (případně ji klidně můžeme použít v absolutní hodnotě jako 2,17), tak lze krásně vidět, že spadá do kritického oboru a tedy nulovou hypotézu zamítáme a přijímáme hypotézu alternativní na 5% hladině významnosti.