Korelace
- 18 dubna, 2024
- Lektor: Adriana Řeháčková
- Kategorie: Inferenční statistika Korelace Pravděpodobnost Výzkum
Pojďme se společně podívat na téma korelace. V tomto článku si řekneme, co to je korelace, jaké známe korelační koeficienty a jaký je rozdíl mezi korelací a kauzalitou!
Korelace mezi proměnnými indikuje, že při změně hodnoty jedné proměnné má druhá proměnná tendenci měnit se určitým směrem. Korelace se dá měřit pomocí korelačního koeficientu. Korelační koeficient udává sílu a směr tohoto vztahu. Znaménko korelačního koeficientu udává, zda je směr vztahu kladný (přímý) nebo záporný (nepřímý), z číselné hodnoty pak lze získat informaci o síle vztahu. Dva nejčastěji používané typy korelačních koeficientů jsou Pearsonův korelační koeficient a Spearmanův korelační koeficient.
Pearsonův korelační koeficient
Udává sílu a směr lineárního vztahu mezi dvěma spojitými proměnnými. Vztah mezi proměnnými je lineární, pokud je změna jedné proměnné spojena s úměrnou změnou druhé proměnné.
Pearsonův korelační koeficient leží v intervalu od -1 do 1. Krajní hodnoty -1 a 1 udávají dokonale lineární vztah. V praxi se s dokonale lineárními vztahy jen těžko setkáte.
- Kladná korelace znamená, že s růstem jedné proměnné má tendenci růst i druhá proměnná.
- Korelace blízká nule znamená, že s růstem jedné proměnné nemá druhá proměnná tendenci ani růst, ani klesat.
- Záporná korelace znamená, že s růstem jedné proměnné má druhá proměnná tendenci klesat.
Sílu korelace můžeme popsat i verbálně. V odborné literatuře lze dohledat několik různých intervalů se slovním popisem. Uvádím zde například rozdělení v absolutních hodnotách dle Evansovy příručky (1996):
0,00 – 0,19 „velmi slabá“
0,20 – 0,39 „slabá“
0,40 – 0,59 „střední“
0,60 – 0,79 „silná“
0,80 – 1,00 „velmi silná“.
Spearmanův korelační koeficient
Určuje monotónní vztah mezi dvěma spojitými nebo ordinálními proměnnými. V monotónním vztahu mají proměnné tendenci se měnit společně, ale ne nutně konstantním tempem. Spearmanův korelační koeficient vychází z pořadových hodnot jednotlivých proměnných. I tento korelační koeficient leží v intervalu od -1 do 1.
Pro oba korelační koeficienty je možné provést test významnosti korelačního koeficientu. Pomocí těchto testů jsme schopni rozhodnout, zda je na předem stanovené hladině významnosti korelace mezi proměnnými statisticky významná.
Korelace vs kauzalita
Jak již bylo řečeno, tak korelace je statistická míra, která popisuje sílu a směr vztahu mezi dvěma nebo více proměnnými. Korelace mezi proměnnými však automaticky neznamená, že změna jedné proměnné je příčinou změny hodnot druhé proměnné.
Příčinná souvislost (kauzalita) znamená, že jedna událost je důsledkem výskytu druhé události, tj. mezi oběma událostmi existuje příčinný vztah.
Pojďme se podívat na příklad:
Určitá činnost nebo událost může být příčinou jiné činnosti nebo události, např. kouření je příčinou zvýšeného rizika vzniku rakoviny plic. Na druhé straně máme situaci, kdy kouření koreluje s mírou alkoholismu. V tomto případě se jedná o korelaci a nelze tvrdit, že kouření je příčinou alkoholismu. V praxi je často obtížné jednoznačně stanovit příčinu a následek ve srovnání se stanovením korelace.
Pochopení rozdílu mezi korelací a kauzalitou je klíčové pro správné vyhodnocování dat a formulování závěrů. Zatímco korelace nám poskytuje informace o vztazích mezi proměnnými, kauzalita se zaměřuje na to, zda jedna proměnná způsobuje změny v druhé.
Chceš se o korelaci dozvědět více a zkusit si její výpočet na konkrétních příkladech? Využij některý z mých online kurzů. 🙂
Zdroje:
Evans, J. D. (1996). Straightforward statistics for the behavioral sciences. Pacific Grove, CA: Brooks/Cole Publishing.