Interval spolehlivosti

Interval spolehlivosti je technika odhadu používaná ve statistické inferenci, která umožňuje omezit dvojici nebo několik dvojic hodnot, ve kterých bude (s určitou pravděpodobností) nalezen požadovaný bodový odhad.

Interval spolehlivosti

Interval spolehlivosti nám umožní vypočítat dvě hodnoty kolem průměru vzorku (jednu horní a jednu nižší). Tyto hodnoty omezí rozsah, ve kterém se s určitou pravděpodobností bude nacházet parametr populace.

Interval spolehlivosti = průměr + – hranice chyby

Znalost skutečné populace je obecně něco velmi složitého. Představte si populaci 4 milionů lidí. Mohli bychom znát průměrné spotřební výdaje na domácnost této populace? V principu ano. Museli bychom jednoduše provést průzkum ve všech domácnostech a vypočítat průměr. Dodržování tohoto procesu by však bylo extrémně pracné a značně by zkomplikovalo studium.

V situacích, jako je tato, je snazší vybrat statistický vzorek. Například 500 lidí. A na uvedeném vzorku vypočítejte průměr. Přestože bychom stále neznali skutečnou hodnotu populace, mohli bychom předpokládat, že se bude blížit hodnotě vzorku. K tomu přidáme chybovou hranici a máme hodnotu intervalu spolehlivosti. Na druhou stranu odečteme tuto chybovost od průměru a budeme mít jinou hodnotu. Mezi těmito dvěma hodnotami bude průměr populace.

Závěrem lze říci, že interval spolehlivosti neslouží k přesnému odhadu parametru populace, pokud nám má pomoci získat přibližnou představu o tom, který by mohl být ten pravý. Umožňuje nám omezit mezi dvěma hodnotami, kde se bude nacházet průměr populace.

Faktory, na kterých závisí interval spolehlivosti

Výpočet intervalu spolehlivosti závisí především na následujících faktorech:

  • Velikost vybraného vzorku: V závislosti na množství dat, která byla použita k výpočtu hodnoty vzorku, se bude více či méně blížit skutečnému parametru populace.
  • Úroveň spolehlivosti: Informuje nás, v jakém procentu případů je náš odhad správný. Obvyklé úrovně jsou 95 % a 99 %.
  • Mez chyby našeho odhadu: Toto se nazývá alfa a informuje nás o pravděpodobnosti, že hodnota populace je mimo náš interval.
  • Co se ve vzorku odhaduje (střední hodnota, rozptyl, rozdíl středních hodnot…): Na tom bude záviset pivotní statistika pro výpočet intervalu.

Příklad intervalu spolehlivosti pro průměr za předpokladu normality a známé standardní odchylky

Hlavní statistika použitá pro výpočet by byla následující:

Výsledný interval by byl následující:

Vidíme, jak v intervalu nalevo a napravo od nerovnosti máme dolní a horní mez. Proto nám výraz říká, že pravděpodobnost, že průměr populace leží mezi těmito hodnotami, je 1-alfa (úroveň spolehlivosti).

Podívejme se na výše uvedené lépe s příkladem řešeným cvičením.

Chcete odhadnout průměrný čas, který běžec potřebuje k dokončení maratonu. K tomu bylo měřeno 10 maratonů a byl získán průměr 4 hodiny se standardní odchylkou 33 minut (0,55 hodiny). Chcete získat 95% interval spolehlivosti.

K získání intervalu bychom museli pouze dosadit data ve vzorci intervalu.

Interval spolehlivosti by byla část distribuce, která je vystínována modře. 2 hodnoty ohraničené tímto by odpovídaly 2 červeným čarám. Střední čára, která rozděluje distribuci na 2, by byla skutečnou hodnotou populace.

Je důležité poznamenat, že v tomto případě, vzhledem k tomu, že funkce hustoty rozdělení N (0,1) nám dává kumulativní pravděpodobnost (zleva ke kritické hodnotě), musíme najít hodnotu, která nám ponechá 0,975 na levé % (to je 1,96).