Forskellen mellem parametrisk og ikke-parametrisk statistik er baseret på viden eller uvidenhed om sandsynlighedsfordelingen af den variabel, der skal undersøges.
Parametrisk statistik bruger beregninger og procedurer, forudsat at du ved, hvordan den tilfældige variabel, der skal studeres, er fordelt. Tværtimod bruger ikke-parametrisk statistik metoder til at vide, hvordan et fænomen er fordelt, og senere bruger parametriske statistikteknikker.
Definitionerne af begge begreber er illustreret nedenfor:
- Parametrisk statistik: Refererer til en del af statistisk inferens, der bruger statistik og opløsningskriterier baseret på kendte fordelinger.
- Ikke-parametrisk statistik: Det er en gren af statistisk inferens, hvis beregninger og procedurer er baseret på ukendte fordelinger.
Parametrisk og ikke-parametrisk statistik er komplementære
De bruger forskellige metoder, fordi deres mål er forskellige. De er dog to komplementære grene. Vi ved ikke altid med sikkerhed – det gør vi faktisk sjældent – hvordan en tilfældig variabel er fordelt. Det er således nødvendigt at bruge teknikker til at finde ud af, hvilken type distribution den minder mest om.
Når vi har fundet ud af, hvordan det er fordelt, kan vi udføre specifikke beregninger og teknikker til denne type distribution. Da fx middelværdien i en Poisson-fordeling ikke beregnes på samme måde som i en Normal.
Alligevel er det vigtigt at bemærke, at parametrisk statistik er meget mere kendt og populær. Mange gange, i stedet for at bruge ikke-parametrisk statistik, antages det direkte, at en variabel er fordelt på én måde. Det vil sige, at det tager udgangspunkt i en udgangshypotese, som menes at være den rigtige. Men når vi ønsker at udføre et arbejde strengt, hvis vi ikke er sikre, skal vi bruge ikke-parametrisk statistik.
Ellers vil resultaterne være upræcise, uanset hvor velanvendte teknikkerne til parametrisk statistik er.