Beregning av konfidensintervall, standardfeil og usikkerhet.
Når vi estimerer en populasjonsparameter fra et utvalg, gir punktestimatet (for eksempel ) bare én enkelt verdi. Men hvor sikre kan vi være på at dette estimatet er nært den sanne verdien? Konfidensintervaller gir oss et intervall som med en bestemt sannsynlighet inneholder den sanne parameteren — og feilmarginen angir bredden av denne usikkerheten.
Læringsmål:
- Forstå forskjellen mellom punktestimat og intervallsestimat
- Beregne konfidensintervall for gjennomsnitt og proporsjoner
- Forklare begrepene standardfeil, konfidensnivå og feilmargin
- Tolke konfidensintervaller korrekt
- Forstå hvordan utvalgsstørrelse påvirker presisjon
Et punktestimat er en enkelt verdi beregnet fra utvalget, for eksempel utvalgsgjennomsnittet . Problemet er at dette tallet alene ikke forteller oss noe om usikkerheten — hvor langt unna kan den sanne verdien være?
Et intervallsestimat (konfidensintervall) løser dette ved å gi et intervall der er feilmarginen. Intervallet er konstruert slik at det med en gitt sannsynlighet (konfidensnivået) inneholder den sanne parameteren.
Et konfidensintervall for gjennomsnittet er bygget opp av tre deler:
der:
- er utvalgsgjennomsnittet (sentrum av intervallet)
- er den kritiske verdien som avhenger av konfidensnivået
- er standardfeilen
- er feilmarginen
Feilmarginen bestemmer altså bredden av intervallet, og den avhenger av tre faktorer: spredningen i dataene (), utvalgsstørrelsen (), og konfidensnivået (via ).
For gjennomsnittet med kjent eller stor :
Konfidensnivå er sannsynligheten for at metoden produserer et intervall som inneholder den sanne parameteren. Vanlige nivåer:
- 90 % →
- 95 % →
- 99 % →
Feilmarginen er , altså halve bredden av konfidensintervallet.
En forsker måler reaksjonstid hos VG3-elever og finner ms med ms. Beregn et 95 %-konfidensintervall for den sanne gjennomsnittlige reaksjonstiden .
Steg 2: Finn den kritiske verdien for 95 %:
Steg 3: Beregn feilmarginen:
Steg 4: Konstruer konfidensintervallet:
Tolkning: Vi er 95 % sikre på at den sanne gjennomsnittlige reaksjonstiden for alle VG3-elever ligger mellom 242,1 ms og 253,9 ms. Feilmarginen er ca. 5,9 ms.
Et 95 %-konfidensintervall for gjennomsnittlig daglig skjermtid er timer. Hva betyr dette?
Standardfeilen er nøkkelen til å forstå presisjon i statistikk. Den angir hvor mye utvalgsgjennomsnittet typisk varierer fra det sanne gjennomsnittet. Jo mindre standardfeil, desto smalere konfidensintervall og desto mer presist estimat.
Standardfeilen avhenger av to faktorer:
- Spredningen : Mer variasjon i dataene gir større usikkerhet
- Utvalgsstørrelsen : Større utvalg gir mindre usikkerhet
Sammenhengen med er ikke lineær — den følger kvadratroten. For å halvere standardfeilen (og dermed feilmarginen) må du firedoble utvalgsstørrelsen:
Konfidensnivået bestemmer hvor «sikre» vi vil være, men det er en avveining:
| Konfidensnivå | Konsekvens | |
|---|---|---|
| 90 % | 1,645 | Smalere intervall, men lavere sikkerhet |
| 95 % | 1,960 | Standard — god balanse mellom presisjon og sikkerhet |
| 99 % | 2,576 | Bredere intervall, men høyere sikkerhet |
Feilmargin (E) er den maksimale forventede avstanden mellom estimatet og den sanne verdien ved et gitt konfidensnivå:
Sammenheng: Konfidensintervallet er , der er feilmarginen.
Øke presisjonen: For å oppnå en ønsket feilmargin trenger vi utvalgsstørrelse:
En forsker ønsker å estimere gjennomsnittlig puls hos VG3-elever med en feilmargin på maks 2 slag/min ved 95 % konfidensnivå. Fra en pilotstudie vet hun at slag/min. Hvor mange elever trenger hun i utvalget?
Vi runder opp til nærmeste hele tall: .
Tolkning: Forskeren trenger minst 139 elever i utvalget for å oppnå en feilmargin på maks 2 slag/min med 95 % sikkerhet. Merk at vi alltid runder opp — å runde ned ville gi en feilmargin som er litt for stor.
Et konfidensintervall basert på observasjoner har feilmargin . Hva skjer med feilmarginen dersom utvalgsstørrelsen økes til (alt annet likt)?
Ofte er vi interessert i en andel (proporsjon) i stedet for et gjennomsnitt. For eksempel: «Hvilken andel av VG3-elever bruker mer enn 4 timer daglig på skjerm?» Da estimerer vi populasjonsproporsjon med utvalgsproporsjon .
Her er standardfeilen for en proporsjon:
For at tilnærmingen skal være gyldig, kreves det at:
- og (tilstrekkelig mange «suksesser» og «fiaskoer»)
- Utvalget er tilfeldig trukket fra populasjonen
I meningsmålinger og spørreundersøkelser oppgis gjerne en «feilmargin» på prosentpoeng. Denne er feilmarginen ved 95 % konfidensnivå. For proporsjoner nær (verste tilfelle) er:
For : prosentpoeng, noe som forklarer den typiske feilmarginen i norske meningsmålinger.
Nødvendig utvalgsstørrelse for en ønsket feilmargin (med verste tilfelle ):
For 95 % konfidensnivå og :
I en undersøkelse blant 400 VG3-elever svarer 240 at de trener minst 3 ganger i uken. Beregn et 95 %-konfidensintervall for den sanne andelen som trener minst 3 ganger i uken.
Steg 2: Sjekk forutsetningene:
✓
✓
Steg 3: Beregn standardfeilen:
Steg 4: Beregn feilmarginen:
Steg 5: Konstruer konfidensintervallet:
Tolkning: Vi er 95 % sikre på at den sanne andelen VG3-elever som trener minst 3 ganger i uken er mellom 55,2 % og 64,8 %. Feilmarginen er ca. 4,8 prosentpoeng.
En meningsmåling basert på respondenter viser at 45 % støtter et forslag, med feilmargin prosentpoeng. Hvilken utvalgsstørrelse trengs for å halvere feilmarginen til prosentpoeng?
Konfidensintervaller er blant de mest misforståtte begrepene i statistikk. Her er noen vanlige feil og korrekt tolkning.
«Vi er 95 % sikre på at den sanne populasjonsparameteren ligger innenfor intervallet.»
Mer presist: Dersom vi gjentok undersøkelsen og beregnet nye konfidensintervaller mange ganger, ville ca. 95 % av disse intervallene inneholde den sanne verdien.
| Feil tolkning | Forklaring |
|---|---|
| «95 % av dataene ligger i intervallet» | Nei, intervallet handler om parameteren (f.eks. ), ikke om enkeltobservasjoner |
| «Det er 95 % sjanse for at er i intervallet» | Teknisk sett er enten i intervallet eller ikke — det er metoden som har 95 % treffsikkerhet |
| «Feilmarginen betyr at noen har gjort en feil» | Nei, feilmarginen er et mål på naturlig statistisk usikkerhet |
der er den kritiske verdien fra t-fordelingen med frihetsgrader.
Et lite utvalg på elever har gjennomsnittlig søvnlengde timer med time. Beregn et 95 %-konfidensintervall med t-fordelingen ().
Steg 2: Feilmargin med t-fordeling:
Steg 3: Konfidensintervall:
Sammenligning: Med z-fordeling () ville feilmarginen vært , som gir et smalere intervall . t-fordelingen gir et bredere intervall fordi den kompenserer for usikkerheten i å estimere med i et lite utvalg.
- Et konfidensintervall gir et intervall som med en gitt sannsynlighet inneholder den sanne populasjonsparameteren.
- Formelen for gjennomsnitt er , der avhenger av konfidensnivået.
- Feilmarginen angir halve bredden av intervallet og avhenger av spredning, utvalgsstørrelse og konfidensnivå.
- For proporsjoner brukes .
- Å halvere feilmarginen krever at utvalgsstørrelsen firedobles (fordi ).
- For små utvalg () brukes t-fordelingen som gir bredere intervaller enn z-fordelingen.
- Konfidensintervaller handler om parameteren, ikke om enkeltobservasjoner — dette er den vanligste misforståelsen.
I en studie av blodtrykk måles systolisk trykk hos tilfeldig valgte voksne. Gjennomsnittet er mmHg med mmHg. (a) Beregn et 95 %-konfidensintervall for det sanne gjennomsnittlige systoliske blodtrykket . (b) Beregn et 99 %-konfidensintervall. (c) Forklar hvorfor 99 %-intervallet er bredere enn 95 %-intervallet. (d) Hvor mange personer trengs for å oppnå en feilmargin på maks 2 mmHg ved 95 % konfidensnivå?
En valgdagsmåling viser at Parti A har (32 %) basert på respondenter. (a) Beregn et 95 %-konfidensintervall for partiets sanne oppslutning. (b) Beregn feilmarginen. (c) Et annet parti har med samme utvalgsstørrelse. Beregn konfidensintervallet. (d) Overlapper de to konfidensintervallene? Hva kan vi konkludere om forskjellen mellom partiene?