• Lærebøker
  • Python
  • GeoGebra
  • Hoderegning
  • Test deg selv

Søk i Skolesaga

Søk etter lærebøker, kapitler, trinn og verktøy

Gratis interaktive lærebøker for norsk skole.

Lærebok
PersonvernVilkår

© 2025 Skolesaga · Alle rettigheter forbeholdt

Deler av innholdet er utviklet med hjelp av AI-verktøy

Teknologi og forskningslære 2Tilbake
2.5 Konfidensintervall og feilmarginer
Konfidensintervall og feilmarginer

2.5 Konfidensintervall og feilmarginer

Alle fag for VG3

Beregning av konfidensintervall, standardfeil og usikkerhet.

25 min
5 oppgaver
KonfidensintervallStandardfeilFeilmargin
Din fremgang i kapitlet
0 / 5 oppgaver

Konfidensintervall og feilmarginer

Når vi estimerer en populasjonsparameter fra et utvalg, gir punktestimatet (for eksempel xˉ\bar{x}xˉ) bare én enkelt verdi. Men hvor sikre kan vi være på at dette estimatet er nært den sanne verdien? Konfidensintervaller gir oss et intervall som med en bestemt sannsynlighet inneholder den sanne parameteren — og feilmarginen angir bredden av denne usikkerheten.

Læringsmål:
- Forstå forskjellen mellom punktestimat og intervallsestimat
- Beregne konfidensintervall for gjennomsnitt og proporsjoner
- Forklare begrepene standardfeil, konfidensnivå og feilmargin
- Tolke konfidensintervaller korrekt
- Forstå hvordan utvalgsstørrelse påvirker presisjon

Fra punktestimat til intervallsestimat

Et punktestimat er en enkelt verdi beregnet fra utvalget, for eksempel utvalgsgjennomsnittet xˉ=72,3\bar{x} = 72{,}3xˉ=72,3. Problemet er at dette tallet alene ikke forteller oss noe om usikkerheten — hvor langt unna kan den sanne verdien μ\muμ være?

Et intervallsestimat (konfidensintervall) løser dette ved å gi et intervall [xˉ−E, xˉ+E][\bar{x} - E, \, \bar{x} + E][xˉ−E,xˉ+E] der EEE er feilmarginen. Intervallet er konstruert slik at det med en gitt sannsynlighet (konfidensnivået) inneholder den sanne parameteren.

Byggeklossene i et konfidensintervall

Et konfidensintervall for gjennomsnittet er bygget opp av tre deler:

Konfidensintervall=xˉ±z∗⋅sn\text{Konfidensintervall} = \bar{x} \pm z^* \cdot \frac{s}{\sqrt{n}}Konfidensintervall=xˉ±z∗⋅n​s​

der:
- xˉ\bar{x}xˉ er utvalgsgjennomsnittet (sentrum av intervallet)
- z∗z^*z∗ er den kritiske verdien som avhenger av konfidensnivået
- s/n=SEs / \sqrt{n} = SEs/n​=SE er standardfeilen
- E=z∗⋅SEE = z^* \cdot SEE=z∗⋅SE er feilmarginen

Feilmarginen bestemmer altså bredden av intervallet, og den avhenger av tre faktorer: spredningen i dataene (sss), utvalgsstørrelsen (nnn), og konfidensnivået (via z∗z^*z∗).

Konfidensintervall
Et konfidensintervall er et intervall beregnet fra utvalgsdata som med en angitt sannsynlighet (konfidensnivået) inneholder den sanne populasjonsparameteren.

For gjennomsnittet med kjent eller stor nnn:

KI=xˉ±z∗⋅sn\text{KI} = \bar{x} \pm z^* \cdot \frac{s}{\sqrt{n}}KI=xˉ±z∗⋅n​s​

Konfidensnivå er sannsynligheten for at metoden produserer et intervall som inneholder den sanne parameteren. Vanlige nivåer:
- 90 % → z∗=1,645z^* = 1{,}645z∗=1,645
- 95 % → z∗=1,960z^* = 1{,}960z∗=1,960
- 99 % → z∗=2,576z^* = 2{,}576z∗=2,576

Feilmarginen er E=z∗⋅SEE = z^* \cdot SEE=z∗⋅SE, altså halve bredden av konfidensintervallet.

✏️Eksempel: 95 %-konfidensintervall for gjennomsnitt

En forsker måler reaksjonstid hos n=100n = 100n=100 VG3-elever og finner xˉ=248\bar{x} = 248xˉ=248 ms med s=30s = 30s=30 ms. Beregn et 95 %-konfidensintervall for den sanne gjennomsnittlige reaksjonstiden μ\muμ.

Steg 1: Beregn standardfeilen:
SE=sn=30100=3010=3,0 msSE = \frac{s}{\sqrt{n}} = \frac{30}{\sqrt{100}} = \frac{30}{10} = 3{,}0 \text{ ms}SE=n​s​=100​30​=1030​=3,0 ms

Steg 2: Finn den kritiske verdien for 95 %:
z∗=1,960z^* = 1{,}960z∗=1,960

Steg 3: Beregn feilmarginen:
E=z∗⋅SE=1,960⋅3,0=5,88 msE = z^* \cdot SE = 1{,}960 \cdot 3{,}0 = 5{,}88 \text{ ms}E=z∗⋅SE=1,960⋅3,0=5,88 ms

Steg 4: Konstruer konfidensintervallet:
KI=248±5,88=[242,1,  253,9]\text{KI} = 248 \pm 5{,}88 = [242{,}1, \; 253{,}9]KI=248±5,88=[242,1,253,9]

Tolkning: Vi er 95 % sikre på at den sanne gjennomsnittlige reaksjonstiden for alle VG3-elever ligger mellom 242,1 ms og 253,9 ms. Feilmarginen er ca. 5,9 ms.

📝Oppgave 2.5.1

Et 95 %-konfidensintervall for gjennomsnittlig daglig skjermtid er [3,8,  4,6][3{,}8, \; 4{,}6][3,8,4,6] timer. Hva betyr dette?

Standardfeil og konfidensnivå

Standardfeilens rolle

Standardfeilen SE=s/nSE = s / \sqrt{n}SE=s/n​ er nøkkelen til å forstå presisjon i statistikk. Den angir hvor mye utvalgsgjennomsnittet typisk varierer fra det sanne gjennomsnittet. Jo mindre standardfeil, desto smalere konfidensintervall og desto mer presist estimat.

Standardfeilen avhenger av to faktorer:
- Spredningen sss: Mer variasjon i dataene gir større usikkerhet
- Utvalgsstørrelsen nnn: Større utvalg gir mindre usikkerhet

Sammenhengen med nnn er ikke lineær — den følger kvadratroten. For å halvere standardfeilen (og dermed feilmarginen) må du firedoble utvalgsstørrelsen:

Halvere SE  ⟹  nny=4⋅ngammel\text{Halvere } SE \implies n_{\text{ny}} = 4 \cdot n_{\text{gammel}}Halvere SE⟹nny​=4⋅ngammel​

Valg av konfidensnivå

Konfidensnivået bestemmer hvor «sikre» vi vil være, men det er en avveining:

Konfidensnivåz∗z^*z∗Konsekvens
90 %1,645Smalere intervall, men lavere sikkerhet
95 %1,960Standard — god balanse mellom presisjon og sikkerhet
99 %2,576Bredere intervall, men høyere sikkerhet

Høyere konfidensnivå gir bredere intervaller. Det er som å kaste et bredere nett — du er mer sikker på å fange fisken, men du fanger også mye vann.
Standardfeil og feilmargin
Standardfeil (SE) er standardavviket til utvalgsfordelingen til en statistikk. For gjennomsnittet:

SExˉ=snSE_{\bar{x}} = \frac{s}{\sqrt{n}}SExˉ​=n​s​

Feilmargin (E) er den maksimale forventede avstanden mellom estimatet og den sanne verdien ved et gitt konfidensnivå:

E=z∗⋅SEE = z^* \cdot SEE=z∗⋅SE

Sammenheng: Konfidensintervallet er xˉ±E\bar{x} \pm Exˉ±E, der EEE er feilmarginen.

Øke presisjonen: For å oppnå en ønsket feilmargin EEE trenger vi utvalgsstørrelse:

n=(z∗⋅sE)2n = \left(\frac{z^* \cdot s}{E}\right)^2n=(Ez∗⋅s​)2

✏️Eksempel: Nødvendig utvalgsstørrelse

En forsker ønsker å estimere gjennomsnittlig puls hos VG3-elever med en feilmargin på maks 2 slag/min ved 95 % konfidensnivå. Fra en pilotstudie vet hun at s≈12s \approx 12s≈12 slag/min. Hvor mange elever trenger hun i utvalget?

Vi bruker formelen for nødvendig utvalgsstørrelse:

n=(z∗⋅sE)2=(1,960⋅122)2=(23,522)2=(11,76)2=138,3n = \left(\frac{z^* \cdot s}{E}\right)^2 = \left(\frac{1{,}960 \cdot 12}{2}\right)^2 = \left(\frac{23{,}52}{2}\right)^2 = (11{,}76)^2 = 138{,}3n=(Ez∗⋅s​)2=(21,960⋅12​)2=(223,52​)2=(11,76)2=138,3

Vi runder opp til nærmeste hele tall: n=139n = 139n=139.

Tolkning: Forskeren trenger minst 139 elever i utvalget for å oppnå en feilmargin på maks 2 slag/min med 95 % sikkerhet. Merk at vi alltid runder opp — å runde ned ville gi en feilmargin som er litt for stor.

📝Oppgave 2.5.2

Et konfidensintervall basert på n=64n = 64n=64 observasjoner har feilmargin E=3,0E = 3{,}0E=3,0. Hva skjer med feilmarginen dersom utvalgsstørrelsen økes til n=256n = 256n=256 (alt annet likt)?

Konfidensintervall for proporsjoner

Ofte er vi interessert i en andel (proporsjon) i stedet for et gjennomsnitt. For eksempel: «Hvilken andel av VG3-elever bruker mer enn 4 timer daglig på skjerm?» Da estimerer vi populasjonsproporsjon ppp med utvalgsproporsjon p^\hat{p}p^​.

Formel for konfidensintervall for proporsjon

KI=p^±z∗⋅p^(1−p^)n\text{KI} = \hat{p} \pm z^* \cdot \sqrt{\frac{\hat{p}(1 - \hat{p})}{n}}KI=p^​±z∗⋅np^​(1−p^​)​​

Her er standardfeilen for en proporsjon:

SEp^=p^(1−p^)nSE_{\hat{p}} = \sqrt{\frac{\hat{p}(1 - \hat{p})}{n}}SEp^​​=np^​(1−p^​)​​

Forutsetninger

For at tilnærmingen skal være gyldig, kreves det at:
- n⋅p^≥10n \cdot \hat{p} \geq 10n⋅p^​≥10 og n⋅(1−p^)≥10n \cdot (1 - \hat{p}) \geq 10n⋅(1−p^​)≥10 (tilstrekkelig mange «suksesser» og «fiaskoer»)
- Utvalget er tilfeldig trukket fra populasjonen

Feilmargin i meningsmålinger

I meningsmålinger og spørreundersøkelser oppgis gjerne en «feilmargin» på ±3\pm 3±3 prosentpoeng. Denne er feilmarginen EEE ved 95 % konfidensnivå. For proporsjoner nær p^=0,5\hat{p} = 0{,}5p^​=0,5 (verste tilfelle) er:

E≈1nE \approx \frac{1}{\sqrt{n}}E≈n​1​

For n=1000n = 1000n=1000: E≈1/1000≈0,032≈3,2E \approx 1/\sqrt{1000} \approx 0{,}032 \approx 3{,}2E≈1/1000​≈0,032≈3,2 prosentpoeng, noe som forklarer den typiske feilmarginen i norske meningsmålinger.

Konfidensintervall for proporsjon
For en utvalgsproporsjon p^\hat{p}p^​ basert på nnn observasjoner er konfidensintervallet:

KI=p^±z∗⋅p^(1−p^)n\text{KI} = \hat{p} \pm z^* \cdot \sqrt{\frac{\hat{p}(1 - \hat{p})}{n}}KI=p^​±z∗⋅np^​(1−p^​)​​

Nødvendig utvalgsstørrelse for en ønsket feilmargin EEE (med verste tilfelle p^=0,5\hat{p} = 0{,}5p^​=0,5):

n=(z∗2E)2n = \left(\frac{z^*}{2E}\right)^2n=(2Ez∗​)2

For 95 % konfidensnivå og E=0,03E = 0{,}03E=0,03:
n=(1,960,06)2=(32,67)2≈1068n = \left(\frac{1{,}96}{0{,}06}\right)^2 = (32{,}67)^2 \approx 1068n=(0,061,96​)2=(32,67)2≈1068

✏️Eksempel: Konfidensintervall for en andel

I en undersøkelse blant 400 VG3-elever svarer 240 at de trener minst 3 ganger i uken. Beregn et 95 %-konfidensintervall for den sanne andelen som trener minst 3 ganger i uken.

Steg 1: Beregn utvalgsproporsjon:
p^=240400=0,60\hat{p} = \frac{240}{400} = 0{,}60p^​=400240​=0,60

Steg 2: Sjekk forutsetningene:
np^=400⋅0,60=240≥10n \hat{p} = 400 \cdot 0{,}60 = 240 \geq 10np^​=400⋅0,60=240≥10 ✓
n(1−p^)=400⋅0,40=160≥10n(1-\hat{p}) = 400 \cdot 0{,}40 = 160 \geq 10n(1−p^​)=400⋅0,40=160≥10 ✓

Steg 3: Beregn standardfeilen:
SE=0,60⋅0,40400=0,24400=0,0006=0,0245SE = \sqrt{\frac{0{,}60 \cdot 0{,}40}{400}} = \sqrt{\frac{0{,}24}{400}} = \sqrt{0{,}0006} = 0{,}0245SE=4000,60⋅0,40​​=4000,24​​=0,0006​=0,0245

Steg 4: Beregn feilmarginen:
E=1,960⋅0,0245=0,048E = 1{,}960 \cdot 0{,}0245 = 0{,}048E=1,960⋅0,0245=0,048

Steg 5: Konstruer konfidensintervallet:
KI=0,60±0,048=[0,552,  0,648]\text{KI} = 0{,}60 \pm 0{,}048 = [0{,}552, \; 0{,}648]KI=0,60±0,048=[0,552,0,648]

Tolkning: Vi er 95 % sikre på at den sanne andelen VG3-elever som trener minst 3 ganger i uken er mellom 55,2 % og 64,8 %. Feilmarginen er ca. 4,8 prosentpoeng.

📝Oppgave 2.5.3

En meningsmåling basert på n=1000n = 1000n=1000 respondenter viser at 45 % støtter et forslag, med feilmargin ±3,1\pm 3{,}1±3,1 prosentpoeng. Hvilken utvalgsstørrelse trengs for å halvere feilmarginen til ±1,55\pm 1{,}55±1,55 prosentpoeng?

Korrekt tolkning av konfidensintervaller

Konfidensintervaller er blant de mest misforståtte begrepene i statistikk. Her er noen vanlige feil og korrekt tolkning.

Korrekt tolkning

«Vi er 95 % sikre på at den sanne populasjonsparameteren ligger innenfor intervallet.»

Mer presist: Dersom vi gjentok undersøkelsen og beregnet nye konfidensintervaller mange ganger, ville ca. 95 % av disse intervallene inneholde den sanne verdien.

Vanlige misforståelser

Feil tolkningForklaring
«95 % av dataene ligger i intervallet»Nei, intervallet handler om parameteren (f.eks. μ\muμ), ikke om enkeltobservasjoner
«Det er 95 % sjanse for at μ\muμ er i intervallet»Teknisk sett er μ\muμ enten i intervallet eller ikke — det er metoden som har 95 % treffsikkerhet
«Feilmarginen betyr at noen har gjort en feil»Nei, feilmarginen er et mål på naturlig statistisk usikkerhet

Overlappende konfidensintervaller


Når to konfidensintervaller ikke overlapper, kan vi konkludere med at det er en statistisk signifikant forskjell mellom de to gruppene. Men dersom de overlapper, kan det likevel være en signifikant forskjell — overlapping utelukker ikke signifikans.

t-fordeling for små utvalg


Når utvalgsstørrelsen er liten (n<30n < 30n<30), bruker vi t-fordelingen i stedet for normalfordelingen. t-fordelingen har tyngre haler, noe som gir bredere konfidensintervaller og dermed kompenserer for den økte usikkerheten:

KI=xˉ±tn−1∗⋅sn\text{KI} = \bar{x} \pm t^*_{n-1} \cdot \frac{s}{\sqrt{n}}KI=xˉ±tn−1∗​⋅n​s​

der tn−1∗t^*_{n-1}tn−1∗​ er den kritiske verdien fra t-fordelingen med n−1n-1n−1 frihetsgrader.

✏️Eksempel: t-basert konfidensintervall

Et lite utvalg på n=16n = 16n=16 elever har gjennomsnittlig søvnlengde xˉ=7,2\bar{x} = 7{,}2xˉ=7,2 timer med s=1,0s = 1{,}0s=1,0 time. Beregn et 95 %-konfidensintervall med t-fordelingen (t15∗=2,131t^*_{15} = 2{,}131t15∗​=2,131).

Steg 1: Standardfeil:
SE=sn=1,016=1,04=0,25 timerSE = \frac{s}{\sqrt{n}} = \frac{1{,}0}{\sqrt{16}} = \frac{1{,}0}{4} = 0{,}25 \text{ timer}SE=n​s​=16​1,0​=41,0​=0,25 timer

Steg 2: Feilmargin med t-fordeling:
E=t15∗⋅SE=2,131⋅0,25=0,533 timerE = t^*_{15} \cdot SE = 2{,}131 \cdot 0{,}25 = 0{,}533 \text{ timer}E=t15∗​⋅SE=2,131⋅0,25=0,533 timer

Steg 3: Konfidensintervall:
KI=7,2±0,533=[6,67,  7,73]\text{KI} = 7{,}2 \pm 0{,}533 = [6{,}67, \; 7{,}73]KI=7,2±0,533=[6,67,7,73]

Sammenligning: Med z-fordeling (z∗=1,960z^* = 1{,}960z∗=1,960) ville feilmarginen vært 1,960⋅0,25=0,491{,}960 \cdot 0{,}25 = 0{,}491,960⋅0,25=0,49, som gir et smalere intervall [6,71,  7,69][6{,}71, \; 7{,}69][6,71,7,69]. t-fordelingen gir et bredere intervall fordi den kompenserer for usikkerheten i å estimere σ\sigmaσ med sss i et lite utvalg.

Oppsummering

- Et konfidensintervall gir et intervall som med en gitt sannsynlighet inneholder den sanne populasjonsparameteren.
- Formelen for gjennomsnitt er KI=xˉ±z∗⋅s/n\text{KI} = \bar{x} \pm z^* \cdot s/\sqrt{n}KI=xˉ±z∗⋅s/n​, der z∗z^*z∗ avhenger av konfidensnivået.
- Feilmarginen E=z∗⋅SEE = z^* \cdot SEE=z∗⋅SE angir halve bredden av intervallet og avhenger av spredning, utvalgsstørrelse og konfidensnivå.
- For proporsjoner brukes p^±z∗⋅p^(1−p^)/n\hat{p} \pm z^* \cdot \sqrt{\hat{p}(1-\hat{p})/n}p^​±z∗⋅p^​(1−p^​)/n​.
- Å halvere feilmarginen krever at utvalgsstørrelsen firedobles (fordi E∝1/nE \propto 1/\sqrt{n}E∝1/n​).
- For små utvalg (n<30n < 30n<30) brukes t-fordelingen som gir bredere intervaller enn z-fordelingen.
- Konfidensintervaller handler om parameteren, ikke om enkeltobservasjoner — dette er den vanligste misforståelsen.

📝Oppgave 4

I en studie av blodtrykk måles systolisk trykk hos n=81n = 81n=81 tilfeldig valgte voksne. Gjennomsnittet er xˉ=128\bar{x} = 128xˉ=128 mmHg med s=18s = 18s=18 mmHg. (a) Beregn et 95 %-konfidensintervall for det sanne gjennomsnittlige systoliske blodtrykket μ\muμ. (b) Beregn et 99 %-konfidensintervall. (c) Forklar hvorfor 99 %-intervallet er bredere enn 95 %-intervallet. (d) Hvor mange personer trengs for å oppnå en feilmargin på maks 2 mmHg ved 95 % konfidensnivå?

📝Oppgave 5

En valgdagsmåling viser at Parti A har p^=0,32\hat{p} = 0{,}32p^​=0,32 (32 %) basert på n=900n = 900n=900 respondenter. (a) Beregn et 95 %-konfidensintervall for partiets sanne oppslutning. (b) Beregn feilmarginen. (c) Et annet parti har p^=0,28\hat{p} = 0{,}28p^​=0,28 med samme utvalgsstørrelse. Beregn konfidensintervallet. (d) Overlapper de to konfidensintervallene? Hva kan vi konkludere om forskjellen mellom partiene?