Statistikk og Simulering

Statistikk

Veke 4. Snitt og spredning

3.3. Veke 4. Snitt og spredning

Målet denne veka er å forstå spreidningsmåla varians og standardavvik. Me skal kunna rekna varians og standardavvik både for hand og vha. Matlab, og me skal forstå kva standardavviket fortel oss om ei sannsynsfordelinga og kva me me ventar å sjå i gjentakne forsøk.

3.3.1. Lesestoff

Les 6 (Forventingsverdi) Frå Frisvold og Moe: Kapittel 5 og 6.1–6.2.

3.3.2. Onsdag (førelesing)

Innleiiande døme Me skal sjå på to ulike eksperiment.

1.
Du kastar ei terning (D6). Lat resultatet vera den stokastiske variabelen X.
2.
Du kastar to terningar (2D6) og deler på to. Lat resultatet vera den stokastiske variabelen Y .

Oppgåve 3.23 Kva er utfallsrommet for X?

Oppgåve 3.24 Kva er utfallsrommet for Y ?

Oppgåve 3.25 Kva er gjennomsnittet for X? Dette vert òg kalt forventingsverdien E(X).

Oppgåve 3.26 Kva er gjennomsnittet for Y ? (Dvs. forventingsverdien E(Y ).)

Oppgåve 3.27 Skisser sannsynsfordelingane for X og Y som histogram. Kva skilnader ser du mellom dei to fordelingane? Korleis kan du forklara dei?

Populasjonsvariansen og -standardavviket

Oppgåve 3.28 Rekn ut variansen for X og Y .

Definisjon 4 (Populasjonsvarians) Populasjonsvariansen for ein variabel X med moglege utfall x1,x2,,xn er definert som

σ2 = i=1nP(X = x i)(xi x̄)2. (3) 

Standardavviket er σ = σ2.

Legg merke til at (xi x̄) er avstanden mellom eit utfall og gjennomsnittet. Ved å kvadrera får me alltid eit positivt tal. Stor spreidning i utvalet tyder at utfall med stor kvadratavvvik er (relativt) hyppige, og variansen vert stor.

Definisjon 5 (Populasjonsstandardavvik) Kvadratroten av variansen,

σ = i=1nP(X = xi)(xi x̄)2 (4) 

vert kalt for standardavviket.

Oppgåve 3.29 Kva er standardavviket for X og for Y ?

Populasjon og utval (repetisjon)

Utvalsvariansen

Definisjon 6 (Utvalsvarians) Utvalsvariansen for observasjonane x1,x2,,xn er definert som

s2 = 1 n 1 i=1n(x i x̄)2. (5) 
Legg merke til at (xi x̄) er avstanden mellom observasjonen og gjennomsnittet. Ved å kvadrera får me alltid eit positivt tal. Stor spreidning i utvalet tyder at mange av desse kvadratavstandane er store. Det er forvirrande at me deler på n 1. Dersom hadde delt på n, so hadde me sagt at s2 er gjennomsnittet av kvadratavstandane, men det viser seg at n 1 gjev eit betre mål.

Definisjon 7 (Utvalsstandardavvik) Kvadratroten av variansen,

s = 1 n 1 i=1n(xi x̄)2, (6) 

vert kalt for standardavviket.

Kast terningane fem gongar (n = 5), slik at du får fem observasjonar av X og fem av Y .

Oppgåve 3.30 Rekna ut variansen og standardavviket for utvalet x1,x2,,x5.

Oppgåve 3.31 (Socrative) Kva er variansen for y1,y2,,y5.

Oppgåve 3.32 (Socrative) Kva er standardavviket for y1,y2,,y5.

På same måte som me skil mellom utvals- og populasjonsgjennomsnitt, so skil me òg mellom utvals- og populasjonsvarians, og tilsvarande for standardavvik.

Merknad 2 Legg merke til at Y er ein lineær kombinasjon av X:

Y = 1 2X1 + 1 2X2

der X1 og X2 er to uavhengige variablar (to terningar) med same fordeling som X.

var(Y ) = 1 4var(X1) + 1 4var(X2) = 1 2var(X)

Merknad 3 Det fylgjer av merknaden over at

S.Dev.(Y ) = 1 2S.Dev.(X)

Oppsummering omgrep Definer omgrepa

1.
Punktsannsyn
2.
Fordelingsfunksjon (kummulativ sannsynsfordeling)
3.
Kvifor bruker me utval?
4.
Deskriptiv statistikk og statistisk inferens

Utvalssannsyn (???)

3.3.3. Fredag (rekneøving)

Oppgåve 3.33 Frisvold og Moe: Oppgave 5.2, 5.3

Oppgåve 3.34 Frisvold og Moe: Oppgave 5.6, 5.8

Oppgåve 3.35 Frisvold og Moe: Oppgave 5.13

Oppgåve 3.36 (Diskusjon) Frisvold og Moe: Oppgave 6.1–2

Oppgåve 3.37 (Ekstra) Frisvold og Moe: Oppgave 5.17

Oppgåve 3.38 (Ekstra) Oppgåver frå Frisvold og Moe: 5.4, 5.5

Oppgåve 3.39 (Ekstra) Oppgåver frå Frisvold og Moe: 4.2, 4.4, 4.5

Oppgåve 3.40 (Ekstra) Frisvold og Moe: Oppgave 6.10 og 6.13