Statistikk og Simulering

Veke 4. Snitt og spredning

Måndag (førelesing)

4.2. Måndag (førelesing)

4.2.1. Innleiiande døme

Me skal sjå på to ulike eksperiment.

1.
Du kastar ei terning (D6). Lat resultatet vera den stokastiske variabelen X.
2.
Du kastar to terningar (2D6) og deler på to. Lat resultatet vera den stokastiske variabelen Y .

Oppgåve 4.1 Kva er utfallsrommet for X?

Oppgåve 4.2 Kva er utfallsrommet for Y ?

Oppgåve 4.3 Kva er gjennomsnittet for X? Dette vert òg kalt forventingsverdien E(X).

Oppgåve 4.4 Kva er gjennomsnittet for Y ? (Dvs. forventingsverdien E(Y ).)

Oppgåve 4.5 Skisser sannsynsfordelingane for X og Y som histogram. Kva skilnader ser du mellom dei to fordelingane? Korleis kan du forklara dei?

4.2.2. Populasjonsvariansen og standardavviket

Oppgåve 4.6 Rekn ut variansen for X og Y .

Definisjon 7 (Populasjonsvarians) Populasjonsvariansen for ein variabel X med moglege utfall x1,x2,,xn er definert som

σ2 = i=1nP(X = x i)(xi x̄)2. (3) 

Standardavviket er σ = σ2.

Legg merke til at (xi x̄) er avstanden mellom eit utfall og gjennomsnittet. Ved å kvadrera får me alltid eit positivt tal. Stor spreidning i utvalet tyder at utfall med stor kvadratavvvik er (relativt) hyppige, og variansen vert stor.

Definisjon 8 (Populasjonsstandardavvik) Kvadratroten av variansen,

σ = i=1nP(X = xi)(xi x̄)2 (4) 

vert kalt for standardavviket.

Oppgåve 4.7 Kva er standardavviket for X og for Y ?

4.2.3. Utvalsvariansen

Definisjon 9 (Utvalsvarians) Utvalsvariansen for observasjonane x1,x2,,xn er definert som

s2 = 1 n 1 i=1n(x i x̄)2. (5) 

Legg merke til at (xi x̄) er avstanden mellom observasjonen og gjennomsnittet. Ved å kvadrera får me alltid eit positivt tal. Stor spreidning i utvalet tyder at mange av desse kvadratavstandane er store. Det er forvirrande at me deler på n 1. Dersom hadde delt på n, so hadde me sagt at s2 er gjennomsnittet av kvadratavstandane, men det viser seg at n 1 gjev eit betre mål.

Definisjon 10 (Utvalsstandardavvik) Kvadratroten av variansen,

s = 1 n 1 i=1n(xi x̄)2, (6) 

vert kalt for standardavviket.

Kast terningane fem gongar (n = 5), slik at du får fem observasjonar av X og fem av Y .

Oppgåve 4.8 Rekna ut variansen og standardavviket for utvalet x1,x2,,x5.

Oppgåve 4.9 (Socrative) Kva er variansen for y1,y2,,y5.

Oppgåve 4.10 (Socrative) Kva er standardavviket for y1,y2,,y5.

På same måte som me skil mellom utvals- og populasjonsgjennomsnitt, so skil me òg mellom utvals- og populasjonsvarians, og tilsvarande for standardavvik.

Merknad 3 Legg merke til at Y er ein lineær kombinasjon av X:

Y = 1 2X1 + 1 2X2

der X1 og X2 er to uavhengige variablar (to terningar) med same fordeling som X.

var(Y ) = 1 4var(X1) + 1 4var(X2) = 1 2var(X)

Merknad 4 Det fylgjer av merknaden over at

S.Dev.(Y ) = 1 2S.Dev.(X)

4.2.4. Om å definera ei sannsynsfordeling

Definer omgrepa

1.
Punktsannsyn
2.
Fordelingsfunksjon (kummulativ sannsynsfordeling)

4.2.5. Populasjon og utval

1.
Kvifor bruker me utval?
2.
Deskriptiv statistikk og statistisk inferens
3.
Ulike typar utval - urneforsøk
a)
med og utan tilbakeleggjing
b)
ordna og uordna