Statistikk og Simulering

16.–30. april

Labøving 27. april

12.6. Labøving 27. april

  12.6.1 Forundersøking
  12.6.2 Bootstrap
  12.6.3 Kontroll

Tema i dag er Bootstrap, som gjennomgått måndag. Me skal arbeida med eit syntetisk datasett.

12.6.1. Forundersøking

Oppgåve 12.8 Last ned bootstrapgen.m, som du skal bruka til å laga syntetiske datasett.

Oppgåve 12.9 Test funksjonen

1   X = bootstrapgen(200) Dette dannar eit utval X med n = 200 observasjonar.

Oppgåve 12.10 Lag eit histogram over datasettet X. Bruk minst 20 søyler for å få eit godt inntrykk av fordelinga.

Oppgåve 12.11 Prøv å tippa på gjennomsnittet x̄ og utvalsstandardavviket s på augamål frå histogrammet. Kva verdiar vil du venta å finna når du startar å rekna?

Oppgåve 12.12 Bruk Matlab til å rekna ut gjennomsnittet x̄ og utvalsstandardavviket s for X.

12.6.2. Bootstrap

Me hugsar at utvalsgjennomsnittet x̄ er eit estimat for forventingsverdien μ, men x̄ er ein observasjon av estimatoren X̄, ein stokastisk variabel, og estimatet er dermed aldri eksakt. Standardfeilen er eit mål for uvisset, og me kan estimera standardfeilen som sn. der S er den stokastiske variabelen for utvalsgjennomsnittet.

Oppgåve 12.13 Estimer standardfeilen for gjennomsnittet X̄ i datasettet X over.

Lat oss no sjå på standardavviket σ for den underliggjande stokastiske variabelen X som me har observert. Me har allereie estimert σ ved hjelp av utvalsstandardavviket S, men kva er standardfeilen åt S?

Her skal me bruka bootstrap, sjå notatane frå førelesinga måndag.

Oppgåve 12.14 Lag ein matlabfunksjon som tek eit utval X som argument, og returnerer eit bootstrap-utval med same storleik. Test funksjonen på datasettet X som du har brukt over. Finn s og x̄ for bootstrap-utvalet. Ser tala fornuftige ut?

Oppgåve 12.15 Skriv ein funksjon som genererer m bootstrap-utval frå det same datasettet X og reknar ut utvalsstandardavviket s kvar gong. Returverdien skal vera ein matrise med m observasjonar av s.

Oppgåve 12.16 Test funksjonen frå forrige oppgåve på datasettet X, og lag eit datasett S med m observasjonar av s. Vel m sjølv. Plott S i eit histogram.

Oppgåve 12.17 Rekn ut gjennomsnitt og utvalsstandardavviket for datasettet S.

12.6.3. Kontroll

Får å validera bootstrap som metode, skal me no gjenta oppgåvene 12.1512.17 med ein liten variasjon. I staden for å generera m bootstrap-utval skal me generera «ekte» utval ved hjelp av bootstrapgen.m.

Oppgåve 12.18 Skriv ein funksjon som genererer m utval vha. bootstrapgen.m, kvart med n = 200 observasjonar. Rekn ut utvalsstandardavviket s for kvart utval og returner ein matrise med m observasjonar av s.

Oppgåve 12.19 Test funksjonen frå forrige oppgåve og lag eit datasett S2 med m observasjonar av s. Bruk same m som i oppgåve 12.16. Plott S2 i eit histogram.

Oppgåve 12.20 Rekn ut gjennomsnitt og utvalsstandardavviket for datasettet S2.