Statistikk og Simulering

Statistikk

Veke 10. Forsøksplanlegging

3.8. Veke 10. Forsøksplanlegging

Les 12 Frå Frisvold og Moe: Kapittel 13–14.

3.8.1. Onsdag (Førelesing)

Oversyn

1.
Statistisk forsøk
a)
Datasanking
b)
Simulering
2.
Stokastisk prosess
3.
Modell
a)
Domenekunnskap
b)
Modellar og teoriar frå design
c)
Design
4.
Ko-evolusjon av problem og design

Praktisk problemløysing Statistikk og simulering handlar om komplekse og samansette problem. De har ein del svært ulike problem i labøvingane. Oppgåvene på rekneøvingane er noko forenkla, med svært presise spørsmål, men òg her er der hovudvekt på tekstoppgåver der ein må skilja vesentleg informasjon frå uvesentleg. Desse oppgåvene etterliknar arbeidsoppgåver frå røynda, og det er viktig å ta dei alvorleg og prøva å forstå korleis ein ville tenkje om det faktisk var ein arbeidssituasjon i røynda.

Det som kjenneteiknar røynda er at ho er komplisert. Der er alltid for mange, både kjende og ukjende, faktorar til at eit enkelt fag eller ein einskild teori kan gje fullstendige svar. Kvart problem er individuelt, og ein må vurdera kva ein kan læra med kvar teori og med kvar disiplin.

Fem spørsmål er nyttige å ta med seg når ein ser på slike problem:

1.
Kva veit eg?
2.
Kva er eg beden om å finna ut?
3.
Kva teorigrunnlag kan eg bruka?
4.
Korleis kan problemet modellerast for å passa i teorien?
5.
Kva opplysingar manglar eg?

Det løner seg å teikna opp problemet og ordna opplysingane som trengst i teikninga. Ein kan teikna perspektivteikningar, flytdiagram (boksdiagram), kurver (t.d. PDF) eller anna. Gjerne fleire teikningar om det hjelper.

Modellar er eit vesentleg hjelpemiddel. Der er mange typar modellar.

1.
Sannsynsfordelingar.
2.
Rutenettet som modell for landskapet i predator/prey
3.
Lotka-Voltera-modellen (differentiallikningar) for populasjonsstorleikane i predator/prey
4.
Den lineære kongruensgeneratoren som modell for ein stokastisk prosess.

Ein (ingeniørfagleg) modell er ein selektiv, men presis og nøyaktig, representasjon av eit system, laga for støtta ein viss type analyse. Modellen er aldri fullstendig (det ville ha vore ein kopi og ikkje ein modell). Det som ikkje er relevant for analysen vert abstrahert bort. Modellen er presis og nøyaktig, slik at me kan rekna på han, men det er relativt; han skal vera nøyaktig nok for den planlagde analysen.

Mange modellar definerer samanhengar mellom aktuelle variablar, t.d. populasjonsstorleikar. Samanhengane kan vera probabilistiske eller deterministiske. Når me reknar på ein modell kan me seia at me simulerer systemet som er modellert.

Ein simulator, implementert som eit dataprogram, er eit døme på modell. Dataprogrammet er ein representasjon av røynda.

Når me bruker ein teori eller matematisk formel, ligg der alltid ein modell til grunn, implisitt eller eksplisitt. Det er ved å samanlikna modellen, og omstendeleg sjekka at modellen faktisk er ein høveleg representasjon av røynda, at me kan vita om formelene er relevant. Difor løner det seg å bruka tid på modelleringa, og forsikra seg om at ein skjøner modellen og systemet som vert modellert, samt samanhengen mellom dei, før ein reknar eller programmerer.

Praktiske problem krev breid kompetanse. Skal me studera eit økosystem, treng me både biologar/økologar som kjenner systemet i røynda, matematikarar/statistikarar som har eit repertoir av gode modelltypar og som veit kva det er råd å rekna på, samt datavitarar som veit kva som kan simulerast maskinelt og korleis.

Som regel veit ein ikkje alt ein burde ha visst. Ein må vera tydleg på føresetnadene som ein gjer, og gjerne simulera fleire alternativ med ulike føresetnader. Det ser ein t.d. når forskarane gjev klimaprediksjonar. Dei reknar gjerne eit pessimistisk og eit optimistisk alternativ, samt eit imellom.

Døme

1.
Prosjekt 2: Predator/Prey
2.
Prosjekt 4: Diffusjon Sjå avsnitt 8.1.

3.8.2. Fredag (rekneøving)

Oppgåve 3.80 (Gruppearbeid) Ein random walker flyttar seg på eit 1D raster. Startposisjonen kallar med x = 0. Lat den stokastiske variabelen X vera forflyttinga til partikkelen i løpet av eitt tidssteg. Sannsynsfordelinga for X er:

P(X = 1) = 0,2 (11)  P(X = 0) = 0,6 (12)  P(X = 1) = 0,2. (13) 

Lat Y t vera posisjonen etter i tidssteg.

1.
Rekn ut sannsynsfordelinga for posisjonen etter t = 2 tidssteg.
2.
Rekn ut sannsynsfordelinga for posisjonen etter t = 3 tidssteg.
3.
Bruk resultatet frå forrige oppgåve til å rekna ut standardavviket for posisjonen etter t = 3 tidssteg.

Legg merke til at posisjonen Y t etter t steg er summen av t identisk fordelte variablar (X), éin for kvart tidssteg.

4.
Rekn ut populasjonsstandardavviket for posisjonen etter eitt tidssteg.
5.
Rekn ut populasjonsstandardavviket for posisjonen etter 100 tidssteg.
6.
Bruk same metode for å finna standardavviket for posisjonen etter t = 3 tidssteg og samanlikna med resultatet frå spørsmål 3.

Oppgåve 3.81 (Ekstra) Frisvold og Moe: oppgåve 9.11 og 9.13.

Liknande eksamensoppgåver (Ekstra) Nokre av oppgåvene under vil vera vanskelege å gjera no, men gje meir meining når de har gjort prosjekt 4.

Oppgåve 3.82 (Frå eksamen våren 2015) Ein partikkel finst i eit firkanta, todimensjonalt raster med uendeleg utstrekking. For kvart tidssteg går partikkelen eitt steg til ein av dei fire naboposisjonane med fylgjande sannsynsfordeling:

40%
30% start 30%
0%

1.
Rekn ut sannsynsfordelingen for posisjonen etter to steg.
2.
Rekn ut sannsynsfordelingen for posisjonen etter tre steg.

Oppgåve 3.83 (Frå eksamen våren 2017) Ein random walker flyttar seg på eit 1D raster. Lat den stokastiske variabelen X være forflytningen til partikkelen i løpet av et tidssteg. Sannsynlighetsfordelingen for X er:

P(X = 2) = P(X = 2) = 0, 1 (14)  P(X = 1) = P(X = 1) = 0, 4. (15) 

1.
Rekn ut populasjonsstandardavviket for posisjonen etter eitt tidssteg.
2.
Rekn ut populasjonsstandardavviket for posisjonen etter 100 tidssteg.
3.
Me er interesserte i den eksakte sannsynsfordelinga for posisjonen til partikkelen etter 100 tidssteg. Forklar korleis me kan finna denne sannsynsfordelinga ved hjelp av ei datamaskin.
4.
Forklar korleis me kan generera eit utval med ti observasjonar av posisjonen etter 100 tidssteg.