Aggregering
Å trekke ut ett samlet svar fra et helt datasett: filtrere (lage en ny liste med postene som oppfyller en betingelse), telle/summere/regne snitt (en akkumulator over ett felt), eller gruppere (telle hvor mange i hver kategori med en ordbok som teller). Dette er akkumulator-mønsteret fra algoritme-kapittelet brukt på et ekte datasett.
Vanlige feil
- Gruppering med én variabel per kategori Når du skal telle hvor mange i hver kategori (f.eks. hvor mange elever per karakter), lager du en egen variabel for hver verdi: antall_5 = 0, antall_4 = 0 … Det virker for tre-fire kategorier, men faller sammen så snart kategoriene er mange eller ukjente på forhånd. Riktig verktøy er én ordbok som teller per nøkkel.
Øv på dette
- Herme: tre slags spørsmål til et datasett
- Herme: filtrer ut de beste
- Utvide: gjennomsnitt med akkumulator
- Utvide: grupper med en ordbok
- Finn feilen: telleren som ikke teller alt
- Lage: snitt og antall fra et datasett
- Øving: grupper med en ordbok
- Sjekk: tre slags spørsmål
- Sjekk: hvorfor blir grupperingen feil?
- Begrepssjekk: Analyser datasettet
- Lage: filtrer, så aggreger
- Diskuter: hva skjuler et gjennomsnitt?