Kronikk

Hausser opp kjønnskamp i skolen

Debatten om kjønnsforskjeller i skolen er blitt en lettvint omgang med statistikk. Fremstillingen av forskningsresultatene er tendensiøs og på grensen til useriøs.

I NRK Brennpunkts program Kjønnskampen, slo Camilla Stoltenberg fast at guttene kommer dårligere ut enn jentene når lærerne setter standpunktkarakter. Stoltenbergutvalgets utredning av kjønnsforskjeller i skolen viser at gutter i en årrekke har fått svakere standpunktkarakterer enn jenter på 10. trinn. Kun i kroppsøving kommer guttene best ut. Utvalget viser til en doktorgradsavhandling av Ann Margareth Gustavsen, som konkluderte med at «høyere lærervurdering av jenters prestasjoner i norsk og matematikk i Norge henger sammen med at jenter har bedre sosiale ferdigheter». Gustavsens veileder, Thomas Nordahl, hevdet i Brennpunktprogrammet at karakterforskjellene «tyder på at gutter diskrimineres i vurderingsarbeidet i skolen».

Uttalelsene har ført til heftig debatt om det er forskningsmessig belegg for disse påstandene. Faktisk.no undersøkte dette, og konkluderte med at påstandene representerte en skjev og overdreven fremstilling av forskningsresultatene. Camilla Stoltenberg har i etterkant, sammen med kollegene Martin Flatø og Fartein Ask Torvik ved Folkehelseinstituttet, rettet betimelig kritikk mot NRK for å legge opp til en for enkel debatt rundt saken.

Det er riktig, som Nordahl hevder, at kjønnsforskjellene i Norge er mindre fremtredende på nasjonale prøver og skriftlige eksamener, enn i standpunktkarakterene. Nordahl gjør imidlertid et tvilsomt retorisk grep ved å terpe på at nasjonale prøver rettes anonymt, til forskjell fra standpunktkarakterene som lærerne selv fastsetter. At nasjonale prøver rettes anonymt medfører ikke nødvendigvis en kvalitetsforskjell i vurderingen.

Nordahl benytter gjennomsnittsoversikter for resultater på nasjonale prøver i lesing og regning, med standpunktkarakterer i norsk og matematikk som sammenligningsgrunnlag. Ser vi nærmere på Statistisk sentralbyrås oversikt (se tabell), så ser vi at de største kjønnsforskjellene i karakterer opptrer på standpunkt, med opp til 6,7 poengs skille mellom guttene og jentene (standardiserte poeng: gjennomsnitt=50 og standardavvik=10). På eksamen er forskjellene mindre enn ved standpunkt, med et skille på 6,1 poeng. Poengavstanden mellom kjønnene som opptrer i disse to vurderingsformene ligger imidlertid langt nærmere hverandre enn den som sees ved nasjonale prøver. Her er skillet mellom gutter og jenter størst innen lesing, med en forskjell på 3,2 poeng.

Ved å sammenligne nasjonale prøver i lesing og den skriftlige standpunktkarakteren i norsk hovedmål, skaper Nordahl et bilde av at det er svært store forskjeller på anonyme og ordinære vurderinger. Dette er å sammenligne epler og pærer.

Nasjonale prøver fungerer godt som målingsinstrument, men innholdet som måles og måletidspunktene, er forskjellig fra både eksamen og standpunkt. Nasjonale prøver i regning og lesing måler grunnleggende ferdigheter. Eksamen og standpunktkarakterer måler elevenes oppnåelse av kompetansemål i læreplanen. Lesing er ikke det samme som norsk, og regning er ikke det samme som skolefaget matematikk. Nasjonale prøver måler inngangskvaliteten til elevene ved starten av 5., 8. og 9. trinn, mens både eksamens- og standpunktkarakterene uttrykker elevenes kompetanse i fagene ved avslutningen av 10. trinn.

Stoltenbergutvalget og Nordahl støtter seg på Gustavsens doktorgradsavhandling, som hevder at kjønnsforskjellene skyldes at jenter profitterer på læreres vektlegging av sosiale ferdigheter når de setter standpunktkarakterer. Dette er en oppsiktsvekkende kausal slutning. Samvariasjonene tilskrives en årsak-virkning-sammenheng, uten at andre årsaker kan utelukkes. Å trekke konklusjonene enda lengre, slik Nordahl gjør ved å anklage lærerne for å diskriminere gutter, grenser til etisk uforsvarlig.

Vårt poeng er at Nordahl gjør en søkt sammenligning når nasjonale prøver trekkes inn. For det første unnlater han å presisere at kjønnsforskjellene er betraktelig mindre på eksamenskarakterer enn ved standpunkt, selv om skriftlige eksamener også vurderes anonymt. For det andre finnes det så langt ikke godt belegg for å hevde at de såkalte anonyme vurderingene er mer rettferdige enn karakterene lærerne setter ved standpunkt.

En mer redelig inngang ville være å sammenligne standpunkt med eksamen, som begge uttrykker oppnådd kompetanse i fagene, med utgangspunkt i samme elevgruppe. Sammenligner en kjønnsforskjellene ved eksamenskarakterer i norsk hovedmål med standpunkt, skiller det kun 0,6 poeng i vurderingene. Dette er en marginal forskjell som er uegnet til å forklare forskjeller mellom anonyme og lærersatte karakterer. Påstanden om at lærerne favoriserer jentene i karaktersettingen faller dermed på sin egen urimelighet.

Det finnes en rekke mulige forklaringer på kjønnsforskjellene i skolen, enn den Gustavsen og Nordahl presenterer. Mangelen på forbehold og nyansering av fremstillingen er antagelig det som er mest urovekkende. Et innlysende argument mot Nordahls favorisering av anonym vurdering, er at standpunktkarakterer gir lærere en unik mulighet til å se enkeltprestasjoner i lys av omstendigheter og miljøet rundt elevene, i tillegg til variasjoner som viser seg i prestasjonene til den enkelte over tid. I stedet for å anerkjenne at vurderingsgrunnlaget er annerledes i denne vurderingsformen, hausser Nordahl opp kjønnsdebatten ved å gi næring til mantraet om at lærere favoriserer jenter.

Hva er det som gjør at Nordahl tyr til en slik sammenligning? Som forsker er han nok innforstått med svakheten i slutningene som trekkes og temperaturen disse slutningene skaper i mediedebatten. Det er kanskje poenget å skape en slik debatt? Den egentlige debatten som Nordahl forsøker å skape handler kanskje heller ikke om anonymitet i vurderinger, men om grad av standardisering? Nasjonale prøver representerer et standardisert målingsverktøy, mens eksamen og standpunkt i større grad hviler på lærernes profesjonelle skjønnsvurderinger.

Nordahl har stor gjennomslagskraft i det offentlige rom. Derfor får hans fremstilling av kjønnsforskjeller betydning. Den bidrar til å undergrave tilliten til lærernes evne til å sette rettferdige karakterer. Dette kan få konsekvenser for utdanningspolitiske prioriteringer, og dermed også for elevene. Denne typen forskningsformidling kan på sikt også resultere i redusert tillit til skoleforskningen som fagfelt. Før vi tar kjønns- og karakterdebatten bør vi derfor stille krav til redelig formidling av forskning.

Mer fra Kronikk