Annonse
15:20 - 15. februar 2018

Norske leseprøver står til stryk

Testene norske skoler bruker for å kartlegge elevene, er ikke til å stole på, ifølge ny gjennomgang.

Annonse

«Tidlig innsats!» Slik lyder mantraet i deler av skoledebatten, hvor det med stadig høyere intensitet fremheves hvor viktig det er å oppdage tidlig hvilke barn som trenger ekstra hjelp. I dag er et stort antall ulike testverktøy i bruk i norsk skole. Men de fleste av prøvene som brukes for teste hvor godt barna ligger an i lesing, skriving og sosiale ferdigheter, er ikke til å stole på, ifølge en ny gjennomgang utført av forskere ved Universitetet i Oslo og publisert i Scandinavian Journal of Educational Research. Analysen er en del av doktorgradsarbeidet til forsker Anne Arnesen.

Monica Melby-Lervåg, professor i spesialpedagogikk ved Universitetet i Oslo med forskningsmetode som spesialområde, er medforfatter av analysen sammen med Terje Ogden (NUBU), og Johan Braeken (Center for Educational Measurement. Hun mener funnene viser at situasjonen er «alvorlig».

– Det er fordi disse verktøyene danner grunnlaget for viktige beslutninger, slik som hvem som skal få utredning, spesialundervisning og tilpasset opplæring. De brukes også i PP-tjenesten [Pedagogisk-psykologisk tjeneste], sier Monica Melby-Lervåg.

Den jevnt over lave kvaliteten er «svært bekymringsfull», heter det i forskningsartikkelen. I et innlegg på Læringsbloggen skriver Melby-Lervåg at det nå er viktig at «skoler, PP-tjenester og kommuner som har ansvar for kartlegging, tar informasjonen fra vår artikkel på alvor».

Målefeil. Så hva er egentlig feil med mange av verktøyene skolen bruker i dag? Enkelt sagt at prøvenes pålitelighet ikke er kvalitetssikret på skikkelig, vitenskapelig vis. Å lage gode prøver er nemlig vanskeligere enn man skulle tro, sier Melby-Lervåg, og det finnes et helt eget forskningsfelt – psykometrien – som handler om hvordan man unngår feil i slike målinger. De som har laget de norske verktøyene, har imidlertid i liten grad forholdt seg til dette fagområdet og de internasjonale standardene som er utarbeidet for kartleggingsverktøy.

Det er veldig alvorlige ting de påpeker.

Sten Ludvigsen

Studien går gjennom 21 ulike kartleggingsverktøy for sosiale ferdigheter og 36 forskjellige verktøy som måler lesing. Alle er i bruk i norsk skole. Nesten ingen av dem er tilstrekkelig kvalitetssikret, ifølge forskerne. Det største og mest gjennomgripende problemet, forklarer Melvåg-Lerby, er at de som har laget verktøyene, som regel ikke engang har vurdert testenes reliabilitet og validitet.

Reliabilitet dreier seg blant annet om hvor mange tilfeldige målefeil som statistisk sett oppstår. For eksempel kan det være for få spørsmål som skal dekke et stort kunnskapsområde, slik at et øyeblikks uoppmerksomhet hos barnet gir feil resultat om hva det faktisk behersker. Validitet handler her om i hvilken grad testene faktisk måler det de er ment å måle. Hvis hensikten er å måle leseforståelse, må man ha et verktøy som måler lesing, og ikke noe som i praksis måler annet, slik som barnets evne til å være oppmerksom.

– Betyr dette at testene er for dårlige?

– Det kan godt hende flere av disse kartleggingsverktøyene er av god kvalitet. Problemet er at det er umulig å vite, sier Melby-Lervåg.

Kun to verktøy hadde kvalitetssikret målingene på en måte som kunne betraktes som «god» etter en internasjonal standard for psykometri. Disse er den utbredte «Ordkjedetesten», som måler evnen til å avkode eller gjenkjenne ord, og «Språk 6-16», en muntlig test som brukes for å identifisere barn med språkvansker. For det desidert mest brukte verktøyet, kalt «Carlstens leseprøve» (utgitt av Cappelen Damm), forelå det ikke noen informasjon om validitet og reliabilitet. Det var også få av testene som hadde gode og representative sammenligningsgrupper. Og det var sjelden gjort undersøkelser av forekomsten av falske positive og negative funn.

– Mistenkte dere på forhånd at det sto så dårlig til?

– Jeg har selv jobbet med barn i skole og PPT og barnehage, og hadde vel personlig inntrykk av at verktøyene ikke var så gode som de burde være. Det har dessuten tidligere vært en tilsvarende debatt om evnetester som brukes blant annet i PP-tjenesten og barne- og ungdomspsykiatrien.

Må ikke slutte. Mange er skeptiske til at barna i småskolen skal telles og måles i stadig større grad. Men Melby-Lervåg er opptatt av at den svake kvaliteten på verktøyene absolutt ikke må bli et argument for å slutte med eller redusere kartleggingen av norske skolebarn.

– Tvert imot. Vi er helt nødt til å bruke slike verktøy for å kunne følge med på hvem som trenger ekstra oppfølging, sier Melby-Lervåg.

Det må lages bedre verktøy.

Monica Melby-Lervåg

Er det ikke likevel et paradoks at de som har ivret for kartlegging, tydeligvis ikke har vært interessert i å passe på at undersøkelsene holder mål? Til dette sier Melby-Lervåg at det i debatten dessverre har vært veldig lite snakk om kvaliteten på verktøyene.

– De som er imot, tenker på verktøyene som verdiløse, mens de som er for, har vært ukritiske.

Forfatterne av analysen skriver at målingenes kvalitet nå bør bli prioritert i både skoleforskning og utdanningspolitikk de kommende årene.

– Det må lages bedre verktøy. Jeg bebreider ikke dem som har utviklet de som allerede finnes, de har vært velmenende praktikere. Men nå har vi endelig fått mer kompetanse på målemetoder i Norge, blant annet et miljø for psykometri ved Universitetet i Oslo, og den må vi benytte, sier Melby-Lervåg.

Ludvigsen ønsker utvalg. – Det er veldig alvorlige ting de påpeker.

Det sier Sten Ludvigsen, som er professor ved Universitetet i Oslo og tidligere leder av Ludvigsen-utvalget, som gjennom to offentlige utredninger har lagt mye av grunnlaget for reformen av skolefagene som nå er i gang. Han har lest analysen av kartleggingsverktøyene og er ikke i tvil om at den er holdbar.

– Det gjorde inntrykk på meg at det er så mange forskjellige instrumenter i bruk, og at så mange av dem har lav kvalitet.

– Hvorfor er dette så alvorlig?

– Fordi resultatene åpner for at norske skoler feiltolker hva elever kan og hvordan de fungerer sosialt. Det er helt avgjørende at tester som kartlegger sosiale ferdigheter og språk, er holdbare. Vi bør helt klart gjøre bruk av tester som kan brukes som grunnlag for stimulering av elevenes utvikling.

– Hva bør gjøres?

– Jeg mener dette er så viktig at man burde følge opp artikkelen ved å nedsette et ekspertutvalg eller be et sterkt fagmiljø gi retning for videre arbeid med kartleggingstester. De kan ikke minst vurdere hvilken forskning som trengs for å gjøre kartleggingsverktøyene sikre. Det vi trenger, er en konsensusrapport fra fagmiljøene, sier Ludvigsen.

Kommunenes eget ansvar. Utdanningsdirektoratet svarer i en e-post at analysen gir «viktig informasjon» og at det er «uheldig dersom skoler og kommuner bruker kartleggingsverktøy som ikke er valide og reliable». Samtidig skriver de at det er «opp til kommunene selv» hvilke kartleggingsverktøy de vil bruke, med unntak av obligatoriske nasjonale prøver. Direktoratet melder at det per dags dato ikke er aktuelt å ta initiativ til en nasjonal godkjenningsordning eller å foreta seg noe annet for å sikre at skolene i fremtiden bruker verktøy som holder mål.

Sten Ludvigsen er ikke tilfreds med dette.

– Jeg ville foretrukket at de brukte faglige tester som var sertifisert og godkjent. Alle kommunene kan umulig ha kompetanse på dette, sier han

Selv om mange av testene leveres av kommersielle aktører, mener Melby-Lervåg det bør være Utdanningsdirektoratet og Kunnskapsdepartementets ansvar å sørge for at det eksisterer et sett kvalitetssikrede kartleggingsverktøy som er tilgjengelig for skolene.

– Skal vi i mellomtiden stole på verktøyene som allerede finnes?

– De må tolkes med større forsiktighet. Man må mer kritisk sammenholde resultatene med alt det man ellers vet om hvordan eleven klarer seg i skolen. Selv ville jeg også brukt to ulike tester og sjekket at det er samsvar mellom dem, sier professor Monica Melby-Lervåg.

 

SKOLENS VERKTØYKASSE

Slik vurderes kvalitetssikringen av skolenes kartleggingsverktøy:

Bra:

Ordkjedetesten og Språk 6–16 (begge språkprøver).

For dårlig:

Lesing: Carlstens leseprøve, DAMMs leseunivers, Diagnostisk lese- og skriveprøve, Kartleggeren, LOGOS, LUS, Leselos, KAOS, Arbeid med ord, ASKI Raski, Aston Index, Nasjonal leseprøve, Lesesenterets staveprøve, Ringeriksmaterialet, SOL, STAS, OL64/120; MiniSL1/SL2, IL-basis, God leseutvikling, Arbeidsprøven.

Sosiale ferdigheter: Elevens selvrapport, Elevenes sosiale kompetanse.

Lærings- og trivselsundersøkelsen: Elevundersøkelsen.

 

Utdanningsdirektoratet sier til Morgenbladet at de har teknisk dokumentasjon på at prøvene og undersøkelsene de har ansvar for – Elevundersøkelsen og Nasjonale leseprøver – er pålitelige.

Annonse