Forfatter

Fredrik Helland-Riise
Monica Martinussen

Utgave

Årgang 2017, utgave 2 nr 2
DOI: 10.21337/0055
ISSN: 1893-9910
Publisert: 18.12.2017

Vedlegg

Søkestrategi Ravens matriser oppdateringssøk
Søkestrategi Ravens matriser

Måleegenskaper ved de norske versjonene av Ravens matriser [Standard Progressive Matrices (SPM)/Coloured Progressive Matrices (CPM)]

Ravens matriser består av flere varianter der Coloured Progressive Matrices (CPM) (5–11 år) og Standard Progressive Matrices (SPM) (8–65 år) kan anvendes for barn og unge. Testen ble utviklet av John C. Raven, og SPM ble først publisert i 1938, mens CPM-versjonen ble publisert i 1998. Testen er ment å måle non-verbal intelligens eller evne til abstrakt resonnering ved at barnet skal finne systemet bak hvordan ulike geometriske figurer er satt opp. Begge versjonene av Raven har oppgaver med økende vanskelighetsgrad organisert i ulike sett. Testen skåres ved at antallet riktige svar summeres opp til en totalskår. Dette kan konverteres til prosentiler basert på normtabellene i manualene. Testen administreres vanligvis uten tidsbegrensning for barn og unge, og det stilles krav om at de som skal anvende testen er sertifisert for å anvende evnetester eller er psykologer. Pearson Assessment har rettighetene til salg og distribusjon av testen i Skandinavia og internasjonalt (pearsonassessment.no).

Til sammen ble 15 norske og 24 svenske/danske artikler inkludert i oppsummeringen. Ingen av disse var rene psykometriske studier, men stort sett studier der Raven ble brukt for å måle intelligens enten som utkommevariabel, kontrollvariabel eller for å beskrive gruppen. Litt under halvparten av studiene var basert på kliniske grupper (for eksempel autisme, epilepsi eller døve), men de øvrige studiene var basert på skolebarn fra 5–16 (SPM) og 5–7 (CPM) år.

Ingen av studiene hadde gjennomført adekvate studier av testens reliabilitet og det er heller ikke gjennomført normstudier basert på norske eller svensk/danske utvalg. Resultatene fra studiene støtter begrepsvaliditeten til testen som et godt mål på abstrakt resonneringsevne ved generelt høye korrelasjoner med andre kognitive tester.

Konklusjon. Det er god dokumentasjon på testens begrepsvaliditet, men det mangler studier av testens reliabilitet basert på norske eller svenske/danske utvalg. Det er heller ikke normstudier fra Skandinavia, noe som er problematisk ved klinisk bruk av testen.

English abstract

Helland-Riise, F. & Martinussen, M. (2017). Psychometric properties of the Norwegian version of Ravens matriser [Standard Progressive Matrices (SPM)/Coloured Progressive Matrices (CPM)]. PsykTestBarn, 2:2.

There are different versions of Ravens Matrices including Coloured Progressive Matrices (CPM) (5–11 years) and Standard Progressive Matrices (SPM) (8–65 years) which may be used for children and adolescents. The test was first developed by John C. Raven, and the SPM was published in 1938, and the CPM in 1998. The test is assumed to measure non-verbal intelligence or abstract reasoning ability with items consisting of geometrical figures where the task is to figure out the system underlying the figures. Both versions of Raven have items with increasing difficulty organized in different sets. The test is scored in terms of the number of correct answers, which is summed to a total score. The total score can be converted to percentiles based on norm tables included in the manuals. The test is usually administered without time constraints for children and adolescents, and the test user is required to be a psychologist or a certified user of ability tests. Pearson Assessment holds the copyright to Ravens Matrices, and is responsible for sale and distribution of the test in Scandinavia and internationally (pearsonassessment.no).

A total of 15 Norwegian and 24 Swedish/Danish publications were included in the review. None of these were psychometric studies, but mainly studies where Raven had been used to measure intelligence either as an outcome variable, control variable or to describe the group. Approximately half of the included studies were based on clinical groups (e.g., autism, epilepsy or deaf), while the remaining studies included school children of 5–16 (SPM) and 5–7 (CPM) years.

None of the included studies had performed adequate studies of test reliability and there were no norm studies based on Norwegian or Swedish/Danish samples. The findings support the construct validity of the test as a good measure of abstract reasoning ability by in general high correlations with other cognitive tests.

There is solid evidence supporting the construct validity of the test, but studies examining test reliability using Scandinavian samples are lacking. There are no norm studies from Scandinavia, which is problematic for clinical and applied test use.

html Full tekst (HTML)     PDFRaven publisert

Innledning

Ravens matriser består av tre ulike tester som alle måler abstrakt resonneringsevne, og refereres ofte til som mål på nonverbale evner, flytende intelligens, eller rett og slett bare intelligens. Ravens matriser finnes i tre versjoner, Coloured Progressive Matrices (CPM), Standard Progressive Matrices (SPM) og Advanced Progressive Matrices (APM). CPM er beregnet på yngre barn. Ravens matriser finnes i tre versjoner, Coloured Progressive Matrices (CPM), Standard Progressive Matrices (SPM) og Advanced Progressive Matrices (APM). CPM er beregnet på yngre barn.Testene anvendes klinisk, til forskning og for seleksjon av personell. De tre utgavene er Coloured Progressive Matrices (CPM), Standard Progressive Matrices (SPM) og Advanced Progressive Matrices (APM). De tre versjonene har delvis overlappende aldersintervall for sine målgrupper men i hovedsak er CPM ment for yngre barn (5–11 år), SPM for barn, ungdommer og voksne (8–65 år), mens APM er best egnet for voksne med generelt høyt evnenivå og omtales derfor ikke videre i denne artikkelen. Pearson Assessment har rettighetene til salg og distribusjon av testen i Skandinavia og internasjonalt (pearsonassessment.no). Pearson stiller krav til hvilken kompetanse kjøpere av de ulike testene må ha, og for Raven er det stilt krav om at man må være autorisert psykolog eller sertifisert bruker av evnetester. Hver versjon består av manual på engelsk, testhefte med oppgaver og svarark. Den første versjonen var SPM som ble publisert i 1938 ved Oxford Psychologists Press Ltd. (Raven, 1941) og betegnes som «classic», mens de nye versjonene ble publisert i 1998 (Raven, 2008b). I tillegg til originalversjonene finnes det parallelle utgaver som kan anvendes ved behov, for eksempel om det er behov for å teste et barn flere ganger. SPM foreligger også en i plussversjon som innebærer at det er lagt til flere og vanskeligere oppgaver. De internasjonale normene som foreligger på de nye versjonene er i hovedsak fra et britisk utvalg. De ulike Raven-testene kan administreres individuelt eller i gruppe, og er såkalte «power-tester» med testmessig tidskontroll, noe som vil si at man primært er interessert i resonneringsferdigheten (ikke responstiden), og tidsbegrensningen varierer avhengig av hvilke og hvor mange sett som administreres. Testen er tradisjonelt antatt som mindre kulturbundet ved at den er non-verbal (se for eksempel Cattell, 1940). Det er 36 oppgaver i både CPM og grunnversjonen av SPM (60 i pluss-versjonen) med ulik vanskelighetsgrad. Hver oppgave består av flere ruter (for eksempel 3X3) med mønster der én av rutene mangler. Oppgaven består i å finne den manglende ruten blant flere alternativer (6-8 alternativer) ved å finne det logiske systemet bak mønsteret i de aktuelle rutene. Testen antas å måle evne til å sammenligne og resonnere ved hjelp av analogier og systematisere spatiale persepsjoner. Vanskelighetsgrad er antatt å avhenge av for eksempel antall elementer, antall regler, reglenes kompleksitet og den perseptuelle organiseringen av oppgavene (Primi, 2001), samt personenes evne til målregulering (Carpenter, Just, & Shell, 1990). Antallet riktig besvarte oppgaver summeres til en totalskår som ved klinisk bruk kan konverteres til evnenivå (i form av prosentiler) via normtabellene i de respektive manualene.

Raven er brukt i store deler av verden siden den første testen ble publisert i 1938 (Raven, 2000b). Den er også mye brukt i Norge, og ifølge Norsk Psykologforening var testen i 2012 den nest mest brukte kognitive funksjonstesten blant norske psykologer med en brukerandel på hele 38 %, kun slått i popularitet av WAIS-III (Vaskinn & Egeland, 2012). I en studie av skolepsykologer fra 64 land var SPM brukt i 40 % av landene og kun WISC var brukt av flere (80 %) (Oakland, Douglas, & Kane, 2016).

Ulike former for reliabilitet for britiske barn er beregnet som for eksempel split-half reliabilitet på 0,97 for CPM (alder 4-12) og 0,94 for SPM (alder 7-18), samt for SPM test-retest reliabilitet som har blitt rapportert å være på 0,83 (alder 8-18), og for CPM parallell-form-reliabilitet på 0,87 (alder 5-11) (Raven, 2008a, 2008b). Lavest reliabilitet er funnet når testene har vært brukt på svært unge barn. Begrepsvaliditeten er undersøkt gjennom ulike studier der Raven har blitt brukt som kovariat i analyser, hvor andre konstrukter ofte har vært det primære studieobjektet (f.eks. med WISC: r med SPM = 0,70-0,80; r med CPM = 0,50-0,87; Raven, 2008a; Raven, 2008b), og prediktiv validitet ved å undersøke sammenhengen mellom testen og prestasjoner i for eksempel skole og arbeidsliv (se f.eks. Raven, 2000a for en drøftelse). Fra internasjonal forskning er det en allmenn oppfatning at Raven måler sentrale deler av intelligensbegrepet (Marshalek, Lohman, & Snow, 1983). Fordelen med testen er at den er ansett som relativt kulturfri, kan anvendes uavhengig av språk, samt på mange ulike grupper som barn med ulike utviklingsforstyrrelser som autismespekter forstyrrelser, eller barn med spesielle behov, for eksempel døve. Den egner seg ikke som mål på generell intelligens der barnet ikke er i stand til abstrakt resonnering ved hjelp av figurer.

 

Metode

Bibliotekar Brynhildur Axelsdottir ved Regionsenteret for barne og unges psykiske helse, Helseregion Øst og Sør, søkte etter dokumentasjon på testens psykometriske egenskaper i databasene, PsycINFO, Medline, Embase, Cochrane Library, Oria (BIBSYS), Norart, SveMed+, PubMed, CRIStin.no, NORA.no, Forskningsdatabasen.dk og Swepub. Søkedato: 25.02.2016 og oppdateringssøk: 21.03.2017. Søkestrategiene er tilgjengelige på http://www.psyktestbarn.no/CMS/ptb.nsf/pages/ravens_matriser Der publikasjoner ikke var tilgjengelige, ble forfatterne forsøkt kontaktet. Da det allerede var mange publikasjoner på Raven, ble det ikke gjort ytterligere forsøk på å kontakte forfatterne.

Vi inkluderte alle publikasjoner av studier som har undersøkt og rapportert minst ett av følgende i skandinaviske utvalg:

  • normdata for testen
  • reliabilitet: indre konsistens, test-retest, interrater og endringssensitivitet
  • validitet: samsvar med liknende testskårer, samsvar med referansestandard eller annet kriterium, og/eller faktorstruktur

I tillegg, og kun for norske versjoner av Raven, inkluderte vi publikasjoner som rapporterte gjennomsnittsskårer og/eller forekomster for henholdsvis generelle populasjoner og kliniske undergrupper.

Begge forfatterne gikk gjennom sammendragene til alle identifiserte publikasjoner, uavhengig av hverandre, etter at dubletter var fjernet. Alle publikasjoner som kunne virke relevante ble bestilt inn i fulltekst, og prosessen over ble gjentatt for fulltekstrapportene.

Begge forfatterne vurderte normering, validitet og reliabilitet, uavhengig av hverandre, ved hjelp av en tilpasset versjon av Test review form and notes for reviewers (European Federation of Pscyhologists’ Association - EFPA, 2013).

 

Resultater

Litteratursøk

Det norske søket inneholdt totalt 42 artikkelsammendrag. To publikasjoner måtte reklassifiseres som svenske eller danske (hvorav en var duplikat og den andre kunne ekskluderes). Totalt 16 ble ekskludert etter en grovscreening av sammendrag og i noen tilfeller fulltekster. Veldig få studier hadde primærfokus på Raven, og grunnet et stort antall falske negativer (det sto ingenting i artikkelsammendraget om Raven, selv om artikkelen hadde relevant informasjon om testen), var ikke artikkelsammendraget tilstrekkelig for å ta eksklusjonsbeslutninger. Til sammen 15 publikasjoner ble etter grundigere lesning vurdert til å oppfylle inklusjonskriteriene. De mest vanlige eksklusjonsgrunnene var manglende norsk utvalg (K = 7), at målgruppen ikke besto hovedsakelig av barn eller unge (K = 4), ikke rapporterte psykometriske data fra Raven (K = 6), samt øvrige grunner (K = 7). En klausulert masteroppgave lot seg ikke lokalisere.

For det svenske/danske søket ble det funnet til sammen 276 treff. Av disse ble 111 vurdert som aktuelle basert på sammendraget og vurdert i fulltekst. En gjennomgang av de 111 artiklene i fulltekst resulterte i tilsammen 22 artikler som oppfylte inklusjonskriteriene. Den mest vanlige grunnen for eksklusjon var at artikkelen ikke rapporterte psykometriske data (K = 36), deretter at målgruppen ikke var barn og unge (K = 20), manglende skandinavisk utvalg (K = 13) samt øvrige grunner (K = 18) (for eksempel at Raven ikke var brukt, ingen empiriske data eller konferansesammendrag). I tillegg ble ytterligere to artikler (Gustafsson, 1984; Gustafsson & Wolff, 2015) lokalisert via henvisninger i en av de inkluderte artiklene. Dette resulterte sammenlagt i 24 artikler basert på 22 ulike studier. En doktoravhandling lot seg ikke lokalisere.

 

 

Tabell 1. Inkluderte norske studier

Referanse

Design

Populasjon

N

Mål

Rapporterte egenskaper, verdier

Bosnes (2005)

Tverrsnitt

Blandet klinisk utvalg

41

SPM (1982/1988/2000)

Middelverdi og spredning, validitet

Elbro and Buch-Iversen (2013)

RCT

6. klassinger, normale barn

236

SPM (1958)

Middelverdi og spredning

Fasting and Lyster (2005)

Kvasieksperiment

Barn med selvrapporterte lese- og staveproblemer.

52

SPM (1983)

Middelverdi og spredning

Frostad (1995)

Tverrsnitt

Hørselshemmede barn

268

SPM (1992)

Middelverdier og spredning, normtabeller, kumulative distribusjoner, testdiagnostikk, deskriptiv statistikk.

Green, Tønnessen, Tambs, Thoresen, and Bjertness (2009)

Kvasieksperiment

10.klassinger, normale barn vs grader av lese og skrivevansker

308

SPM (2003)

Middelverdi og spredning, begrepsvaliditet

Høie, et al. (2005)

Tverrsnitt/eksperiment

Barn med epilepsi

309

CPM (1965)

Forekomster i klinisk gruppe

Høie, Sommerfelt, et al. (2006) a

Tverrsnitt/eksperiment

Barn med epilepsi

250

CPM (1965)

Begrepsvaliditet (r med psykososiale vansker)

Høie, Mykletun, Waaler, Skeidsvoll, and Sommerfelt (2006) a

Tverrsnitt/eksperiment

Barn med epilepsi

241

CPM (1965)

Begrepsvaliditet (regressjon med eksekutive funksjoner)

Høie, et al (2008) a

Tverrsnitt/eksperiment

Barn med epilepsi

269

CPM (1965)

Begrepsvaliditet (r med WISC-R)

Landmark and Grinde (1962)

Tverrsnitt

Normale barn

44

SPM set A, AB, B & revised order (1956)

Middelverdi og spredning, begrepsvaliditet, split half reliabilitet

Lervag, Braten, and Hulme (2009) b

Longitudinell

Normale barn, 1. – 2. klasse

228

CPM (1990)

Middelverdi og spredning, begrepsvaliditet, Cronbachs alpha

Lervag and Hulme (2010) b

Longitudinell

Normale barn, 1. – 2. klasse

228

CPM (1990)

Middelverdi og spredning, validitet

Lyster, Lervåg, and Hulme (2016)

Kontrollgruppe fra eksperiment.

Normale barn, 1. klasse

30

SPM (1988)

Middelverdi og spredning

Solheim (2011)

Tverrsnitt

Normale barn, 5. klasse

217

SPM (1958)

Middelverdi og spredning, begrepsvaliditet

Söderqvist, Nutley, Ottersen, Grill, and Klingberg (2012)

Kvasieksperiment

Barn med IQ <70

41

CPM (1998)

Middelverdi og spredning

Note. SPM = standard progressive matrices. CPM = coloured progressive matrices. a Baserer seg delvis på samme utvalg som Høie, et al. (2005). Metoder og utvalg kan variere mht. tilgjengelige måleinstrumenter, nye deltagere etc., derfor kan tallene variere noe mellom studiene. b Baserer seg på samme utvalg som Lervag, et al. (2009).

 

 

 

Tabell 2. Inkluderte svenske og danske studier

 

Referanse

Design

Populasjon

N

Mål

Rapporterte egenskaper, verdier

Andersson (2007)

Tverrsnitt

Skolebarn, Sverige (M = 10 år, SD = 0,76 år)

69

SPM (1976), sett B, C & D

Begrepsvaliditet (r med andre kunnskaps-og kognitive tester)

Andersson (2008)

Tverrsnitt

Skolebarn, Sverige, (M = 10,3 år, SD = 0,58 år)

141

SPM (1976), sett B, C & D

Begrepsvaliditet (r med andre kunnskaps- og kognitive tester)

Nutley, Darki, and Klingberg (2014)

Longitudinell

Barn, by i Sverige, 6–25 år (M = 12,25 år), tilfeldig utvalgt

339

SPM (2003), sett A til D (6 år), A-E for resten av utvalget

Begrepsvaliditet (forskjell mellom to grupper)

Brynskov, et al. (2017)

Tverrsnitt

To grupper danske barn (ASD, M = 66 mnd, SD = 7,2 mnd) (Vanlige barn, M = 74,1 mnd, SD = 6,7 mnd)

 

CPM (Raven, 2008a)(2008)

Begrepsvaliditet (forskjell mellom grupper)

Bylund, et al. (2000)

Longitudinell

Premature barn og kontrollgruppe, Sverige (9 år)

142

SPM (1983)

Begrepsvaliditet (forskjell mellom grupper)

Dahlin (2011)

Tverrsnitt

Skolebarn m/lærevansker, Sverige (9–12 år)

57

CPM (ingen dato)

Begrepsvaliditet (r med andre kunnskaps-og kognitive tester)

Dumontheil and Klingberg (2012)

Longitudinell

Barn og unge (6–16år) fra by i Sverige

246

SPM (1998), sett A-D (yngste) og A-E (eldste)

Begrepsvaliditet (sammenheng med matematiske ferdigheter)

Fischbein, Guttman, and Nathan (1999)

Tvillingstudie

 

Barn i Stockholm (12 år)

73

SPM (ingen dato), sett A-E

Begrepsvaliditet (r med andre kognitive tester)

Forssman, Eninger, Tillman, Rodriguez, and Bohlin (2012)

Tverrsnitt

Ungdommer, tilfeldig utvalg, 3 byer i Sverige (M = 14,8 år, SD = 0,89)

120

SPM (1977), sett A-E

Begrepsvaliditet (r med andre kognitive tester)

Gellert and Elbro (2013)

Tverrsnitt/longit.

Skolebarn fra København (M = 9,6år, SD = 0,3 år)

99

CPM, sett A, AB og B (1990)

Begrepsvaliditet (r med andre kognitive tester)

Gustafson, Samuelsson, Johansson, and Wallmann (2013)

Tverrsnitt

Skolebarn, Sverige med og uten lesevansker (4.klasse)

72

CPM, sett A, AB og B (1990)

Begrepsvaliditet (r med andre kognitive tester). + Alpha er rapportert (0.72)

Gustafsson (1984)

Tverrsnitt

Skolebarn Sverige (12 år)

1224

SPM (ingen dato)

Begrepsvaliditet (faktoranalyse)

Gustafsson and Wolff (2015)

Tverrsnitt

Barn, Sverige (4 år)

364

CPM, sett A, AB og B (1990)

Begrepsvaliditet (faktoranalyse)

Nordberg, Dahlgren Sandberg, and Miniscalco (2015)

Tverrsnitt

Barn med CP og talevansker (M = 11 år, SD = 1,4 år)

15

CPM, sett A, AB og B (1990)

Begrepsvaliditet (r med andre kognitive tester) samt sml med normer

Nordberg, Miniscalco, and Lohmander (2014)

Tverrsnitt

Barn med CP (M = 11,2 år)

19

CPM, sett A, AB og B (1990)

Begrepsvaliditet (r med andre kognitive tester) samt sml med normer

Olsson, Ostergren, and Traff (2016)

Tverrsnitt

Barn, Sverige med og uten dyskalkuli

72

SPM (1976), sett B, C & D

Cronbachs alpha rapportert (0,80)

Samuelsson, et al. (2006)

Longitudinell

Premature barn med lav fødselsvekt + kontroll (9 år)

142

SPM (1983)

Begrepsvaliditet (gruppeforskjeller)

Skagerlund and Traff (2016b)

Tverrsnitt

Skolebarn, Sverige (9,7 år) inkl gruppe med spesialundervisning

133

SPM (1976), sett B, C & D

Begrepsvaliditet (r med andre kognitive tester)

Skagerlund and Traff (2016a)

Tverrsnitt

Skolebarn med og uten dyskalkuli, Sverige (M = 11,75år)

77

SPM (1976), sett B, C & D

Cronbachs alpha rapportert (0,87)

Svensson and Jacobson (2006)

Longitudinell

Skolebarn, Sverige med og uten lesevansker (8–9 år)

70

CPM (1965). Ravens SPM (1995), sett B, C & D

Begrepsvaliditet (forskjeller mellom grupper)

Thirus, Starbrink, and Jansson (2016)

Tverrsnitt

Videregående elever, Stockholm (M = 17,3, SD = 0,67)

21

SPM, sett A-E

 

Begrepsvaliditet (forskjeller mellom grupper)

Träff (2013)

Tverrsnitt

Skolebarn, Sverige (M = 142 mnd, SD = 8,58)

134

SPM (1995), sett B, C & D

Begrepsvaliditet (r med andre kognitive tester)

Vejleskov (1968)

Tverrsnitt

Skolebarn, Danmark (10–11år)

628

SPM (1958), sett B, C, D & E

Item-analyse

Wolff and Gustafsson (2015)

Tverrsnitt

Barn, Sverige (4 år)

364

CPM, sett A, AB & B (1990).

Begrepsvaliditet (faktoranalyse)

Note. SPM = standard progressive matrices. CPM = coloured progressive matrices. ASD = autism spectrum disorders. a Rapporterer samme resultater for deltakerne ved 9 år som Bylund, 2000. b Basert på data fra samme studie som Gustafsson og Wolff (2015). Studiene varierer mht hvilken informasjon som er oppgitt i forhold til utvalget og bruk av Raven, og dermed kan innholdet i tabellen variere noe mellom studiene.

 

 

Normer og middelverdier

Det ble ikke identifisert noen normstudier på norske barn fra normalpopulasjonen. Det ble imidlertid funnet fem studier som oppga middelverdier og spredning for normale barn fra utvalgte skoler i eller rundt norske storbyer for SPM, samt en for CPM.

Internasjonale normer (hovedsaklig britiske; Raven, 2008a; Raven, 2008b) for forventet gjennomsnittlig skår for aldersspennet er supplert i tabellen (Tabell 3 og 4), for å gi et sammenligningsgrunnlag, med tanke på å belyse om normene kan anvendes i Norge. I fem av seks studier av SMP avviker gjennomsnittet i den norske populasjonen fra den internasjonale normen, hvorav en eldre studie ligger under, og fire nyere ligger over. For CPM ligger den internasjonale normen innenfor utvalgets konfidensintervall ved begge observasjonstidspunktene. Selv om denne studien har et solid utvalg, er det imidlertid vanskelig å konkludere med at de internasjonale normene kan anvendes da studien er begrenset til første- og andreklassinger.

 

 

Tabell 3. Middelverdier (M) og standardavvik (SD) for ulike normgrupper – SPM

 

Referanse

Utvalg/gruppe

Alder

 

N

Skala

Forventet skåre

jf. britiske normer

M

SD

Elbro and Buch-Iversen (2013)

6. klassinger, pretest kontrollgruppe

10–-11

85

38,9

10,2

> 32-33

 

6. klassinger, pretest eksperimentgruppe

10–11

151

39,5

8,91

> 21-33

Green, et al. (2009)

10. klassinger, normale barn

15–16

233

45,4

8,6

> 35-36

Landmark and Grinde (1962)

Normale barn fra Bærum, 8-9 år (2. klasse 1962, 5 skoler, loddtrekkning, representativ for bærum)

8–9

44

22,1

5,9

< 26-31

Lyster, et al. (2016)

Kontrollgruppe, 1. klasse

5–6

30

21,9

5,7

= 22-23 a

Solheim (2011)

5. klassinger, nasjonalt representativt, middelklasse

9–10

217

40,6

8,0

> 30-32

Note. Normene som brukes som sammenligningsgrunnlag er hentet fra en britiske standardiseringsstudie publisert i manualen til plussversjonen av SPM (Raven, 2008b), og er den forventede skåren for en person som ligger på medianen (50. prosentil) i sin aldersgruppe.(Raven, 2008b). > betyr at normen ligger under studiens konfidensintervall, = betyr innenfor og < betyr over. a Normer ikke tilgjengelig for aldersspenn, de supplerte er for 7-åringer. Tallene er hentet fra artiklene, så formateringen kan variere noe. Originaltall som ikke hadde én desimal har for uniformitetens skyld enten blitt avrundet eller fått en ekstra null.

 

 

Tabell 4. Middelverdier (M) og standardavvik (SD) for ulike normgrupper – CPM

 

Referanse

Utvalg/gruppe

Alder

N

Skala

Forventet skåre

jf. britiske normer

M

SD

 

Lervag, et al. (2009)

Normale barn, 1. klassinger

5–6

228

21,1

6,1

= 18-21

 

Normale barn, 2. klassinger et år etter

6–7

228

25,7

5,4

= 22-27

Note. Normene som brukes som sammenligningsgrunnlag er hentet fra en britiske standardiseringsstudie publisert i manualen til plussversjonen av SPM (Raven, 2008b), og er den forventede skåren for en person som ligger på medianen (50. prosentil) i sin aldersgruppe. (Raven, 2008a). > betyr at normen ligger under studiens konfidensintervall, = betyr innenfor og < betyr over. Originaltall som ikke hadde én desimal har for uniformitetens skyld enten blitt avrundet eller fått en ekstra null.

 

Middelverdier og/eller forekomster i kliniske undergrupper

For SPM ble det funnet én studie med rapporterte normer og kvantiler for populasjonen av døve barn (Frostad, 1995), samt to som brukte den som kovariat eller til å beskrive utvalget med et urelatert forskningsspørsmål. Disse oppga estimater for 18 forskjellige (relativt små) utvalg, delt på alder eller diagnose. Tabell 5 gir en oversikt over middelverdier og spredning i de kliniske undergruppene for SPM.

Frostad (1995) presenterer en mer utfyllende analyse av SPM for relativt små utvalg av døve i ulike aldre, blant annet en tabell med fordeling av skårer på delkomponenter for ulike evnenivåer, hvor deres utvalg er sammenlignet med amerikanske og tyske normer for normale barn. I tillegg presenteres korrelasjoner mellom oppgave-rangering og aldersgruppe, tabell med kumulativ distribusjon(sammenlignet med amerikanske normdata), og parvise sammenligninger av forskjeller mellom aldersgruppenes gjennomsnitt. Konklusjoner som kan trekkes fra Frostad (1995) er at SPM fungerer relativt godt for døve, med noen avvik fra de internasjonale normene for normale barn.

Internasjonale normer (hovedsaklig britiske; Raven, 2008a; Raven, 2008b) for forventet gjennomsnittlig skår for det aktuelle aldersspennet er supplert i tabellene (5 og 6) for å gi et sammenligningsgrunnlag. De fleste studiene i denne kunnskapsoppsummeringen har relativt lav n, noe som gjør konfidensintervallene (95 %) store. I alt åtte av 19 studier kunne vise til gjennomsnitt som avviker fra den internasjonale normen, hvorav to ligger under og seks ligger over.

Det ble funnet en studie som brukte CPM. Studien til Söderqvist, et al. (2012) omhandler barn i et betydelig aldersspekter, med en gruppe som mottok et kognitivt treningsprogram samt en kontrollgruppe. Utvalget er lite og har et bredt spekter av diagnoser, med svært få deltakere for hver diagnose, med det til felles at de skal være klassifisert med en intellektuell utviklingsforstyrrelse [intellectual disability], dvs. en intelligenskvotient (IQ) på under 70.

En sammenligning av så varierte og spesielle utvalg med en forventet medianskår må tas med en klype salt. Hvorvidt skårene burde ligge innenfor normalen avhenger også av om hva som forventes for den enkelte gruppen. Det faktum at det er lite entydighet i forholdet til medianen for sammenlignbare utvalg taler ikke til fordel for de britiske normenes brukbarhet. Studiene har imidlertid forholdsvis lav statistisk styrke, og betydningen av funnene bør derfor ikke overdrives.

Det ble funnet en studie som brukte CPM. Studien til Söderqvist, et al. (2012) omhandler barn i et betydelig aldersspekter, med en gruppe som mottok et kognitivt treningsprogram samt en kontrollgruppe. Utvalget er lite og har et bredt spekter av diagnoser, med svært få deltakere for hver diagnose, med det til felles at de skal være klassifisert med en intellektuell utviklingsforstyrrelse [intellectual disability], dvs. en intelligenskvotient (IQ) på under 70.

En sammenligning av så varierte og spesielle utvalg med en forventet medianskår må tas med en klype salt. Hvorvidt skårene burde ligge innenfor normalen avhenger også av om hva som forventes for den enkelte gruppen. Det faktum at det er lite entydighet i forholdet til medianen for sammenlignbare utvalg taler ikke til fordel for de britiske normenes brukbarhet. Studiene har imidlertid forholdsvis lav statistisk styrke, og betydningen av funnene bør derfor ikke overdrives.

 

Tabell 5. Middelverdier (M) og standardavvik (SD) for ulike undergrupper - SPM

Referanse

Utvalg/gruppe

Alder

 

n

Skala

Forventet skåre jf. britiske normer

M

SD

Fasting and Lyster (2005)

5. klassinger, "struggling readers and spellers", eksperimentgruppe pretest

9–10

4

35,4

16,9

= 30-32

 

6. klassinger, "struggling readers and spellers", eksperimentgruppe pretest

10–11

16

23,1

14,2

< 32-33

 

7. klassinger, "struggling readers and spellers", eksperimentgruppe pretest

11–12

6

25,2

11,6

= 32-33

 

5. klassinger, "struggling readers and spellers", kontrollgruppe pretest

9–10

4

29,6

16,9

= 30-32

 

6. klassinger , "struggling readers and spellers", kontrollgruppe pretest

10–-11

15

24,8

14,3

= 32-33

 

7. klassinger, "struggling readers and spellers", kontrollgruppe pretest

11–12

7

18

6,6

< 32-33

Frostad (1995)

Hørselshemmede elever

7

11

25,8

9,9

= 22-23

 

Hørselshemmede elever

8

24

27,9

6,8

= 26-27

 

Hørselshemmede elever

9

33

27,2

10,8

= 30-31

 

Hørselshemmede elever

10

22

33,3

12,9

= 32

 

Hørselshemmede elever

11

24

39,4

9,9

> 32-33

 

Hørselshemmede elever

12

31

37,3

8,6

> 33

 

Hørselshemmede elever

13

43

39,4

7,9

> 34-35

 

Hørselshemmede elever

14

30

41,6

9,6

> 34-35

 

Hørselshemmede elever

15

50

43,7

9,8

> 35-36

Green, et al. (2009)

10. klassinger med lese og skrivevansker (selvrapportert) type mild

15–-16

43

45,0

6,7

> 35-36

 

10. klassinger med lese- og skrivevansker (selvrapportert) type moderat

15-–16

28

40,1

11,5

= 35-36

 

10. klassinger med lese- og skrivevansker (selvrapportert) type alvorlig (severe)

15–16

4

42,5

8,5

= 35-36

Note. Normene som brukes som sammenligningsgrunnlag er hentet fra en britiske standardiseringsstudie publisert i manualen til plussversjonen av SPM (Raven, 2008b), og er den forventede skåren for en person som ligger på medianen (50. prosentil) i sin aldersgruppe. > betyr at normen ligger under studiens konfidensintervall, = betyr innenfor og < betyr over. Originaltall som ikke hadde én desimal har for uniformitetens skyld enten blitt avrundet eller fått en ekstra null.

 

 

 

Tabell 6. Middelverdier (M) og standardavvik (SD) for ulike undergrupper - CPM

Referanse

Utvalg/gruppe

Alder

 

n

Skala

Forventet skåre

jf. britiske normer

M

SD

Söderqvist, et al. (2012)

Intellectual disability (IQ under 70), blandede diagnoser: ADHD, Downs, epilepsi eller andre grupper. Pretest gruppe 1

6–12

22

9,0

3,9

< 20-33

 

Intellectual disability (IQ under 70) blandede diagnoser: ADHD, Downs, epilepsi eller andre grupper. Pretest gruppe 2

6–-12

19

8,0

4,2

< 20-33

Note. Normene som brukes som sammenligningsgrunnlag er hentet fra en britiske standardiseringsstudie publisert i manualen til plussversjonen av SPM (Raven, 2008b), og er den forventede skåren for en person som ligger på medianen (50. prosentil) i sin aldersgruppe. > betyr at normen ligger under studiens konfidensintervall, = betyr innenfor og < betyr over. Tallene er hentet fra artiklene, så antall desimaler kan variere noe. Originaltall som ikke hadde én desimal har for uniformitetens skyld enten blitt avrundet eller fått en ekstra null.

 

Reliabilitet

I det norske søket fantes det to artikler som rapporterte reliabilitetsmål, begge på testens interne konsistens. Landmark and Grinde (1962) rapporterte for SPM en split half-reliabilitet på 0,89. Lervag, et al. (2009) rapporterte for CPM alpha-koeffisienter (Cronbach's alpha; Cronbach, 1951) på 0,80 samt 0,85 når barna ble testet ett år senere. I de aller fleste artiklene basert på svenske/danske utvalg var ikke reliabilitet undersøkt for det aktuelle utvalget, men man hadde henvist til reliabilitet oppgitt i manualen. Tre av studiene hadde rapportert Cronbachs alpha for testen, med 0,80 (Olsson, et al., 2016) og 0,87 (Skagerlund & Traff, 2016a) for SPM, og 0,72 for CPM (Gustafson, et al., 2013). Disse verdiene betraktes som adekvate til gode i forhold til EFPA-kriteriene (EFPA, 2013). 

Alpha-koeffisienter er kun ett begrenset mål på den nedre grensen for dette aspektet ved reliabilitet (mål som for eksempel test-retest og parallell-form adresserer andre viktige aspekter ved reliabilitet, men disse ble ikke rapportert i noen av studiene), og er bl.a. avhengig av en sentral antagelse om at oppgavene er likeverdige (Schmitt, 1996; Sijtsma, 2009). I en test som Raven, hvor oppgavene varierer i vanskelighetsgrad eller hvor det finnes tidspress, vil reliabiliteten for eksempel kunne variere sterkt avhengig av hvor på skalaen en person eller oppgave befinner seg samt hvor mange som befinner seg på et gitt punkt på skalaen og hvor godt de differensierer, og dette fanges ikke opp i enkeltstatistikker som alpha-koeffisienten. Her er latent variabel-modellering nødvendig (item response theory - se f.eks. Lord, Novic, & Birnbaum, 2008).

 

Validitet

Validitet - Norske studier

Fra det norske søket var det fire studier som belyste validiteten til SPM, samt to som belyste CPM, og da i hovedsak begrepsvaliditet.

En vanlig måte å undersøke begrepsvaliditeten til en test er å identifisere dens plass i det nomologiske nettverket (Cronbach, 1955), det vil si hvordan den relaterer seg til andre konstrukter som den teoretisk sett skal konvergere med eller divergere fra. Det ble ikke identifisert noen dedikerte valideringsstudier av Ravens matriser på den norske populasjonen, men noen artikler rapporterte relasjoner til andre konstrukter. Raven skal være en av de mest sentrale målene på flytende intelligens (Gf – eng: fluid intelligence) (Marshalek, et al., 1983). Dette betyr at mål på Gf burde være nærmere i testens nomologiske nettverk enn for eksempel mål på krystallisert intelligens (Gc – eng: crystallized intelligence) (McGrew, 2005), og relativt fjernt fra konstrukter som ikke har mye med intelligens å gjøre. Siden vi vet at Gf lader høyt på den overordnede g­-faktoren (Kvist & Gustafsson, 2008), burde vi også anta at Raven i det minste vil korrelere noe med de fleste evnetester uavhengig av domene.

Her ser resultatene for SPM (Tabell 7) ut til å korrespondere godt med disse antakelsene for den norske populasjonen, ved at den er tettere relatert til visse intelligenstester enn til språkkonstrukter, mens holdningskonstrukter er relativt urelaterte til Raven. Ut ifra klassiske tommelfingerregler (se f.eks. Cohen, Cohen, West, & Aiken, 2003) kan vi si at SPM stort sett korrelerer middels (r = 0,30) til relativt høyt (r = 0,50) med andre intelligenstester for barn fra normalutvalg, og korrelerer tilsynelatende også høyt med tilsvarende matrisebaserte tester på et blandet klinisk utvalg. Det vises til lave (r = 0,10) til middels høye korrelasjoner med språklige konstrukter, samt en screeningtest for dysleksi. Holdningsbaserte konstrukter som reading self-efficacy og task value ser ut til å korrelere svært svakt med testen. Bosnes (2005) rapporterte også en korrelasjon på 0,81 mellom SPM og subtesten matriser fra WAIS III, men det er uklart om dette resultatet er fra den aktuelle studien. For ordens skyld, tilsvarer korrelasjonene som er observert her også noenlunde det som rapporteres for andre lands populasjoner (mer om internasjonale valideringsstudier kan bli funnet i kunnskapsoppsummeringen til John Rust og kolleger fra manualen til SPM; Raven, 2008b).

De norske studiene i kunnskapsoppsummeringen belyser det nomologiske nettverket til CPM (Tabell 8) viser en lav til middels relasjon mellom CPM og diverse språkkonstrukter (Lervag, et al., 2009) samt en noe sterkere relasjon mellom CPM og WISC-R (Høie, et al., 2008), og er her på linje med SPM. Studien til Lervåg og kollegaer viser også en forventet utvikling i CPM-skår ettersom barna blir eldre. Når det gjelder forskjeller mellom grupper, viser Høie, et al. (2005) med et stort utvalg av barn med epilepsi (N = 309; alder = 8-12 år), at disse er sterkt overrepresentert i de lavere prosentiler av CPM, mens kontrollgruppen er sterkt overrepresentert i de øvre prosentiler. I en studie på den samme populasjonen fant Høie, Sommerfelt, et al. (2006) en negativ korrelasjon mellom CPM og lærer/foreldrerapporterte psykososiale vansker (r = -0,37), stort sett urelatert til om barnet hadde epilepsi eller ikke. De fant også i en annen studie (Høie, Mykletun, et al., 2006) at omtrent 20 % av variasjonen i et mål på eksekutive funksjoner kunne forklares av skår på CPM, etter å ha kontrollert for depresjon og sosioøkonomisk status. De sistnevnte studiene belyser det nomologiske nettverket til intelligenskonstruktet ved å vise at testen måler aspekter ved sentrale kognitive funksjoner, samt at lav intelligens-skår kan være en psykososial risikofaktor.

 

Tabell 7. Korrelasjonskoeffisienter mellom SPM og andre mål (norske studier)

Forfatter

Utvalg

Alder(år)

N

Skala

r

 

Bosnes (2005)

Blandet klinisk utvalg: spesifikke lærevansker, lettere psykiske vansker, psykisk utviklingshemming, traumatisk hjerneskade, ADHD, alvorlig psykisk lidelse, autisme, blødning i sentralnervesystemet og demens.

9-–68

41

WASI matriser

0,69

 

Green, et al. (2009)

10-klassinger (15–16 år), normale barn

15-–16

233

Duvan Dyslexia Screening test

0,32

 

Landmark and Grinde (1962)

Normale barn, 8–-9 år (2. klasse 1962), 5 skoler hvor elever er valgt etter loddtrekkning, representativ for Bærum, SPM sets A, AB, B, revised order (Raven, 1956)

8–9

44

Stanford-Binet, norsk standard

0,75

 

 

 

 

 

Leiter international performance scale, Arthur adaption

0,69

 

 

 

 

 

Columbia Mental Maturity scale

0,42

 

 

 

 

 

Goodenough "draw-a-man"

0,53

 

Solheim (2011)

5. klassinger, nasjonalt representativt, middelklasse

9–10

217

Word reading ability

0,25

 

 

 

 

 

Listening comprehension

0,27

 

 

 

 

 

Reading self-efficacy

0,10

n.s.

 

 

 

 

Reading task value

-0,15

 

 

 

 

 

Multiple choice (MC) reading comprehension

0,48

 

 

 

 

 

Constructed response (CR) reading comprehension

0,39

 

Note. Samtlige r (unntatt en merket n.s.) var signifikante. r = bivariat korrelasjon.

 

 

 

Tabell 8. Korrelasjonskoeffisienter mellom CPM og andre mål (norske studier)

Forfatter

Utvalg

Alder(år)

N

Skala

r

 

Høie, et al. (2008)

Barn med epilepsi

6–12

269

WISC-R

0,63

 

Lervag, et al. (2009)

Normale barn, 1. klassinger

5–6

228

Phoneme awareness

0,43

 

For korrelasjoner med subtester, se Lervag and Hulme (2010)

 

 

 

Paired-associated learning (PAL)

0,36

 

 

 

 

 

Non-alphanumeric rapid automatized naming (RAN)

0,29

 

 

 

 

 

Verbal short-term memory

0,39

 

 

 

 

 

Letter knowledge

0,44

 

 

 

 

 

Verbal abilities

0,47

 

 

Normale barn, 2. klassinger, observasjon ett år etter

6–7

228

Phoneme awareness

0,47

 

 

 

 

 

Paired-associated learning (PAL)

0,34

 

 

 

 

 

Non-alphanumeric rapid automatized naming (RAN)

0,26

 

 

 

 

 

Verbal short-term memory

0,26

 

 

 

 

 

Letter knowledge

0,31

 

 

 

 

 

Verbal abilities

0,23

 

Note. Samtlige r var signifikante. r = bivariat korrelasjon.

 

 

Validitet – Svenske og Danske studier

Fra det svenske/danske søket var det til sammen 24 studier (Tabell 2) som i hovedsak belyste begrepsvaliditeten til testen på litt ulike måter. Disse kan grupperes avhengig av hvordan de kan sies å belyse begrepsvaliditeten enten i form av korrelasjoner med andre tester, forskjeller mellom grupper, intervensjoner for å øke intelligens eller faktoranalysestudier.

Korrelasjoner med andre tester.

Litt flere korrelasjonsstudier var gjennomført med SPM sammenlignet med CPM. Hovedfunn fra disse studiene i form av korrelasjoner er presentert i Tabell 9 og 10. De fleste studiene for Raven var gjennomført på skolebarn og viste generelt noe høyere korrelasjoner mellom Raven og tester som målte problemløsning, spatiale og matematiske evner sammenlignet med ulike verbale og språktester (Tabell 9). Dette er i tråd med antakelser om at Raven er et mål på non-verbal intelligens. I en prospektiv svensk studie ble det undersøkt om alder, SPM og arbeidshukommelse predikerte matematiske ferdigheter to år senere hos en gruppe tilfeldig valgte barn i alderen 6-16 år (N = 246) (Dumontheil & Klingberg, 2012). Alle prediktorene var signifikante (R2 = .58), inklusive Raven. De fleste studiene for CPM sammenlignet testen med mål på dekoding, hukommelse og ulike språktester der korrelasjonene varierte fra små og ikke signifikante til middels store (Tabell 10).