Älykkyydestä mittaa

Kriittistä ajattelua ja psykometriikan tutkimusmetodeja voi harjoitella tutustumalla alan kirjallisuuteen

Törmäsin erään blogin kommenttien kautta vanhaan väitteeseen, että tietyt kansat ovat älykkäämpiä kuin toiset. Nettikommentit kannattaa usein jättää huomiotta, mutta Suomessa ajatusta maiden välisistä älykkyyseroista on tuonut esiin myös Tampereen yliopiston edesmennyt valtio-opin emeritusprofessori Tatu Vanhanen. Vuonna 2002 hän ja Richard Lynn julkaisivat kirjan ”IQ and the Wealth of Nations”, jossa tutkijat osoittivat mielestään todeksi aasialaisten ja länsimaisten kansojen älyllisen ylivertaisuuden eteläamerikkalaisiin ja afrikkalaisiin kansoihin nähden.

Tieteen tekemisen ja opettamisen lisäksi tutkijoilla on velvollisuus osallistua yhteiskunnalliseen keskusteluun. Asiantuntijoiden pitää ottaa kantaa ja auttaa esimerkiksi päättäjiä sellaisissa asioissa, joissa jälkimmäiset eivät ole itse asiantuntijoita. Mutta voiko kaikkeen tutkimustietoon ja kaikkien asiantuntijoiden pätevyyteen luottaa? Miten älykkyyden (potentiaalista) kulttuurista ja maantieteellistä vaihtelua pitäisi tutkia? Entä miten tutkimukset on todellisuudessa tehty?

1. Käsitteen määrittely

Psykologit ovat älyllisten toimintojen ja niiden yksilöllisen vaihtelun mittaamisen ammattilaisia. Psykologisissa tutkimuksissa on aina ensimmäiseksi määriteltävä tutkittava käsite. Mitä on älykkyys?

APA:n (American Psychological Association) perustaman älykkyystyöryhmän mukaan psykologian asiantuntijat eivät ole, monista yrityksistä huolimatta, päässeet yksimielisyyteen älykkyyden määrittelyssä (Neisser, 1996). Älykkyyteen näyttäisi liittyvän ainakin kyky tehokkaaseen ongelmanratkaisuun, kokemuksesta oppiminen ja ympäristöön sopeutuminen. Koska eri puolilla maailmaa ympäristöt, kokemukset ja ongelmat ovat erilaisia, on älykkyys väistämättä ainakin osin, jos ei kokonaan, kulttuurisesti vaihteleva käsite. Älykkyyden määrittely on siis vaikeaa, ja usein tyydytään ajattelemaan, että älykkyys on sitä, mitä älykkyystestit mittaavat. Tämä kehäpäätelmä ei kuitenkaan oleellisesti auta ymmärtämään älykkyyttä. Psykologit puhuvatkin mieluummin yksittäisistä älykkyyden osa-alueista, kuten kielellisestä päättelykyvystä. Näiden eri kykyjen laadullinen ja suhteellinen arviointi kertoo yksilöistä usein enemmän kuin kokonaisälykkyysosamäärän laskeminen. Jos älykkyysosamäärän kuitenkin haluaisi laskea, tarvittaisiin siihen tietoa suoriutumisesta useassa eri kykyä mittaavassa tehtävässä, ei vain yhdestä osa-alueesta.

Kansojen (tai ”rotujen”) älykkyyserojen tutkiminen pohjautuu myös ajatukseen älykkyydestä perinnöllisenä, biologisena ominaisuutena. Älykkyyden käsitteen määrittelemisen vaikeus näkyy tässäkin: Pohjois-Amerikassa älykkyys nähdään lähinnä sisäsyntyisenä ominaisuutena, mutta Japanissa (Lynnin ja Vanhasen listan älykkäimpiä kansakuntia) omia ponnisteluita ja satsaamista koulunkäyntiin pidetään keskeisinä älykkyyden lähteinä (Heine ym., 2001). Myös tutkimukset osoittavat, että ympäristö (ennen kaikkea koulunkäynti) vaikuttaa älykkyyteen – ainakin jos älykkyydeksi määritellään ne ominaisuudet, joita älykkyystestit mittaavat (esim. Neisser, 1996). ”Geneettisen” ja ”kulttuurisen” vastakkainasettelua tulisi kuitenkin välttää, sillä ne ovat aina vuorovaikutuksessa keskenään (Chasiotis, 2011). Esimerkiksi geneettisen perimän lisäksi myös sosiaalinen perimä vaikuttaa moniin yksilön ominaisuuksiin.

2. Miten käsitettä mitataan

Oletetaan, että olemme onnistuneet määrittelemään älykkyyden niin, että se tunnistetaan samaksi, koherentiksi ilmiöksi eri puolilla maailmaa. Seuraavaksi meidän on muutettava älykkyys mitattavaan muotoon. On valittava tehtäviä ja kysymyksiä, joiden ajattelemme mittaavan älykkyyttä. Valinnassa pitää kuitenkin huomioida, mikä on olennaista ja tarvittavaa tietoa tietyssä ympäristössä. Esimerkiksi samat yleistietoon liittyvät kysymykset (maantiede, historia, yhteiskunta tai urheilu) ovat toisissa maissa helpompia ja tärkeämpiä kuin toisissa.

Kuinka monta pelaajaa on rugby-joukkueessa? Mikä on Guinea-Bissaun virallinen kieli? Minkä maan pääkaupunki on Asunción? Mitä sanonta ”naapurin kana näyttää hanhelta” tarkoittaa?

Ainoa tapa taata jokaiseen ympäristöön ja kieleen mukautettujen kysymysten yhtäläinen vaikeustaso on adaptoida ja normittaa testi kyseiseen kulttuuriympäristöön. Tämä tarkoittaa, että ennen varsinaista tutkimusta on tehtävä yksi tai useampi tutkimus, joka keskittyy mittariin muokkaamiseen niin, että se on mahdollisimman käyttökelpoinen, pätevä (validi) ja luotettava (reliaabeli). Pelkkä testin kääntäminen ei riitä tai tee siitä soveltuvaa.

Osin näiden ongelmien takia kansainvälisissä tutkimuksissa nonverbaalisia eli ei-kielellisiä taitoja mittaavat tehtävät ovat yleisiä. Älykkyys onkin monessa tutkimuksessa supistunut tarkoittamaan visuaalista päättelykykyä ja muistitoimintoja. Myös internet on tulvillaan älykkyystestejä, joissa pitää valita tyhjään kohtaan sopiva pala tai jatkaa kuviota. Näitä tehtäviä on pidetty myös kulttuurista riippumattomina (”culture-free” tai ”culture fair”), koska niiden tekemiseen tarvitaan melko vähän kielellisiä toimintoja. Pitkittäistutkimukset kuitenkin osoittavat, että näissä tehtävissä menestyminen paranee sukupolvesta ja vuosikymmenestä toiseen (Greenfield, 1998, Heinen, 2002, mukaan). Näin nopeiden muutosten syy on ennen kaikkea ympäristössä ja kulttuurissa: koulutuksen lisääntymisessä, tietokonepeleissä, älypuhelimien ja tablettien käytössä ja muun visuaalisen informaation käsittelyssä. Muun muassa kokemukset (mahdollisuus käydä koulua) ja oma toiminta (harjoittelu) siis vaikuttavat älykkyystesteissä suoriutumiseen. Mikään älykkyystesti ei ole kulttuurista riippumaton.

3. Otanta

Kun tutkimusmenetelmät on valittu, validoitu ja normitettu, pitää valita tutkimukseen osallistuvat henkilöt. Tutkittaessa kokonaista kansakuntaa olisi parasta tehdä satunnainen otanta (osallistujien valinta sattumanvaraisesti), jotta otos vastaisi väestöä (populaatiota) pienoiskoossa. Edustavaan otokseen osallistujia siis tarvittaisiin ainakin kaikista eri ikäryhmistä, koulutustaustoista ja yhteiskuntaluokista. Psykologisessa tutkimuksessa ongelmaksi muodostuisi kuitenkin soveltuvien tehtävien valinta: lapset ja aikuiset eivät voi tehdä samoja älykkyystehtäviä ja kansalaiset puhuvat eri kieliä äidinkielenään (ks. kohta 4.). Kansainvälisessä tutkimuksessa satunnaisotanta aiheuttaisi myös maiden välisiä eroja vastaajien ominaisuuksien (ns. taustamuuttujien) jakautumisessa. Taustamuuttujat, esimerkiksi koulunkäynti, harrastukset, kaupunki- tai maaseutuympäristö ja työkokemus, ovat yhteydessä suoriutumiseen, ja näiden tekijöiden yleisyys vaihtelee maittain. Tämän takia erot älykkyyspistemäärissä eivät kerro välttämättä suoraan kulttuurieroista, vaan eroista näissä muissa tekijöissä. Väite ”norjalaiset ovat nigerialaisia älykkäämpiä” voisi tarkoittaa yhtälailla ”koulutetut ihmiset menestyvät (keskimäärin) kouluttamattomia paremmin koulumaisissa tehtävissä”.

Jos taas osallistujat valitaan vain hyvin rajatusta ympäristöstä, kuten yliopisto-opiskelijoista, on selvää, että tuloksia ei voida yleistää koskemaan koko maata. Yliopisto-opiskelijat eivät myöskään ole keskenään täysin vertailukelpoisia, koska eri maissa on erilaiset koulutusjärjestelmät. Suomessa opiskelijat valitaan aikaisemman koulumenestyksen ja pääsykokeiden avulla, joissakin maissa opiskelemaan pääsee ainoastaan rahalla.

Otoksen pitää olla mitattavan käsitteen ja tutkimuksen kannalta tarkoituksenmukainen, mutta myös tarpeeksi suuri edustaakseen perusjoukkoa riittävän hyvin ja jotta myöhemmin voidaan tehdä tarvittavat tilastoanalyysit (ks. kohta 5).

4. Aineistonkeruu

Tehtävätyypistä huolimatta arviointitilanteessa pitää käyttää kieltä, sillä ohjeet annetaan suullisesti tai kirjallisesti. Maailman mittakaavassa vain harva lapsi saa käydä koulua saati osallistua testaustilanteisiin äidinkielellään. Ohjeiden noudattaminen ja luonteva vuorovaikutus saattavat sujua parhaiten äidinkielellä, mutta yksilön vahvin testikieli voi olla se, jolla hän on opiskellut ja käynyt koulua. Jokaisen monikielisen lapsen, nuoren tai aikuisen kielellinen profiili on ainutlaatuinen, eikä ole olemassa mitään peukalosääntöjä siihen, mitä kieltä tulisi käyttää missäkin tilanteessa. Tilanne on arvioitava yksilöllisesti jokaisen kohdalla ja otettava huomioon tuloksia tulkitessa. Kieli liittyy myös toiminnanohjaukseen, abstraktien käsitteiden ymmärtämiseen ja visuaaliseen hahmottamiseen. Luku- ja kirjoitustaito ovat esimerkiksi yhteydessä merkkien havaitsemiseen, toistamiseen ja jatkamiseen. Nämä taidot kuitenkin kehittyvät eri tahtia riippuen kielestä ja kirjoitusjärjestelmästä.

Suomi on virallisesti kaksikielinen maa ja kaikki suomalaiset opiskelevat koulussa toista kotimaista kieltä. Miltä tuntuisi, jos suomenkielinen saisi älykkyystehtävän ohjeet ruotsiksi (tai päinvastoin)?
Välj prickade fyrkant som fattas. Välj motsvarande tärning till mönstret.

Kielen lisäksi tehtävien reiluuteen (”test fairness”) liittyy myös mahdollisuus aikaisempaan harjoitteluun. Tehtävät ovat tutumpia – ja siis reilumpia – niille, jotka ovat käyneet koulua ja osallistuneet aikaisemmin koulukokeisiin ja arviointitilanteisiin, pitäneet kynää kädessä ja pelanneet tietokonepelejä, tehneet palapelejä tai viettäneet kesäisin aikaa puuhakirjojen parissa. Mahdollisuus kaikkeen tähän vaihtelee ympäristöstä toiseen.

5. Tilastolliset analyysit

Kun aineisto on viimein kerätty useista kieli- ja kulttuuriryhmistä huomioiden edellä mainitut kohdat, pitää sen luotettavuus lopuksi varmentaa tilastollisten menetelmien avulla. Niillä on keskeinen rooli kulttuuripsykologisessa tutkimuksessa, mutta hyvätkään tilastomenetelmät eivät voi paikata ilmiön huonosta käsitteellistämisestä tai kääntämisestä aiheutuvia ongelmia. Usein käytetyt tilastosuureet, keskiarvot tai korrelaatiot eri kysymysten tai testien välillä, eivät takaa menetelmän luotettavuutta. Tutkimusasetelman, -kysymyksen ja -otoksen mukaan tarvitaan hienostuneempia ja vaativampia tilastometodeja (esim. faktorianalyysit, rakenneyhtälömallinnus ja Item Response Theory -menetelmät). Ilman oikein valittuja menetelmiä tulokset mitattavasta ominaisuudesta tai ryhmien välisistä eroista eivät ole luotettavia. Jos älykkyys on käsitteenä erilainen kahdessa tai useammassa ryhmässä, mutta sitä mitataan samoilla kysymyksillä ryhmästä huolimatta, on tulosten vertailu keskenään sama kuin jos vertailisimme omenoita ja appelsiineja – hedelmiä kyllä, mutta laadullisesti erilaisia.

Psykologisen testin toimivuutta eri ryhmissä voi tutkia esimerkiksi konfirmatorisen faktorianalyysin avulla

Psykologisen mittarin toimivuutta eri ryhmissä voi tutkia esimerkiksi konfirmatorisen faktorianalyysin avulla

Miten Lynnin ja Vanhasen tutkimuksessa (2002) on otettu huomioon ja vastattu näihin lukuisiin älykkyystutkimuksen haasteisiin?

Älykkyys on määritelty kehämäisesti (”älykkyyttä mitataan älykkyystesteillä”) eikä mittareiden soveltuvuutta eri ympäristöihin ole käsitelty. Eri maissa on käytetty yhteensä ainakin 15 eri mittaria, jotka ovat pääosin amerikkalaisia ja englantilaisia. Kaikkien ajatellaan ilmeisesti mittaavan kuitenkin samaa asiaa, koska mittareiden sisäistä luotettavuutta ja validiteettia ei ole tutkittu mitenkään. Muutama mittari korreloi keskenään, mitä tutkijat pitivät riittävänä takeena kansallisen ÄÖ:n luotettavuudesta. Älykkyysosamäärää käytetään synonyymina kapea-alaiselle visuaaliselle päättelykyvylle. Osassa tutkimuksissa älykkyysosamäärä on laskettu ainoastaan piirrostehtävän perusteella.

Tutkijat eivät kerro miten tutkimusosallistujat on valittu, mistä peruspopulaatiosta otannat on tehty tai kuinka hyvin otanta edustaa koko väestöä. Maasta riippuen osallistujat ovat joko lapsia, nuoria tai aikuisia. Menetelmien lisäksi myös otoskoot vaihtelevat maasta toiseen, mutta sanaa ”otos” käytetään tässä tutkimuksessa vain viitattaessa siihen, miten eri maat on valittu mukaan tutkimukseen.

Kirjassa ei ole mitään mainintaa siitä, millä kielellä aineistonkeruu on toteutettu missäkin maassa. Esimerkiksi Etelä-Afrikassa on 11 virallista kieltä, puhumattakaan epävirallisista. Tieto pitäisi etsiä alkuperäisistä lähteistä, mutta niiden löytäminen on hankalaa. Yksikin tutkimus on vuodelta 1929.

Toisaalta kaikki tämä on vähän saivartelua, koska 104:n maan kohdalla aineistoa ei ole kerätty ollenkaan – ei keneltäkään, millään mittarilla. Älykkyysosamäärä on arvioitu naapurimaiden keskiarvon mukaan.

Keskiarvojen laskemisen lisäksi tutkimuksen käytetyin tilastomenetelmä on vanha tuttu, korrelaatiokerroin. Muistin virkistykseksi: vaikka tilastot hukkumiskuolemista ja jäätelöiden menekistä korreloisivat keskenään, onko jompikumpi toisen syy? Entä ovatko ne hyviä sinilevän määrän mittareita, vaikka niiden välillä olisikin korrelaatio?

Niin, mitä tästä pitäisi ajatella? Tulee mieleen, että niin kuin ajattelemattomat heitot ja karkeat yleistykset kertovat usein enemmän sanojastaan kuin sanottavasta, tämä tutkimus kertoo enemmän sen tekijöiden heikosta tutkimusmetodien ja psykometriikan hallinnasta kuin sen tutkimuskohteiden älykkyydestä.

Lähteet & kirjallisuutta:

Chasiotis, A. (2011). An epigenetic view on culture: What evolutionary developmental psychology has to offer for cross-cultural psychology, teoksessa F. J. R. van de Vijver, A. Chasiotis, & S. M. Breugelmans (toim.), Fundamental questions in Cross-Cultural Psychology, (sivut 376–404). Cambridge: Cambridge University Press.

Greenfield, P.M. (1998). The cultural evolution of IQ. Teoksessa Neisser (toim.), The rising curve: Long term gains in IQ and related measures, (sivut 81–123). Washington, DC: American Psychological Association.

Heine, S.J. (2002). Cultural Psychology. New York: Norton.

Heine, S.J., Kitayama, S., Lehman, D.R., Takata, T., Ide, E., Leung, C., & Matsumoto, H. (2001). Divergent consequences of success and failure in Japan and North America: An investigation of self-improving motivations and malleable selves. Journal of Personality and Social Psychology, 81, 599–615.

Lynn, R. & Vanhanen, T. (2002). IQ and the Wealth of Nations. Greenwood Press.

Matsumoto, D. & Van de Vivjer, F.J.R. (toim.) (2011). Cross-Cultural Research Methods in Psychology. Cambridge University Press.

Neisser, U., Boodoo, G., Bouchard, T.J., A. Boykin, W., Brody, N., Ceci, S.J., Halpern, D.E., Loehlin, J.C., Perloff, R., Sternberg, R.J., & Urbina, S. (1996). Intelligence: The knowns and unknowns. The American Psychologist, 51(2), 77–101.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s