Vuonna 1943 neurotieteiljä Warren McCulloch ja loogikko Walter Pitts julkaisivat paperin nimeltä “A Logical Calculus of the Ideas Immanent in Nervous Activity”. Tämä paperi oli läpimurto, johon käytännössä kaikki nykyaikainen tekoälytutkimus perustuu.
McCulloch ja Pitts tarkastelivat hermoston toimintaa verkostomaisena kokonaisuutena. Heidän neronleimauksensa oli oivaltaa, että hermoston toimintaa voidaan mallintaa lauselogiikan avulla. Vaikka hermoston toimintaan liittyy kaikenlaisia monimutkaisia rakenteita, viime kädessä sen toiminta perustuu siihen, reagoiko yksittäinen hermosolu sen saamaan ärsykkeeseen – eli mitkä hermosolut ovat kulloinkin aktiivisina ja mitkä eivät. Hermosolut voidaan siis kuvata lauselogiikan totuusarvoilla tosi (aktiivinen) ja epätosi (ei-aktiivinen).
McCullochin ja Pittsin järjestelmän pohjalta kehittyi nykyaikainen tekoälytutkimuksen neuroverkkoteoria, jonka nojalla voidaan rakentaa äärimmäisen yksityiskohtaisia verkostorakenteita. Niissä voi olla tätä nykyä jopa miljardeja parametreja. Näiden mallien avulla on mahdollista ohjata itseohjautuvaa autoa, tunnistaa kuvia – tai jopa käydä sujuvaa keskustelua tekoälyn kanssa kuten nykyisillä kielimalliboteilla ChatGPT:stä Geminiin.
Aivotutkimus ja tekoälytutkimus kohtaavat etenkin siinä vaiheessa, kun aivojen mallinnuksesta johdetaan ajatus siitä, että aivot toimivat jonkinlaisena prosessointilaitteena kuten tietokone. Aivoja on verrattu itse asiassa historiallisesti aina kulloinkin käsillä olleeseen huipputeknologiaan. Antiikissa aivot olivat kuin kirja, johon taltioidaan tietoa. Teollisen vallankumouksen kynnyksellä aivoja ajateltiin koneina. 1900-luvun loppupuolella yleistyi ajatus siitä, että aivot ovat ennemminkin kuin tietokone muistipaikkoineen ja mikroprosessoreineen. Viimeisin teknologiametafora taitaa olla, että aivot ovat kuin internet verkottuneine datapakettivirtoineen.
Ihmisen aivoissa on nykytietämyksen nojalla noin 86 miljardia hermosolua. Niitä yhdistää noin 100 000 miljardia synapsia. Lisäksi vartalon läpi kulkee miljoonia aisteihin ja lihasten liikuttamiseen liittyviä hermosäikeitä. Laskennalliset aivotoiminnan mallit olettavat yleensä, että joko neuroni käsitttelee yhden bitin informaatiota (se on joko aktiivinen tai ei ole), tai sitten synapsi toimiin näin. Tällöin koko hermoston informaationkäsittelykapasiteetti olisi jossain miljardien tai jopa tuhansien miljardien bittien kertaluokassa kullakin ajanhetkellä.
Sen enempää neuroni kuin synapsikaan eivät kuitenkaan ole näin yksinkertaisia. Todellisuudessa synapsin toimintaan vaikuttaa monimuotoinen valikoima erilaisia välittäjäaineita, jotka voivat joko estää tai kiihdyttää signaalin kulkua. Hermosolun toimintaan vaikuttavat puolestaan sen kytkökset toisiin hermosoluihin, sen sisäinen solurakenne, sen aksoneita ja dendriittejä suojaavan myeliini-rasvakerrosten toiminta sekä monet muut tekijät, kuten vaikkapa aivojen glia-solujen toiminta, jota tunnemme yhä tavattoman vähän. On mahdollista, kuten eräässä Stanford-tutkimuksessa esitettiin, että parempi vertauskuva esimerkiksi synapsin toiminnalle on kokonainen mikroprosessori muisteineen kuin yhden bitin kerrallaan prosessoiva transistori.
Laskennallisten mallien puolustajat toteavat tässä usein, että se, että nykymallit yksinkertaistavat liikaa ei ole ongelma, koska ennen pitkää voimme kehittää mallin, joka mallintaa laskennallisesti vaikkapa sitten synapsin toiminnan laskien jokaiselle välittäjäaineelle oman painokertoimen tai mallintamalla sen vielä tarkemmin kuten esimerkiksi miljoonia transistoreja sisältävän mikroprosessorin.
Ongelmana tässä ei ole mallintamisen tarkkuus – vaan se, että koko prosessointimetafora on päälaellaan.
Emeritusprofessori Richard Dawkins kirjoitti: ”Kun ihminen heittää pallon korkealle ilmaan ja ottaa sen taas kiinni, hän käyttäytyy kuin hän olisi ratkaissut joukon differentiaaliyhtälöitä ennustaessaan pallon lentorataa. Hän ei ehkä tiedä eikä välitä, mikä differentiaaliyhtälö on, mutta se ei vaikuta hänen taitoihinsa pallon kanssa. Jollakin alitajunnan tasolla tapahtuu jotain matemaattisia laskutoimituksia toiminnallisesti vastaavaa.”
Tosi asiassa aivoissa ei kuitenkaan tapahdu laskentaa. Kokeellisissa tutkimuksissa on käynyt ilmi, että ihmiset ovat melko kehnoja arvioimaan mihin lentävä esine laskeutuu. Todellisuudessa esimerkiksi pesäpalloilijoiden ja amerikkalaisen jalkapallon pelaajien toimintaa valottaneet tutkimukset osoittavat, että pallon kiinniottaminen perustuu hyvin yksinkertaiseen periaatteeseen: pelaaja pyrkii pitämäään pallon näkökentässään suurin piirtein samassa kulmassa. Tätä ilmiötä psykologi Gerd Gigerenzer nimittää katseheuristiikaksi: “Kiinnitä katseesi palloon, ala juosta ja korjaa juoksunopeuttasi niin, että katseen kulma suhteessa palloon pysyy vakiona.”
Eräässä tutkimuksessa tutkittiin silmän kohdistumisen ja ääneen lukemisen välistä viivettä. Perinteisessä prosessointinäkemyksessä prosessi etenee lineaarisesti. Silmä kiinnityy sanaan, visuaalinen informaatio analysoidaan ja väliteetään kielelliseen analyysiin, josta puolestaan haetaan sanastosta sopiva sana, tämä toimitetaan sitten motoriselle järjestelmälle, joka lopulta liikuttaa äänihuulia, kieltä ja suuta tuottaen sanan ääneen lausumisen. Jos aivot tosiaan prosessoivat visuaalista ja kielellistä informaatiota näin, tämä on helppo todeta selvittämällä, kuinka kauan kestää siitä, kun katsot sanaa ja sanot sen ääneen.
Ilmiötä tarkastelevassa kokeessa mitattiin aikajännettä siitä, kun koehenkilö katsoo sanaa siihen kun hän sanoi sen ääneen. Keskimäärin koehenkilöiltä kesti noin 400 millisekuntia (eli 0.4 sekuntia) sanoa nähty sana ääneen. Huomioiden, että hermoston keskimääräinen reaktioviive yksinkertaiseen visuaaliseen ärsykkeeseen on noin 200 millisekuntia ja yhden synapsin aktivoituminen kestää keskimäärin yhden millisekunnin, koko yllä mainittu prosessointi tapahtuisi vain noin kahden sadan synapsin voimin. Lisäksi osa koehenkilöistä lausui sanan ääneen nopeimmillaan 200 millisekunnin päästä – siis ajan, joka kuluu pelkästään siihen, että aivot ovat päässeet käsiksi ensimmäiseen “näköärsykkeeseen”. Jotta yllä kuvattu prosessointimalli voisi olla ylipäätään mahdollinen, pitäisi fiksaatio-lausunta -aikavälin olla ennemminkin sekunteja. Jotain muuta on siis meneillään.
Joukkuelajeissa on käynyt ilmi, etteivät vaikkapa jalkapalloilijat tai jääkiekkoilijat odota joukkuetovereiltaan näkö- tai kuuloärsykettä syöttäessään tai kiirehtiessään vastaanottamaan syöttöä. Pelaajat ennakoivat toistensa toimintaa. Syöttöä odottava pelaaja saattaa juosta jalkapallokentällä hyvän matkaa eteenpäin ilman ensimmäistäkään ärsykettä syöttävältä pelaajalta.
Tämä perustuu siihen, että joukkueen harjoittelun kautta syntyy systeemisiä ajatusprosesseja, jotka eivät rajoitu vain pelaajien aivotoimintaan, vaan aivojen hermoverkkojen rakenne on virittynyt harjoittelun kautta ennakoimaan sitä, miten joukkuetoverit eri tyyppisissä tilanteissa saattavat toimia. Silloin kun tällainen systeeminen harjaantuminen on riittävää, joukkue saattaa kokea ilmiön, jonka tutkija Keith Sawyer nimesi ryhmä-flow’ksi: pelaajien ei tarvitse enää tietoisesti enää edes ajatella pelaamista, vaan he toimivat ryhmänä niin kuin yksilö toimii kokiessaan flow-tilan uppoutuneisuuden.
Aivojen pääfunktio ei ole ottaa sisään informaatiota, prosessoida sitä ja jauhaa siitä erilaisia toimintakehotteita. Aivojen ja hermoston evoluution kautta tuottama pääfunktio on ennakoida toimintaa. Aivot eivät ole tietokone, vaan biologinen ja jatkuvasti muovautuva osa ihmisen laajempaa psyykkistä järjestelmää, johon kuuluvat myös hermosto ja muu vartalo, sosiaaliset suhteet ja fyysinen ympäristö.

Kiitos. Tämä oli todella mielenkiintoinen.
”Lisäksi osa koehenkilöistä lausui sanan ääneen nopeimmillaan 200 millisekunnin päästä – siis ajan, joka kuluu pelkästään siihen, että aivot ovat päässeet käsiksi ensimmäiseen “näköärsykkeeseen”. Jotta yllä kuvattu prosessointimalli voisi olla ylipäätään mahdollinen, pitäisi fiksaatio-lausunta -aikavälin olla ennemminkin sekunteja. Jotain muuta on siis meneillään.”
Kiinnostavaa! Leksikaalisen semantiikan tutkimuksessa tiedetään, että lekseemin/sanan syvärakenne on monikerroksine, ja sanojen merkityksen tulkinta voi vaihdella eri henkilöillä. On myös monimerkityksisiä sanoja kuten ’kuusi’. Lausuttaessa nähty sana ääneen ei mennä välttämättä lainkaan sanan merkitysopilliseen sisältöön. Näin tapahtuu väistämättä silloin, kun lausutaan esim. vieraskielinen sana, jonka merkitys on täysin tuntematon. Onko siis kyseessä mekaaninen foneettinen suoritus, pelkkä lausuminen eikä varsinainen sanan ’lukeminen’.
Sitä voisi – aikanäkökulmaa ajatellen – verrata siihen, miten tekoäly tunnistaa tokeneita, eli koneellisesti luettavia LLM:n formalisoituja yksiköitä.
Todella kiinnostava teksti, tarjosi ravintoa ajattelulle.