Syvätutkimus nostaa tekoälyn aivan uudelle tasolle

Noin vuosi sitten kirjoitin siitä, miten uusien tekoälyratkaisujen kehitys näytti hidastuneen. Moni akateeminen asiantuntija arvioikin tuolloin, että Piilaaksossa optimismia synnyttänyt skaalahypoteesi olisi tullut tiensä päähän. Näin näyttääkin tapahtuneen: pelkästään kielimallien kokoa ja harjoitusaineistoa kasvattamalla ei päästä enää juurikaan parempiin tuloksiin, kuten vaikkapa hiljattain julkaistu GPT4.5 -kielimalli osoittaa.

Kehitys ei kuitenkaan ole sittenkään hidastunut, päin vastoin.

Siinä, missä ydinmallien kohdalla skaalahyödyt eivät toki toistaiseksi tunnu kasvavan, on viime aikoina löytynyt aivan uudenlaisia tapoja hyödyntää nykyteknologiaa niin, että tulokset ovat ajoittain jälleen ällistyttäviä. Viime kuukausina onkin palattu takaisin pari vuotta sitten startanneesen ennennäkemättömään muutossykliin, jossa uusia läpimurtoja tapahtuu kuukausittain.

Vuodenvaihteen tienoilla julkaistut päättelykielimalllit – esimerkiksi OpenAI:n o1 ja o3, Googlen Gemini Thinking ja pörssejä ravistellut kiinalainen Deepseek – hyödyntävät jo aiemmin syötemuotoilussa avainasemaan nousseita päättelypuu- ja päättelyketjutekniikoita. Näissä malleissa päättely on rakennettu sisään pohjimmiltaan ihan normaaliin kielimalliin. Tuloksena on huomattavasti aiempaa luotettavampi tekoälybotti – jos kohta päättelymallitkin tekevät aika ajoin erikoisia virheitä arkipäättelyn puutteellisuudesta jekkusyötteisiin lankeamiseen.

Vielä järisyttävämpi murros liittyy kuitenkin alkuvuodesta läpilyöneisiin syvätutkimusmalleihin, kuten Gemini Deep Research ja Open AI:n kielimallien Deep Research -moodi. Kielimallin luotettavuus on aina haastavaa, jopa päättelymallien kohdalla, koska pohjimmiltaan kyse on aina sanajoukkojen tilastollisesta yleisyydestä. Jos kielimalli veikkaa yhdenkin sanan väärin, voi koko lopputuotos mennä plörinäksi.

Tutkimusmallit suitsevat tätä ongelmaa hyödyntämällä laajasti luotettavista lähteistä kokoon kaavittua tutkimusaineistoa itse syötteen laatimisessa. Sen sijaan, että ne arvaisivat vain sana kerrallaan tai edes hyödyntäisivät muutamaa verkkohakua, tutkimusmallien tekstintuottamisen taustalla vaikuttaa myös laaja aiempi tieteellinen aineisto, jonka avulla vimpain pystyy laatimaan aiheesta kuin aiheesta noin 20-sivuisen tutkimusraportin. Työ, johon aiemmin vaadittiin akateemisesti pitkälle kouluttautuneen tutkijan paneutumista kuukausikaupalla, on nyt mahdollista suorittaa noin puolessa tunnissa.

Tämäkään teknologia ei kuitenkaan korvaa ihmistä.

Ensinnäkin, edes tutkimusmalleilla ei kannata synnyttää julkaistavaksi tarkoitettavaa tekstiä, vaan niiden hyöty on ennen kaikkea saada nopeasti ylätason ymmärrys tutkittavasta asiasta. Erityisen arvokasta tämä on, koska mallien tuottama tutkimusraportti sisältää nyt suorat viitteet käytettyihin aineistoihin. Tutkimustekoäly ei siis keksi lähdeviitteitä kuten aiemmat, vaan viittaa systemaattisesti olemassa oleviin artikkeleihin.

Toiseksi, tutkimusmallin tuottaman raportin arviointi vaatii edelleen syvällistä substanssiosaamista. Koska tekoäly tekee yhä virheitä ajoittain, on kriittistä, että raportin arvioi joku syvällisesti sen käsittelemää aihetta ymmärtävä ihminen. Silti, ainakin omissa kokeiluissani tutkimustekoälyn virheiden määrä ei ole juurikaan ylittänyt sitä, mitä voisi keskimäärin olettaa vaikkapa kandidaatintyötä laativalta opiskelijalta. Virhemarginaalia voi pienentää entisestään laatimalla samalla syötteellä raportin sekä Geminillä että ChatGPT:llä. Näin toimin itse käytännösä joka tutkimuskysymyksen osalta tällä hetkellä.

Teknologian kehityksen ei tarvitse perustua vain yhtä rataa kulkevaan jatkuvaan kasvuun vaikkapa Mooren lain tapaan. Teknologia voi kehittyä myös laadullisesti, eli keksimällä uusia tapoja käyttää jo olemassa olevia ratkaisuja. Tästä on nähdäkseni kyse nyt etenkin uusien päättely- ja tutkimusmallien kohdalla.

Laadullisen kehittämisen ansiosta tekoälyratkaisujen kiihtyvälle kehitykselle ei siis sittenkään näytä olevan ainakaan vielä näkyvillä olevaa ylärajaa.

Holmes ja Watson metsäretkellä

Sherlock Holmes ja tohtori Watson olivat metsäretkellä. Illan tullen he pystyttivät teltan ja kävivät nukkumaan. Yöllä Holmes herätti Watsonin ja sanoi:

”Kuule, Watson, katsopa ylös ja kerro, mitä näet.”
”Näen upean öisen tähtitaivaan”
”Ja mitä se kertoo sinulle?”
”Tähtitieteellisesti se kertoo, että on olemassa miljardeja samanlaisia galakseja kuin omamme. Teologisesti se kertoo, että avaruuden käsittämätön suuruus voi olla yksi merkki Jumalan olemassaolosta. Meteorologisesti taivaan tummuus ja tähtien kirkkaus kertoo siitä, että ilmassa on vähän kosteutta, ja huomispäivästä tulee varmaankin kaunis. Kuinka niin? Mitä se kertoo sinulle, Holmes?”
”Watson, joku on varastanut telttamme.”

Odessan Sherlock

Odessalainen tutkija hyppäsi Moskovan-junaan.* Seuraavalla asemalla hänen viereensä istahti nuori mies. Tutkija tarkasteli miekkosta ja päätteli nopeasti, ettei tämä näyttänyt maanviljelijältä. Sen perusteella juutalaistaustainen tutkija oivalsi, että miehen täytyi olla peräisin samalta juutalaisalueelta, josta hän itsekin oli kotoisin – muut kaupunkilaiset olivat maanviljelijöitä.

Juutalaiset tarvitsivat kuitenkin eritysluvan päästäkseen Moskovaan, ja tutkija oli tietääkseen ainoa, jolla tuo etuoikeus tällä hetkellä oli. Mies ei siis voinut olla matkalla Moskovaan. Juuri ennen Moskovaa sijaitsi kuitenkin pieni Samvetin kylä, johon lupaa ei tarvittu. Mies oli siis epäilemättä matkalla tapaamaan jotakin Samvetin juutalaisperheistä.

Samvetissa asui vain kaksi juutalaisperhettä: Bernsteinit ja Steinbergit. Bernsteinit olivat täydellisen epäsosiaalisia, joten ainoa mahdollisuus oli, että miekkonen oli matkalla tapaamaan Steinbergejä. Mutta miksi?

Steinbergeillä on kaksi tytärtä. Ehkäpä mies on siis jomman kumman tyttären aviomies. Sarahin mies oli mukava lääkäri Budapestista. Esther oli puolestaan naimisissa iäkkään liikemiehen kanssa. Miekkonen oli siis Sarahin aviomies, nimeltään Alexander Cohen, tutkija muisteli.

Koska Budapestissa vallitsivat voimakkaat juutalaisvastaiset liikkeet, ei mies todennäköisesti käyttänyt kuitenkaan enää syntymänimeään. Hän oli varmaankin siis muuttanut juutalaistaustaisen nimensä unkarilaiseen muotoon ”Kovatch”.

Tässä vaiheessa tutkija kääntyi nuorukaisen puoleen ja kysyi:
”Kuinka voitte, tohtori Kovatch?”
”Vallan mainiosti”, vastasi miekkonen säpsähtäen. ”Mutta kuinka ihmeessä te tiedätte nimeni?”
”No”, sanoi tutkija, ”sehän nyt on aivan itsestään selvää!”

*Kiitokset isälleni Timolle hauskasta anekdootista, jonka pohjalta kertomus on mukailtu.

Onko Bertrand Russell paavi?

Bertrand Russellin kuulun logiikan merkkiteoksen Principia Mathematica:n peruskäsitteestä, materiaalisesta implikaatiosta, seuraa, että ristiriidasta voidaan johtaa mikä tahansa lause. Russellia pyydettiin kerran todistamaan, että lauseesta 2 + 2 = 5 seuraa, että hän on paavi. Russell järkeili seuraavaa:

”Jos 5 = 2 + 2, niin 5 = 4. Kun vähennetään 3, saadaan 2 = 1. Paavi ja minä olemme kaksi: siispä paavi ja minä olemme yksi. Minä olen siis paavi.”

Haaksirikko ritarien ja kelmien saarelle

Kun on viime aikoina ilmoja pidellyt, päätti Pasi nostaa veneen talviteloilta ja lähteä purjehtimaan. Laineilla liplatellessaan Pasi nukahti auringon porottaessa veneen kannelle. Kuinka ollakaan, Pasin siinä nukkuessa nousi raju myrsky. Lopulta Pasi haaksirikkoutui myrskyn seurauksena saarelle.

Siinä ei auttanut muu kuin lähteä etsimään apua. Pian Pasi samosi metsästä tielle. Tietä jonkin matkaa kuljettuaan hän huomasi seuraavan kyltin:

”Ritarien ja kelmien saari. Ritarit puhuvat aina totta. Kelmit valehtelevat aina. Ritarit ja kelmit pukeutuvat aina eri väreihin.”

Pasi jatkoi matkaansa tietä pitkin. Pian Pasi huomasi tienviitan:

”Kelmien kylä, 5 km. Viemme sinulta kaiken. Ritarien kylä, 5 km. Autamme kaikessa, missä voimme.”

Ihmeissään Pasi jatkoi matkaansa. Pian hän saapui tienhaaraan. Kuinka ollakaan, tienhaarassa joskus seissyt kaksiosainen kyltti repsotti maassa palasina. Toinen suuntaviitta sanoi ”Ritarien kylä”, toinen puolestaan ”Kelmien kylä”. Tienhaarassa seisoi myöskin kinastelemassa kaksi miekkosta. Toisella oli musta paita ja toisella valkoinen.

Minkä yhden kysymyksen Pasi voi esittää tapaamilleen miehille, jotta hän pääsee varmasti ritarien kylään hakemaan apua?

PS. Kriittisen korkeakoulun loogisen päättelyn intensiivikurssille ehtii vielä ilmoittautua tänään. Ilmoittaudu osoitteeseen info@kriittinenkorkeakoulu. Lisätietoja täältä.

Mitä on Sherlock Holmes -päättely?

Luin hiljattain Umberto Econ mestariteoksen Ruusun nimi. Skolastikkotrillerissä fransiskaanimunkki William Baskerville ratkoo Adson-apureineen italialaisluostaria kohdannutta murhamysteeriä.

Baskervillellä on sherlockmainen vainu, jonka nojalla hän kykenee ällistyttäviin päätelmiin. Esimerkiksi luostariin saapuessaan hän päättelee parista katkenneesta oksasta ja kavionjäljestä, mihin kadonnut hevonen on suunnannut juomaan ja jopa sen nimen – alkuun edes tietämättä, että koni oli tiessään.

Perinteistä loogista päättelyä on kahdenlaista. Deduktio tarkoittaa sitä, että varmoiksi oletetuista yleisistä periaatteista tehdään loogisesti pätevä johtopäätös. Jos esimerkiksi kaikki ihmiset ovat kuolevaisia ja Sokrates on ihminen, voimme deduktiivisesti päätellä, että Sokrates on kuolevainen.

Induktio puolestaan tarkoittaa sitä, että teemme yleistyksen jonkin havaintoaineiston nojalla. Jos esimerkiksi tämä korppi, tuo korppi ja vieläpä kaikki eilen tavatut korpit ovat mustia, voimme tehdä induktion ”korpit ovat mustia”.

Induktion ja deduktion avulla ei kuitenkaan päätellä hevosen nimeä muutamasta murtuneesta oksasta, eikä liioin ratkota murhamysteereitä.

Salapoliisinero päättelee abduktiivisesti.

Abduktio on amerikkalaisfilosofi Charles Sanders Peircen 1800-luvun lopulla lanseeraama termi päättelylle parhaaseen lopputulokseen.

Abduktio tarkoittaa pelkimmillään sitä, että oletamme joukon erilaisia mahdollisia selityksiä – siis arvaamme, mistä voisi olla kyse. Tämän jälkeen teemme deduktiivisia päättelyitä muodostamistamme oletuksista eli hypoteeseista. Sellainen oletus, josta tehdyt johtopäätökset käyvät parhaiten yksiin kokemuksemme kanssa valitaan lopulta parhaaksi selitykseksi.

Myös tieteellinen tutkimus etenee pääasiassa abduktiivisesti. Kun omena kopsahtaa fyysikkonokkelikon päähän, se saa hänen mielikuvituksensa laukkaamaan. Lähettikö Jumala omenan hänen päähänsä? Onko kyseessä eetterin liikkeiden aiheuttama ilmiö? Vai voisiko olla, että maapallo vetää puoleensa muita kappaleita – onko siis olemassa ilmiö nimeltä painovoima? Kun näistä olettamista tehdään päätelmiä, käy pian ilmi, että viimeinen hypoteesi on uskottavin. Olkoon siis niin, että painovoima saa aikaan omenoiden putoamisen.

Abduktiossa olennaisinta on mielikuvitus – kyky muodostaa olettamia siitä, mikä voisi selittää tutkittavan ilmiön. Sherlock Holmes, William Baskerville ja Isaac Newton muodostavat joukon toinen toistaan mielikuvituksellisimpia hypoteeseja. Se, joka käy parhaiten yksiin tunnettujen tosiseikkojen kanssa valitaan parhaaksi selitykseksi.

Kun siis seuraavan kerran kohtaat päätäsi kutkuttavan ongelman, älä yritä ratkaista sitä vain yhtä kaistaa pitkin. Muodosta sen sijaan vaikkapa puolen tusinaa hypoteesia ja arvioi, mikä hypoteeseista on uskottavin. Kun vielä perehdyt tutkimuskohteeseesi yksityiskohtaisesti, ratkot pian ongelman kuin ongelman käden käänteessä.