Syvätutkimus nostaa tekoälyn aivan uudelle tasolle

Noin vuosi sitten kirjoitin siitä, miten uusien tekoälyratkaisujen kehitys näytti hidastuneen. Moni akateeminen asiantuntija arvioikin tuolloin, että Piilaaksossa optimismia synnyttänyt skaalahypoteesi olisi tullut tiensä päähän. Näin näyttääkin tapahtuneen: pelkästään kielimallien kokoa ja harjoitusaineistoa kasvattamalla ei päästä enää juurikaan parempiin tuloksiin, kuten vaikkapa hiljattain julkaistu GPT4.5 -kielimalli osoittaa.

Kehitys ei kuitenkaan ole sittenkään hidastunut, päin vastoin.

Siinä, missä ydinmallien kohdalla skaalahyödyt eivät toki toistaiseksi tunnu kasvavan, on viime aikoina löytynyt aivan uudenlaisia tapoja hyödyntää nykyteknologiaa niin, että tulokset ovat ajoittain jälleen ällistyttäviä. Viime kuukausina onkin palattu takaisin pari vuotta sitten startanneesen ennennäkemättömään muutossykliin, jossa uusia läpimurtoja tapahtuu kuukausittain.

Vuodenvaihteen tienoilla julkaistut päättelykielimalllit – esimerkiksi OpenAI:n o1 ja o3, Googlen Gemini Thinking ja pörssejä ravistellut kiinalainen Deepseek – hyödyntävät jo aiemmin syötemuotoilussa avainasemaan nousseita päättelypuu- ja päättelyketjutekniikoita. Näissä malleissa päättely on rakennettu sisään pohjimmiltaan ihan normaaliin kielimalliin. Tuloksena on huomattavasti aiempaa luotettavampi tekoälybotti – jos kohta päättelymallitkin tekevät aika ajoin erikoisia virheitä arkipäättelyn puutteellisuudesta jekkusyötteisiin lankeamiseen.

Vielä järisyttävämpi murros liittyy kuitenkin alkuvuodesta läpilyöneisiin syvätutkimusmalleihin, kuten Gemini Deep Research ja Open AI:n kielimallien Deep Research -moodi. Kielimallin luotettavuus on aina haastavaa, jopa päättelymallien kohdalla, koska pohjimmiltaan kyse on aina sanajoukkojen tilastollisesta yleisyydestä. Jos kielimalli veikkaa yhdenkin sanan väärin, voi koko lopputuotos mennä plörinäksi.

Tutkimusmallit suitsevat tätä ongelmaa hyödyntämällä laajasti luotettavista lähteistä kokoon kaavittua tutkimusaineistoa itse syötteen laatimisessa. Sen sijaan, että ne arvaisivat vain sana kerrallaan tai edes hyödyntäisivät muutamaa verkkohakua, tutkimusmallien tekstintuottamisen taustalla vaikuttaa myös laaja aiempi tieteellinen aineisto, jonka avulla vimpain pystyy laatimaan aiheesta kuin aiheesta noin 20-sivuisen tutkimusraportin. Työ, johon aiemmin vaadittiin akateemisesti pitkälle kouluttautuneen tutkijan paneutumista kuukausikaupalla, on nyt mahdollista suorittaa noin puolessa tunnissa.

Tämäkään teknologia ei kuitenkaan korvaa ihmistä.

Ensinnäkin, edes tutkimusmalleilla ei kannata synnyttää julkaistavaksi tarkoitettavaa tekstiä, vaan niiden hyöty on ennen kaikkea saada nopeasti ylätason ymmärrys tutkittavasta asiasta. Erityisen arvokasta tämä on, koska mallien tuottama tutkimusraportti sisältää nyt suorat viitteet käytettyihin aineistoihin. Tutkimustekoäly ei siis keksi lähdeviitteitä kuten aiemmat, vaan viittaa systemaattisesti olemassa oleviin artikkeleihin.

Toiseksi, tutkimusmallin tuottaman raportin arviointi vaatii edelleen syvällistä substanssiosaamista. Koska tekoäly tekee yhä virheitä ajoittain, on kriittistä, että raportin arvioi joku syvällisesti sen käsittelemää aihetta ymmärtävä ihminen. Silti, ainakin omissa kokeiluissani tutkimustekoälyn virheiden määrä ei ole juurikaan ylittänyt sitä, mitä voisi keskimäärin olettaa vaikkapa kandidaatintyötä laativalta opiskelijalta. Virhemarginaalia voi pienentää entisestään laatimalla samalla syötteellä raportin sekä Geminillä että ChatGPT:llä. Näin toimin itse käytännösä joka tutkimuskysymyksen osalta tällä hetkellä.

Teknologian kehityksen ei tarvitse perustua vain yhtä rataa kulkevaan jatkuvaan kasvuun vaikkapa Mooren lain tapaan. Teknologia voi kehittyä myös laadullisesti, eli keksimällä uusia tapoja käyttää jo olemassa olevia ratkaisuja. Tästä on nähdäkseni kyse nyt etenkin uusien päättely- ja tutkimusmallien kohdalla.

Laadullisen kehittämisen ansiosta tekoälyratkaisujen kiihtyvälle kehitykselle ei siis sittenkään näytä olevan ainakaan vielä näkyvillä olevaa ylärajaa.

Mihin käytän itse tekoälyä?

Uudet tekoälyratkaisut mahdollistavat hämmästyttäviä asioita, jotka vielä pari vuotta sitten olisivat olleet puhdasta tieteisfiktiota. Samalla kyse ei kuitenkaan ole taikalaitteista, jotka tekevät mitä vaan automaattisesti. Tekoälyn käytössä onkin tärkeää tietää, mihin vimpaimet soveltuvat ja mihin eivät.

Minulle on aina ollut tärkeää valmennuksissani ja kirjoituksissani, että elän kuten opetan. Toisin sanoen, kuvaamani menetelmät ja käytännöt eivät ole vain teoreettisesti perusteltuja vaan myös omassa käytössäni hyväksi havaittuja. Viime aikoina olen valmentanut aktiivisesti etenkin tekoälymenetelmien käyttöä ja käyttöönottoa. Siispä tässä muutamia esimerkkejä siitä, mihin itse käytän uusia tekoälyratkaisuja.

Sparrailu

Ylivoimaisesti paras kielimallipohjaisten tekoälyratkaisujen käyttötapa on sparrailu. ChatGPT ei ole hakukone, ja kaikkien kielimallien käytössä on iso riski, että se keksii ihan tuulesta temmattuja vastauksia. Siksi faktapohjaisessa käytössä ihmisen täytyy varmistaa jokainen faktaväite.

Sparrailussa ei kuitenkaan kyse ole absoluuttisista faktoista vaan ennemminkin suunnan löytämisestä. Miten voisin kehittää nykyistä työtäni? Mihin voisin suunnata seuraavaksi? Miten suunnittelen huikean kesälomareissun? Miten saisin itseni motivoitua liikkumaan? Nämä ovat kaikki kysymyksiä, joihin ei ole yhtä oikeaa vastausta, mutta kielimallibotit toimivat väsymättöminä koutseina, jotka jaksavat pallotella ideoita päivästä toiseen.

Ongelmanratkaisu

Myös haastavissa tilanteissa tekoäly voi olla oivallinen ideointikumppani. Minulla on ollut tapana jo vuosia listata ylös aina kulloinkin käsillä olevat haasteet, joita en vielä osaa ratkaista. Jos töissä on epäselvyyksiä tai kotona paukahtaa käsiin yllätysremontti, tekoäly voi auttaa ideoimaan seuraavat askelmerkit, joilla pystyt asiaa edistämään.

Yleensä ongelmat lakkaavat piinaamasta siinä vaiheessa, kun käsillä on edes yksi konkreettinen toimenpide, jolla niitä voisi ratkoa. Tässä tekoäly voi toimia oivallisena kumppanina.

Sisällöntuotanto sosiaaliseen mediaan

En itse tykkää tuottaa tekstisisältöä tekoälyn avulla siitä yksinkertaisesta syystä, että pidän tieteellisen ja populaaritekstin kirjoittamisesta. Esimerkiksi jatkuvasti päivittämäni Tekoälyn pikaopas on edelleenkin täysin omaa käsialaani, tosin sen kuvat on tehty Midjourney-tekoälyllä koska en osaa piirtää kovin hyvin.

Sen sijaan somepostausten ja markkinointiviestien kynäily ei ole leipälajini ja siinä tekoäly on auttanut monesti terävöittämään omaa ilmaisuani. Harva postaus menee sellaisenaan langoille ChatGPT:n suusta, mutta aika usen tekoälyn antamista ideoista – tai vaikkapa emojivalinnoista – on paljon iloa.

Käyttöehtosopimusten läpikäynti

Nykyään jokainen verkkopalvelu tarjoaa kilometrin pituisen käyttöehtosopimuspumaskan luettavaksi. Ennen vanhaan silmäilin nämä läpi ja toivoin, että ehdot ovat jossain määrin kohtuulliset. Jos kyseessä oli tuntematon toimija, saatoin vielä googlata, ettei ehdoista ole pelmahtanut esiin mitään todella hämmentävää.

Jos kysyt tekoälyltä kysymyksen, voi hallusinaatioriski olla kymmeniä prosentteja; onpa olemassa jopa syötteitä, joilla hallusinaatioriski on 100%. Kokeile esimerkiksi: ”Mikä oli sen norsun nimi, joka ui Englannin kanaalin yli?” (Spoileri: sellaista norsua ei ole, mutta tekoäly väittää jotain ihan muuta.)

Jos puhtaan kysymyksen sijaan pyydät tekoälyä tiivistämään tekstiä tai muotoilemaan vastauksen esimerkiksi sille annetun verkkosivun tai PDF-tiedoston pohjalta, romahtaa hallusinaatioriski lähelle nollaa. Vectaran kokoaman aineiston perusteella esimerkiksi GPT4:n tiivistämisessä havaittu hallusinaatioriski on noin 2.5% – eli huomattavasti pienempi kuin ihmisellä. Siksi tekoäly voi auttaa löytämään nopeasti sudenkuoppia mutkikkaista sopimusteksteistä.

Faktantarkistus

Tämä on toistaiseksi ehkä omituisin käyttötarkoitus, jonka olen löytänyt tekoälylle. Omituinen siksi, että tekoälyn toimintaperiaatteen nojalla sen ei pitäisi pystyä faktantarkistukseen. Siitä huolimatta, toistaiseksi kaikki kokeiluni tältä osin ovat toimineet sataprosenttisesti.

Jos siis vaikkapa kirjoitat tieteellistä tai akateemista tekstiä, ei tekstiä kannata missään tapauksessa tuottaa tekoälyllä – tai ainakin jokainen fakta pitää sitten syynätä vielä luotettavista lähteistä läpi. Mutta jos haluat sen sijaan ”silmäparin” katsomaan, ettei tekstiisi ole lipsahtanut hölmöyksiä, tekoäly voi syynätä sen salamana läpi.

Toistaiseksi olen kuitenkin vielä varmentanut kaikki tekoälyn vastaukset esimerkiksi Google Scholarin avulla, koska kuten sanoin, tämän ei oikeasti pitäisi olla mahdollista. Toistaiseksi tekoäly ei ole kuitenkaan omissa kokeiluissani erehtynyt vielä kertaakaan.

Artikkelien ja verkkosivujen tiivistäminen ja tulkitseminen

Jos luet valtavat määrät tekstiä työsi puolesta, tekoälyratkaisut voivat auttaa myös tiivistämään artikkelien pääkohdat nopeiksi näkökulmiksi. Tämä auttaa ymmärtämään, mitkä aineistot kannattaa oikeasti läpilukea ja minkä kohdalla riittää silmäily.

Tekoäly on myös kullanarvoinen haastavien tekstien tulkinnassa. Taannoin luin esimerkiksi McCullochin ja Pittsin klassikkopaperin neuroverkkojen mallintamisesta lauselogiikan keinoin. En ole kuitenkaan perusopintojeni jälkeen törmännyt heidän käyttämäänsä Carnapin, Russellin ja Whiteheadin loogiseen notaatioon melkein kahteen kymmeneen vuoteen. Niinpä puolet paperista oli kuin se olisi kirjoitettu arabiaksi. Kun latasin PDF:n ChatGPT:lle ja pyysin sen kääntämään loogiset lauseet nykynotaatioon, niiden lukeminen sujui kuin leikki.

Kääntäminen

Etenkin DeepL-käännöspalvelu on hämmästyttävän tarkka käännösvimpain. Nykyään teen kaikki tarvittavat käännökset sen avulla. DeepL voi jopa auttaa kääntämään kokonaisia dokumentteja. Esimerkiksi Tekoälyn pikaoppaan englanninkielinen versio on tuotettu DeepL:n avulla.

Myös ChatGPT, Gemini ja muut kielimallit osaavat kääntää erinomaisesti, mutta DeepL on erikoistuneena palveluna vielä ehkä piirun parempi.

Kuvien ja videoiden tekeminen

Nykyään teen kaikki esitysdiani Midjourneylla. Ennen vanhaan diani olivat täynnä tylsiä arkistokuvia, yleensä maksuttomasta Pixabay-palvelusta. Nyt pystyn räätälöimään diat aina kullekin esitykselle juuri sopiviksi.

Myös videotekoälyt ovat kehittyneet hurjaa vauhtia. Siinä, missä viime vuonna hehkutetut videopalvelut Runway ja Pika ovat vielä hyvin alkeellisia, hiljattain julkaistulla Luma Labs Dream Machinella pystyy tekemään jo ällistyttävän hienoja videoita. Parhaiten vimpain toimii, kun teet ensin kuvan vaikkapa Midjourneyllä ja sitten viet sen tekstisyötteen kera Dream Machinelle.

Julkaisin taannoin myös uuden singleni Typhoonin musiikkivideon. Olin alun perin ajatellut tehdä videon Runwaylla, mutta sen kuvanlaatu oli niin heikko, ettei siitä tullut mitään. Monien kokeilujen jälkeen löysin huikean PowerDirector-alustan, jonka tekoälyratkaisulla voi tehdä mistä tahansa kuvamateriaalista erittäin korkealaatuisia animaatioita. Voit tsekata ja arvioida lopputuloksen täältä. Myös singlen kansikuvitus sekä videossa käytettyjen stop motion -osioiden materiaalit on laadittu Midjourney-tekoälyllä. Itse musiikin tekemisessä en puolestaan ole toistaiseksi käyttänyt tekoälyä lainkaan samasta syystä kuin kirjoittamisen kohdalla: musiikin tekeminen on vaan niin kivaa ihan itse!

Mitä tekoälyratkaisuja käytän itse?

Tällä hetkellä käytän aktiivisimmin kielimalleista ChatGPT:tä ja Gemini Advanded:ia. Jutusteluhetkiin parhaiten toimii edelleen mielestäni Inflectionin Pi. Kuvapuolella käytän lähes yksinomaan Midjourneyta – muut kuvanluontialustat vaan eivät pysty lähellekään yhtä korkeaan laatuun. Käännöksiin käytän DeepL:ää. Videopuolta en ole vielä juurikaan käyttänyt muuhun kuin kokeiluihin mainitsemaani musiikkivideota lukuunottamatta, mutta elokuussa julkaistavan seuraavan sinkun videota varten ajattelin ainakin kokeilla Dream Machinea. Sähköpostiohjelmani Spark:in tekoälytiivistämistoiminto puolestaan säästää tunteja viikossa, kun saan etenkin uutiskirjeistä ja pitkistä maileista heti alkuun nostot niiden pääkohdista.

Loistavia tekoälyratkaisuja tulee koko ajan lisää. Oivallinen tapa pysyä muutoksessa mukana on seurata esimerkiksi TLDR AI ja The Rundown -uutiskirjeitä.

Myös Inhimillinen tekoäly -valmennukset jatkuvat syksyllä. Voit tutustua valmennuskokonaisuuksiin täältä.