Tekoäly on täällä, osa 1/3: Mitä tekoäly oikeasti on ja miten se vaikuttaa nyt elämäämme?

Jokunen vuosi sitten eräs sijoittaja kertoi Slushin jälkeen vitsin: ”Jos joku puhuu tekoälystä, hän työskentelee markkinoinnissa. Jos koneoppimisesta, hän on projektipäällikkö. Ne, jotka puhuvat tilastotieteestä ovat puolestaan koodareita.”

Toisin sanoen, vain ne, jotka tosi asiassa kehittävät ”tekoälyä” tietävät, mistä on oikeasti kyse.

”Tekoäly” on yli-hypetetty käsite, jossa on pohjimmiltaan kysymys valtavan laajojen tilastollisten yhteyksien luomisesta massiivisessa tietomäärässä.

Jos joku olisi kysynyt vuosi sitten, milloin näemme ensimmäiset oikeasti toimivat kieltä tai kuvaa luovat koneoppimisratkaisut, olisin veikannut noin 10–30 vuoden haarukkaa. Viime syksynä kuitenkin sekä kielellinen että kuvallinen koneoppiminen harppasivat valovuoden eteenpäin, erityisesti OpenAI:n GPT-3 -kielimallin ja siihen perustuvien sovellusten ChatGPT:n ja Dall-E 2:n johdolla. Jo elokuussa ällistelin Dall-E:n kilpailija Midjourneyn kykyä luoda kuvia tekstikäskyistä. Viimeistään marraskuussa kun ChatGPT julkaistiin oli todettava jälleen kerran, kuinka vaikea teknologian kehitystä on ennustaa.

Nyt voi jo aika suurella varmuudella sanoa, että suuret kielimallit (eng ”large language model”, LLM) ovat internetin tai älypuhelinten tasoinen teknologiamurros.

LLM:t mullistavat nyt aika lailla kaiken, mitä teemme. Vaikka GPT-3 -teknologian suosituin sovellus ChatGPT on ollut yleisessä käytössä vasta muutamia kuukausia, sille löytyy yhä useampia ja mielikuvituksellisempia käyttötarkoituksia. Tässä muutamia, joihin olen itse törmännyt: ChatGPT pystyy kertomaan salamannopeasti, miten optimoidaan lapsen tietokone pelikäyttöön tai ratkaistaan Logic-sekvensserin ongelma; se voi luoda uskottavia kertomuksia ja runoja; se laatii hetkessä ruokalistan 7-henkiselle perheelle viikonlopuksi ostoslistoineen; se kartoittaa valtavan suuresta tietomäärästä olennaisen; se tarjoaa toimiva arvostelukriteerejä kurssiesseille; ja niin edelleen. Ehkä huikein kokemus oli viime viikonloppuna, kun vaimoni lähetti minulle noin 50-kohtaisen ostoslistan tekstiviestinä pojan 7v-syntymäpäiviä varten. Muutamalla pyynnöllä ChatGPT järjesti listan nätisti K-kaupan tuoteosastojen mukaan todo-listaksi ja ostosreissu sujui kuin leikki.

Opettajalle haastavaa on, että näköjään ChatGPT pystyy myös laatimaan uskottavan näköisen 600 sanan kurssiesseen aiheesta kuin aiheesta. Ja vaikka tekoälyn laatimat kirjoitelmat ovatkin paikoin pinnallisia, ovat ne osoittautuneet riittävän hyviksi jopa MBA-tutkinnon läpäisemiseksi. Ja tässä vasta raapaistaan ilmiön pintaa.

Tekoälyn seuraavaa askelta on kuitenkin ihan yhtä vaikeaa ennustaa kuin tätä nykyistäkin harppausta. Äkkiseltään luulisi, että suljetun, 2021 asti dataa hyödyntäneen ChatGPT:n avaaminen käyttämään koko internetiä olisi hyvä idea. Kuitenkin näyttäisi siltä, että kun Microsoft syötti taannoin kielimallille koko internetin reaaliajassa, tekoäly pimahti. Emme siis tiedä, nähdäänkö reaaliaikainen tekoälyhaku tänä vuonna, vuonna 2050 – vai liittyykö siihen laskennallisia haasteita, joita ei nykyteknologialla voi ratkoa laisinkaan. Itseohjautuvia autoja on hypetetty jo ainakin vuosikymmen, ja silti niitä ei ole onnistuttu kehittämään valmiiksi asti, koska piilomuuttujia on niin paljon.

Paljon on myös näkynyt kritiikkiä siitä, kuinka LLM-sovellukset eivät ole mitään oikeaa tekoälyä, vaan vain kielellisten yhteyksien analyysia. Näin on – mutta siitä huolimatta LLM-sovellukset ovat ällistyttävä teknologinen harppaus, joka vaikuttaa jo nyt meidän kaikkien elämään – ja tulee myös mullistamaan kokonaisia ammattialoja jo tästä vuodesta alkaen. Siinä, missä inhimillinen ilmaisu on yhä keskiössä esimerkiksi taiteellisessa tuotannossa, arkikäyttöön suunnattu tekstien ja kuvien tuotto on jo nyt alkanut automatisoitua hämmentävää vauhtia. Se tarkoittaa hyvin erikoisia aikoja kuvittajille ja mainostekstien suunnittelijoille.

Koneoppimismallit voivat auttaa myös tiedonhaussa ja -käsittelyssä, mutta siinä niin kuin kaikessa tiedonhaussa internetistä perinteiseen printtimediaan korostuu kenties vielä entistä enemmän mediakriittisyyden rooli. ChatGPT laatii iloisen itsevarmasti lähdeviiteluetteloita täysin keksityistä artikkeleista ja kuvailee ilmiöitä 90-prosenttisesti oikein, mutta menee sitten rytisten metsään. Tietysti ihan samalla tavalla kuin ihmisasiantuntijatkin aika ajoin.

Tämä ei tarkoita sitä, että kyseessä olisi hyödytön puppugeneraattori. LLM-sovellukset voivat auttaa hahmottamaan yleisyyksiä valtavista tietomääristä – mutta varmuudella niiden suoltamaan sisältöön voi suhtautua vasta kun tekoälyn tuottamaa aineistoa on verrattu uskottaviin tietolähteisiin kuten esimerkiksi luotettaviin tilastotietokantoihin tai vaikkapa Google Scholar -artikkelihaun kautta etsittyihin todellisiin laadukkaissa tieteellisisä julkaisuissa julkaistuihin artikkeleihin. Ihan samat säännöt pätevät siis LLM-tuotoksiin kuin kaikkeen muuhunkin internetissä julkaistuun: vasta kun löydetty tieto on varmennettu riittävän monesta uskottavasta lähteestä, voidaan sitä pitää faktana.

Koneoppimismallit ovat jo nyt keskeisessä roolissa ihan jokaisen elämässä, tiesimme sitä tai emme. Olisikin hyvä, että perehtyisimme ainakin pintapuolisesti siihen, mistä ilmiössä on oikeasti kyse, etenkin jotta ylipaisuteltu tekoälyhypetys ei valtaa liikaa alaa. Toimiva ja viihdyttävä tapa tutustua ”tekoälyn”saloihin on Helsingin yliopiston ja Reaktorin laatima erinomainen verkkokurssi Elements of AI, jonka voi suorittaa vaikka työmatkoilla ja kahvitauoilla.

Tekoälyyn liittyy myös monenlaisia eettisiä kysymyksiä tekijänoikeudesta syvällisiin filosofisiin kysymyksiin elämän ja tietoisuuden perustasta. Ja vaikka sanana ”tekoäly” onkin nykyteknologian valossa vielä ainakin toistaiseksi harhaanjohtava, jo olemassa oleville koneoppimismalleille on toinen toistaan häkellyttävämpiä sovelluksia, ja uusia tulee nyt melkein viikoittain.

Näistä kysymyksistä lisää juttusarjan seuraavissa osissa.

Ajattelun ammattilainen

Tekoäly on täällä, osa 1/3: Mitä tekoäly oikeasti on ja miten se vaikuttaa nyt elämäämme?

1 thoughts on “Tekoäly on täällä, osa 1/3: Mitä tekoäly oikeasti on ja miten se vaikuttaa nyt elämäämme?”

Jätä kommentti Peruuta vastaus

Aiheeseen liittyy

1 thoughts on “Tekoäly on täällä, osa 1/3: Mitä tekoäly oikeasti on ja miten se vaikuttaa nyt elämäämme?”

Jätä kommentti Peruuta vastaus