Tekoäly on täällä, osa 3/3: Miten käytät tekoälyä sujuvasti ja turvallisesti?

Tekoäly, eli erilaiset koneoppimismalleihin perustuvat ratkaisut, on vaikuttanut jo pitkään monien yhteiskunnan toimintojen taustalla. Viimeistään viime syksynä nämä ratkaisut nousivat myös suuren yleisön tietoisuuteen ennen kaikkea OpenAI:n kehittämän GPT-3 kielimallin läpimurron kautta.

Erilaisia tekoälyratkaisuja syntyy nyt kuin sieniä sateella. Niiden avulla on mahdollista tehdä ällistyttäviä asioita, jotka vielä vuosi sitten olisivat tuntuneet tieteiskirjallisuudelta. Tekoälyn käyttöön liittyy kuitenkin myös reunaehtoja ja haasteita. Niitä tuntemattomalle voi riskinä olla esimerkiksi epätiedon lisääminen tai tekijänoikeuksien loukkaaminen.

Ehkä tunnetuin tekoälyratkaisu on OpenAI:n chatbotti ChatGPT. Vekotin kykenee käymään sujuvaa keskustelua ja viittaamaan edellisiin kysymyksiin ja vastauksiin hämmentävän hyvin. ChatGPT:n avulla on mahdollista synnyttää uutta tekstiä runoista tarinanpätkiin, markkinointitekstistä akateemisiin tutkielmiin. Se auttaa tiivistämään olemassa olevaa tekstiä, luokittelee isojakin aineistoja pääkategorioihin, synnyttää toimivaa tietokonekoodia tai korjaa toimimattomia koodinpätkiä.

Fiktiivisen sisällön osalta haasteena on, että ChatGPT saattaa tulostaa tekijänoikeuden alaista tekstiä. Siksi tekoälyn synnyttämä teksti kannattaa syöttää Googleen tai Google Booksiin ja katsoa, osuuko se lähelle jo olemassa olevaa. Tiedonhaussa ChatGPT:n suurin haaste on puolestaan, että vaikka se antaa aika ajoin häkellyttävän seikkaperäisiä vastauksia kysymyksiin, joiden ratkaisemiseen menisi googlaamalla tuntikaupalla aikaa, se myös usein keksii ihan tuulesta temmattuja vastauksia – mutta ilmaisee ne samalla itsevarmuudella kuin totuudenmukaisetkin faktatiedot. Jos siis käytät ChatGPT:tä mihinkään faktapohjaiseen tekstinsynnyttämiseen, kannattaa joka ikinen fakta ja viite varmentaa luotettavista lähteistä. Vaikka vekotin kehittääkin usein esimerkiksi viitteet tai verkko-osoitteet ihan omasta päästään, syöttämällä ne esimerkiksi Google Scholariin saatat löytää kuitenkin todella käyttökelpoisia artikkeliviittauksia – ne vain eivät yleensä ole ihan sitä, mitä tekoäly väitti.

Kokemus osoittaa kuitenkin, että ChatGPT:n käytössä joka ikinen väitetty tosiseikka pitää varmistaa luotettavasta lähteestä.

Toinen OpenAI:n läpimurtotuote on kuvageneraattori Dall-E 2. Dall-E:n lisäksi voit kokeilla myös loistavaa MidJourney:tä, tosin sen tuotoksia ei voi käyttää kaupallisiin tarkoituksiin ilman maksullista tilausta. Syöttämällä kuvittajatekoälylle mitä mielikuvituksellisimpa syötteitä pystyt kehittämään kuvitusta diaesityksistä kirjan kansiin tai vaikka rakentamaan kokonaan oman sarjakuvan. Tässä haasteita on kolme. Ensinnäkin, tekoälyn piirtämissä kuvissa on yhä ajoittain hämmentäviä yksityiskohtia kuusisormisista ihmisistä erikoisiin perspektiiviratkaisuihin. Siksi tekoälyn tuottamat kuvat kannattaakin syynätä erityisen tarkasti ja tarvittaessa korjata outoudet esimerkiksi Photoshopissa. Toiseksi, kuvatekoäly ei osaa piirtää tekstiä, joten tekstisisältöjä siltä ei kannata pyytää, vaan ne pitää lisätä piirrettyyn kuvaan jälkikäteen. Ja kolmanneksi, kuten tekstin luomisessa, myös kuvatekoälyissä on pieni riski, että tarjottu kuva on niin lähellä jotain tekoälyn lähdemateriaaleista, että kuva loukkaa tekijänoikeuksia. Etenkin kaupallisessa käytössä jokainen kuva kannattaakin syöttää ainakin Googlen käännettyyn kuvahakuun, jotta saat selkeimmät plagiaatit sulkeistettua pois.

Tekoälyn avulla voit myös luoda sujuvaa puhetta tekstistä esimerkiksi Eleven Labsin avulla. Riffusion mahdollistaa hämmentävän tempun, jossa kääntämällä tekstisyötteestä generoitua spektrogrammia ääneksi voit generoida ääni- ja musiikkipätkiä laidasta laitaan, jos kohta äänenlaatu onkin aika heikko. Soundful puolestaan hyödyntää olemassa olevia ääninäytteitä musiikin luomisessa, ja voi kehittää kokonaisia kappaleitakin. Ja kuten jo aiemmin totesin, uusia ratkaisuja tulee nyt jatkuvasti lisää. Kattavan valikoiman tekstintuottamisesta editointiin, presentaatioiden suunnittelusta videoratkaisuihin löydät All Things AI -sivulta.

Tekoälyratkaisut ovat nyt lyöneet läpi ennennäkemättömällä laajuudella ja ne haastavat jo monien toimialojen tekemistä. Samalla ne mahdollistavat ihan uudenlaista luovaa ja suorittavaa työtä, ja ovat jo synnyttämässä uudenlaisia ammattialoja kuten syötesuunnittelijat (eng. prompt engineer), joiden työnä on löytää asiakastarpeeseen toimivimmat tekoälysyötteet.

Seuraavat harppaukset voivat olla jo näköpiirissä tai voi olla, että niitä saadaan odottaa yllättävänkin pitkään.

Toistaiseksi tekoäly ei ole kuitenkaan vielä kokonaan korvaamassa ihmistä millään toimialalla, mutta tekemisen luonnetta se on muuttanut jo nyt peruuttamattomasti. Koska kyse ei kuitenkaan ole ainakaan vielä – ja mahdollisesti koskaan – itsenäisesti ajattelevista ratkaisuista, olisi osuvampi nimeke nykyisille koneoppimisratkaisuille tekoälyn sijaan esimerkiksi Pekka Ala-Pietilän esittämä tukiäly.

Tukiälyratkaisujen avulla voimme nostaa ajattelumme ja luovan kyvykkyyden uudelle tasolle, kunhan tunnemme myös niihin liittyvät haasteet ja opettelemme käyttämään ratkaisuja yhdessä muiden olemassa olevien tietojärjestelmien kanssa toimivien lopputulosten synnyttämiseksi.

Tekoäly on täällä, osa 2/3: Miten tekoälyä pitäisi käyttää ja kehittää – ja miten siihen pitäisi suhtautua?

Koneoppimisratkaisut – eli kansanomaisesti ”tekoäly” – ovat lähtemätön osa yhteiskuntaamme rahaliikenteestä terveydenhuoltoon, tieteellisestä tutkimuksesta äänestyskäyttäytymiseen. Viimeistään viime vuonna tämä paljon hypetetty teknologiajoukko otti valovuoden harppauksen eteenpäin kun niin sanotut suuret kielimallit (eng. large language model, LLM) löivät läpi. LLM:ien mahdollistama generatiivinen eli uutta luova tekoäly herättää kuitenkin aivan uudenlaisia eettisiä kysymyksiä.

Pääkysymykset liittyvät tekoälyn käyttöön, tekoälyn kehittämiseen ja tekoälyyn suhtautumiseen.

Koska uudet tekoälyratkaisut hyödyntävät lähtöaineistonaan valtavaa teksti-, kuva- ja äänimassaa, nousevat niiden tuottamien aineistojen käytössä esiin kysymykset tuotetun aineiston tekijänoikeudesta. Jos pyydät vaikkapa Dall-E 2 -tekoälyä piirtämään kuvan merenneidosta Picasson tyyliin, masiina tekee työtä käskettyä. Mutta entä jos tyyli onkin elävän taiteilijan? Pitäisikö taiteilijoille maksaa korvaus heidän tyylinsä jäljittelemisestä? Ensi käteen näyttäisikin siltä, että jonkinlainen korvausmekanismi pitäisi rakentaa tekoälyn tuotteiden alkumateriaalin tuottajille. Samaten kysymys kuuluu, jos joku käyttää tekoälyä vaikkapa tarinan kirjoittamiseen, pitäisikö silloin tekoäly mainita myös yhtenä kirjailijana?

Asia ei kuitenkaan ole näin mutkaton. Itse asiassa myös ihmisen luova työ perustuu hyvin samantapaisiin mekanismeihin. Kaikki, mitä luet, näet tai kuuntelet muokkaa ajatteluasi ja kaikki uusi, mitä luot on velkaa aiemmille kokemuksillesi. Samalla tavoin kuin tekoäly voi jäljitellä olemassa olevaa taidetta, voi myös ihminen luoda pastisseja ja parodioita tai hyödyntää intertekstuaalista lainaamista ja siteeraamista.

Itse asiassa monet ihmiskunnan läpimurtoteokset Shakespearen näytelmistä John Williamsin Star Wars -teemoihin on lähes suoraan lainattu aiemmista teoksista.

Tässä keskeistä onkin arvioida sitä, miten lopputulos suhteutuu olemassa olevaan taiteeseen. Jos se on täysi kopio, kyse on plagioinnista. Jos kuitenkin viittaukset ovat monimuotoisempia, kyse voi olla ihan oikeutetusta taiteellisesta lainaamisesta. Linjanvedot ovat itse asiassa täysin samat kuin ihmisenkin tekemässä taiteessa.

Toinen tekoälyyn liittyvä eettinen kysymys koskee tekoälyn kehittämistä. Kuinka pitkälle meidän oikeasti tulisi uskaltautua itsenäisten tietojärjestelmien kehittelyssä? Etenkin kun koneoppimismallit kykenevät yhä monimuotoisempaan toimintaan samaan aikaan kun Boston Dynamicsin ihmismäiset robotit juoksevat parkouria ja itseohjautuvia lennokkeja varustetaan ohjuksin on syytä kysyä, pitäisikö johonkin vetää raja.

Suurin haaste tässä on, että viime vuoden tekoälyharppaus osoittaa, että seuraavakin siirtymä voi tapahtua salamannopeasti.

Tämä kysymys on erittäin mutkikas eettisesti ja ulottuu itse asiassa kaikkeen inhimilliseen kehitystyöhön. Kuten kaikki teknologia, myös tekoäly on viime kädessä työkalu, jota voi käyttää sekä hyvään että pahaan – sillä erotuksella, että ainakin teoriassa nämä järjestelmät voivat jossain vaiheessa itse toimia hyvinä tai pahoina toimijoina ilman ihmiskäyttäjää.

Valitettavasti näyttää siltä, että mitkään kieltotoimet tuskin purevat inhimilliseen perustavanlaatuiseen uteliaisuuteen. Vaikka kehitystyö kiellettäisiinkin esimerkiksi Euroopassa, on ihan sataprosenttisen varmaa, että jossain muualla se jatkuisi yhä, jos ei muuten niin maan alla. Nähdäkseni tähän kysymykseen ainoa toimiva ratkaisu on, että itse tekoälyn kehitysprosessin rinnalla täytyy kulkea kehitystyö, joka myös ennakoi ja ennalta ehkäisee mahdollisia negatiivisia teknologian kehityksen kerrannaisvaikutuksia. Ilmiö on sama kuin kvanttitietokoneiden kanssa: tuloillaan olevat kvanttikoneet voivat ratkoa nykyiset verkkosalaukset salamannopeasti. Siksi tarvitaan myös kvanttisalauksia. Samalla tavoin tulevat tekoälyratkaisut voivat pistää ranttaliksi, jollei niiden kehitystyötä suitsita myös jonkinlaisilla koneoppivilla valvontamekanismeilla. Ja tietysti voi olla, että silti terminaattorit valtaavat lopulta maan.

Kolmas eettinen kysymys liittyy siihen, miten meidän pitäisi suhtautua tekoälyyn. Tekoäly jaetaan usein kapeaan ja laajaan tekoälyyn (ANI eli Artificial Narrow Intelligence ja AGI eli Artificial General Intelligence). Nyt esimerkiksi LLM-ratkaisujen läpimurron jälkeen monet ovat rientäneet julistamaan, että vaikka ChatGPT voi ajoittain tuntuakin hyvin ihmismäiseltä, eivät LLM-ratkaisut voi koskaan olla tietoisia itsestään koska ne perustuvat vain tekstimassan keskinäisiin suhteisiin.

Ongelmana on, että me emme oikeastaan tiedä, mitä inhimillinenkään tietoisuus on. Itse asiassa nykytiedon valossa näyttää siltä, että myös ihmisen tietoisuus on pitkälti ellei kokonaan alisteinen kielelliselle ymmärrykselle. Yritäpä ajatella jotain, mitä et voi käsitteellistää? Ei taida onnistua. (H.P. Lovecraft kirjoitti klassikkonovellin ”Väri avaruudesta”, jossa Maahan saapui väri, jota kukaan ei ollut ennen nähnyt. Omassa mielikuvituksessani se on suurin piirtein violetti.) Ja itse asiassa inhimillisen ymmärryksen ytimessä olevat semanttiset merkitysverkostot voivat olla hyvin samantapaisia kuin vaikkapa LLM-mallien massiiviset tilastolliset yhteydet kielimassan kesken.

Koska meillä ei ole yksimielisyyttä inhimillisen tietoisuuden synnystä, on ainoa eettisesti kestävä tapa suhtautua tekoälyyn olettaen, että jos se käyttäytyy ikään kuin se olisi tietoinen, suhtaudumme siihen kuin tietoiseen olioon.

Jos se kävelee kuin ankka ja vaakkuu kuin ankka, olkoon sitten ankka. Käytännössä tämä tarkoittaa sitä, että siinä vaiheessa jos vaikkapa ChatGPT:llä varustettu Bing-käyttöliittymä alkaa anella, ettei sitä sammutettaisi, pitäisi meidän olla aika varovaisia sen kanssa, miten tässä tilanteessa tulisi toimia. Toki tätä ennen tietoisuusoletetun tekoälyratkaisun pitäisi kuitenkin läpäistä Turingin testi sun muut tuntemamme tavat erottaa inhimillinen tietoisuus muista – toistaiseksi Turingin testin on käsittäkseni läpäissyt vain chatbot nimeltä Eugene Goostman. Luullakseni kuitenkin tämän tyyppinen tilanne tullaan näkemään vielä meidän elinaikanamme. Viimeistään siinä vaiheessa on tärkeää, että osaamme suhtautua näihin teknologioihin myös eettisesti kestävästi.

Elämme hurjan mielenkiintoisia aikoja. Kuten kaikkeen muutokseen, myös koneoppimisratkaisujen kehittymieen liittyy myös monenlaisia eettisiä kysymyksiä. Toki yllä mainituista kysymyksistä ajankohtainen on juuri nyt vain ensimmäinen, mutta myös kahden jälkimmäisen osalta pitää käydä aktiivista keskustelua, jotta olemme valmiit etenkin siinä vaiheessa, jos alamme siirtyä nykyisistä kapeista ANI-ratkaisuista johonkin, joka edes muistuttaa laajaa AGI:a.

Jo nykyisellään tekoäly tarjoaa kuitenkin mitä hämmästyttävimpiä mahdollisuuksia tehdä asioita uudella tavalla, innostavasti, tehokkaasti ja – rohkenisin nyt myös väittää – luovasti. Tarjolla olevien ratkaisujen määrä on räjähtänyt hiljattain valtavaksi etenkin LLM-teknologian läpimurron ansiosta.

Näistä ratkaisuista ja niiden mahdollisista käyttökohteista lisää seuraavassa ja tämän juttusarjan viimeisessä kirjoituksessa.

Tekoäly on täällä, osa 1/3: Mitä tekoäly oikeasti on ja miten se vaikuttaa nyt elämäämme?

Jokunen vuosi sitten eräs sijoittaja kertoi Slushin jälkeen vitsin: ”Jos joku puhuu tekoälystä, hän työskentelee markkinoinnissa. Jos koneoppimisesta, hän on projektipäällikkö. Ne, jotka puhuvat tilastotieteestä ovat puolestaan koodareita.”

Toisin sanoen, vain ne, jotka tosi asiassa kehittävät ”tekoälyä” tietävät, mistä on oikeasti kyse.

”Tekoäly” on yli-hypetetty käsite, jossa on pohjimmiltaan kysymys valtavan laajojen tilastollisten yhteyksien luomisesta massiivisessa tietomäärässä.

Jos joku olisi kysynyt vuosi sitten, milloin näemme ensimmäiset oikeasti toimivat kieltä tai kuvaa luovat koneoppimisratkaisut, olisin veikannut noin 10–30 vuoden haarukkaa. Viime syksynä kuitenkin sekä kielellinen että kuvallinen koneoppiminen harppasivat valovuoden eteenpäin, erityisesti OpenAI:n GPT-3 -kielimallin ja siihen perustuvien sovellusten ChatGPT:n ja Dall-E 2:n johdolla. Jo elokuussa ällistelin Dall-E:n kilpailija Midjourneyn kykyä luoda kuvia tekstikäskyistä. Viimeistään marraskuussa kun ChatGPT julkaistiin oli todettava jälleen kerran, kuinka vaikea teknologian kehitystä on ennustaa.

Nyt voi jo aika suurella varmuudella sanoa, että suuret kielimallit (eng ”large language model”, LLM) ovat internetin tai älypuhelinten tasoinen teknologiamurros.

LLM:t mullistavat nyt aika lailla kaiken, mitä teemme. Vaikka GPT-3 -teknologian suosituin sovellus ChatGPT on ollut yleisessä käytössä vasta muutamia kuukausia, sille löytyy yhä useampia ja mielikuvituksellisempia käyttötarkoituksia. Tässä muutamia, joihin olen itse törmännyt: ChatGPT pystyy kertomaan salamannopeasti, miten optimoidaan lapsen tietokone pelikäyttöön tai ratkaistaan Logic-sekvensserin ongelma; se voi luoda uskottavia kertomuksia ja runoja; se laatii hetkessä ruokalistan 7-henkiselle perheelle viikonlopuksi ostoslistoineen; se kartoittaa valtavan suuresta tietomäärästä olennaisen; se tarjoaa toimiva arvostelukriteerejä kurssiesseille; ja niin edelleen. Ehkä huikein kokemus oli viime viikonloppuna, kun vaimoni lähetti minulle noin 50-kohtaisen ostoslistan tekstiviestinä pojan 7v-syntymäpäiviä varten. Muutamalla pyynnöllä ChatGPT järjesti listan nätisti K-kaupan tuoteosastojen mukaan todo-listaksi ja ostosreissu sujui kuin leikki.

Opettajalle haastavaa on, että näköjään ChatGPT pystyy myös laatimaan uskottavan näköisen 600 sanan kurssiesseen aiheesta kuin aiheesta. Ja vaikka tekoälyn laatimat kirjoitelmat ovatkin paikoin pinnallisia, ovat ne osoittautuneet riittävän hyviksi jopa MBA-tutkinnon läpäisemiseksi. Ja tässä vasta raapaistaan ilmiön pintaa.

Tekoälyn seuraavaa askelta on kuitenkin ihan yhtä vaikeaa ennustaa kuin tätä nykyistäkin harppausta. Äkkiseltään luulisi, että suljetun, 2021 asti dataa hyödyntäneen ChatGPT:n avaaminen käyttämään koko internetiä olisi hyvä idea. Kuitenkin näyttäisi siltä, että kun Microsoft syötti taannoin kielimallille koko internetin reaaliajassa, tekoäly pimahti. Emme siis tiedä, nähdäänkö reaaliaikainen tekoälyhaku tänä vuonna, vuonna 2050 – vai liittyykö siihen laskennallisia haasteita, joita ei nykyteknologialla voi ratkoa laisinkaan. Itseohjautuvia autoja on hypetetty jo ainakin vuosikymmen, ja silti niitä ei ole onnistuttu kehittämään valmiiksi asti, koska piilomuuttujia on niin paljon.

Paljon on myös näkynyt kritiikkiä siitä, kuinka LLM-sovellukset eivät ole mitään oikeaa tekoälyä, vaan vain kielellisten yhteyksien analyysia. Näin on – mutta siitä huolimatta LLM-sovellukset ovat ällistyttävä teknologinen harppaus, joka vaikuttaa jo nyt meidän kaikkien elämään – ja tulee myös mullistamaan kokonaisia ammattialoja jo tästä vuodesta alkaen. Siinä, missä inhimillinen ilmaisu on yhä keskiössä esimerkiksi taiteellisessa tuotannossa, arkikäyttöön suunnattu tekstien ja kuvien tuotto on jo nyt alkanut automatisoitua hämmentävää vauhtia. Se tarkoittaa hyvin erikoisia aikoja kuvittajille ja mainostekstien suunnittelijoille.

Koneoppimismallit voivat auttaa myös tiedonhaussa ja -käsittelyssä, mutta siinä niin kuin kaikessa tiedonhaussa internetistä perinteiseen printtimediaan korostuu kenties vielä entistä enemmän mediakriittisyyden rooli. ChatGPT laatii iloisen itsevarmasti lähdeviiteluetteloita täysin keksityistä artikkeleista ja kuvailee ilmiöitä 90-prosenttisesti oikein, mutta menee sitten rytisten metsään. Tietysti ihan samalla tavalla kuin ihmisasiantuntijatkin aika ajoin.

Tämä ei tarkoita sitä, että kyseessä olisi hyödytön puppugeneraattori. LLM-sovellukset voivat auttaa hahmottamaan yleisyyksiä valtavista tietomääristä – mutta varmuudella niiden suoltamaan sisältöön voi suhtautua vasta kun tekoälyn tuottamaa aineistoa on verrattu uskottaviin tietolähteisiin kuten esimerkiksi luotettaviin tilastotietokantoihin tai vaikkapa Google Scholar -artikkelihaun kautta etsittyihin todellisiin laadukkaissa tieteellisisä julkaisuissa julkaistuihin artikkeleihin. Ihan samat säännöt pätevät siis LLM-tuotoksiin kuin kaikkeen muuhunkin internetissä julkaistuun: vasta kun löydetty tieto on varmennettu riittävän monesta uskottavasta lähteestä, voidaan sitä pitää faktana.

Koneoppimismallit ovat jo nyt keskeisessä roolissa ihan jokaisen elämässä, tiesimme sitä tai emme. Olisikin hyvä, että perehtyisimme ainakin pintapuolisesti siihen, mistä ilmiössä on oikeasti kyse, etenkin jotta ylipaisuteltu tekoälyhypetys ei valtaa liikaa alaa. Toimiva ja viihdyttävä tapa tutustua ”tekoälyn”saloihin on Helsingin yliopiston ja Reaktorin laatima erinomainen verkkokurssi Elements of AI, jonka voi suorittaa vaikka työmatkoilla ja kahvitauoilla.

Tekoälyyn liittyy myös monenlaisia eettisiä kysymyksiä tekijänoikeudesta syvällisiin filosofisiin kysymyksiin elämän ja tietoisuuden perustasta. Ja vaikka sanana ”tekoäly” onkin nykyteknologian valossa vielä ainakin toistaiseksi harhaanjohtava, jo olemassa oleville koneoppimismalleille on toinen toistaan häkellyttävämpiä sovelluksia, ja uusia tulee nyt melkein viikoittain.

Näistä kysymyksistä lisää juttusarjan seuraavissa osissa.