Tekoälyn kehityksen hidastuminen antaa tilaa ymmärtää käynnissä olevaa murrosta

Viime kuukausina generatiivisen tekoälyn kehittyminen on hidastunut selvästi. Koko viime vuoden kestänyt lähes viikottainen muutosvauhti näyttäisi nyt ainakin hetkeksi helpottaneen.

Siinä, missä vielä viime marraskuuhun asti uusia läpimurtoja tuli kuukausittain tai jopa viikoittain, lähtien kevään OpenAI:n GPT4-kielimallista, Midjourneyn fotorealistisesta 5. versiosta ja päättyen loppuvuoden Rabbitin ja Humanen tekoälyvimpaimiin ja GPT:n integroituun versioon, ovat tämän vuoden uudistukset koskeneet lähinnä sitä, kuinka kilpailukykyisiä Anthropicin, Inflectionin ja Googlen kielimallit ovat GPT4:n kanssa. Suurin alkuvuoden aikana tapahtunut generatiivisen tekoälyn läpimurto on Sunon itsessään erittäin vaikuttava musiikintekoalusta. Musiikki on kuitenkin ainakin toistaiseksi marginaalinen generatiivisen tekoälyn sovellusala verrattuna teksti- ja kuvaratkaisuihin.

Tämä hidastuminen on saanut monet tekoälykriitikot iloitsemaan. Onpa jopa puhuttu siitäkin, että viime vuonna toivottu kuuden kuukauden tauko tekoälyteknologian kehityksessä on sittenkin toteutunut, tosin tässä tapauksessa vain siksi, että teknologian kehittyminen on usein äkkiväärää ja yllättävää. Monet ovat myös rientäneet julistamaan koko generatiivisen tekoälyn kuplaksi. Missä ovat ne kymmenien prosenttien tuottavuushyödyt, joita viime vuoden tutkimuspaperit ovat lupailleet? Missä on tietotyön murros?

Tosi asiassa se, että joka viikko ei ole luvassa uutta lelua on tekoälyn käyttöönoton kannalta hyvä juttu.

Generatiivinen tekoäly, ja erityisesti suuriin kielimalleihin perustuvat ratkaisut, ei ole mikään taikaluoti, joka muuttaa kaiken yhdessä yössä. Siitä huolimatta kyseessä on läpimurtoteknologia, jonka jo nyt saatavilla olevat ratkaisut mahdollistavat sellaisia käyttötarkoituksia, jotka vielä pari vuotta sitten olisivat olleet tieteisfiktiota. Olisi oikeastaan ihan toivottavaa, että hypetys tekoälyn ympärillä helpottaisi hieman – jotta pääsisimme ihan normaalissa arjessa tutustumaan ja integroimaan näitä ratkaisuja osaksi työtämme.

Olennaisinta uusien työkalujen ja menetelmien käyttöönotossa on tunnistaa, mihin ne soveltuvat. Kuten Wharton-professori Ethan Mollick on kirjoittanut, tekoälyn käyttösovellukset sijoittuvat sahalaitaisen rajan molemmin puolin: joissain käyttötarkoituksissa tekoäly voi jopa heikentää työn tuloksia. Kielimallit eivät toimi hakukoneina, mutta ne ovat loistavia sparrailussa. Ne eivät ole luotettavia kvantitatiivisessa analyysissa, mutta kvalitatiivisessa analyysissa niistä voi olla paljon hyötyä. Kielimallien merkittävä vahvuus on erilaisten tekstien tiivistäminen ja muuntaminen. Kielimallin avulla voi tiivistää tieteellisen artikkelin pääkohdat ja pyytää opettamaan sen sisällön kuin 8-vuotiaalle. Sen avulla voi myös muuttaa esimerkiksi tieteellisen tekstin lähdeluettelon formaatin erilaiseksi – pelkästään tämä yksi ominaisuus säästää tutkijoiden työaikaa tuntikaupalla kuukaudessa.

Tavallaan tekoälyä koskeva hypetys on turhaa. Näissä vimpaimissa riittää ihmeteltävää jo sellaisina kuin ne nyt ovat.

Tekoälyn pikaopas: Näin käytät tekoälyä tietotyössä

Tekoälyratkaisut kehittyvät tällä hetkellä ällistyttävällä nopeudella. Uusia ratkaisuja julkistetaan jatkuvasti ja myös olemassa olevia ratkaisuja päivitetään hurjaa vauhtia. Tätä kirjoitettaessa esimerkiksi ChatGPT:n kehittäjä OpenAI on aivan hiljattain julkistanut ChatGPT:n monisyötteisen (eng. multimodal) version. Toisin sanoen, jo hyvin pian ChatGPT pystyy luultavasti tulkitsemaan tekstin lisäksi myös kuva- ja äänisyötteitä. Samaten OpenAI on julkistanut myös uuden Dall-E 3 -kuvatekoälyn ja jos sen todellisuus vastaa nyt esiteltyjä demovideoita, on hyvin todennäköistä, että Dall-E 3 syrjäyttää pian Midjourneyn kuvanluontipalveluiden johtopaikalta.

Ylivoimaisesti tekoälykenttää dominoivan OpenAI:n ohella myös Google on kehittänyt omaa kielimallitekoälyään Bardia eteenpäin, ja vaikka se ei vielä pärjääkään ChatGPT:lle, paranee sekin koko ajan. Microsoft on puolestaan kiiruhtamassa julkaisemaan Co-Pilot -ominaisuuden lähiaikoina laajasti Office-ohjelmistoihin, jolloin GPT-pohjainen teknologia tulee saumattomasti osaksi muun muassa Wordia, Exceliä ja PowerPointia. Samaten Facebook on myös ilmoittanut liittävänsä tekoälyn osaksi kaikkia palveluitaan. On siis täysin mahdollista, että nyt ilmestyneen Tekoälyn pikaoppaan seuraava versio ilmestyy jo aivan muutaman viikon kuluttua kun hiljattain julkistetut uutuusratkaisut tulevat saataville.

Mediassa esiintyy paljon tekoälyyn liittyvää pelottelua. Kaksi yleisintä lööppimagneettia ovat väitteet siitä, että tekoäly vie pian työt sekä siitä, että robotit valtaavat kohta maailman. Kumpikaan väite ei pidä paikkaansa. 

Ensinnäkin, vaikka automaatioteknologiat muokkaavat työskentelytapoja, ne korvaavat ani harvoin ihmisen kokonaan. Professori James Bessenin 2016 julkaistussa paperissa esitetään, että vuoden 1950 USA:n väestönlaskennassa tunnistetuista työpaikoista vain yksi on korvattu täysin automaatiolla: hissioperaattori.

Sen sijaan automaatioteknologia muuttaa työn tekemisen tapaa, ja tässä näemme jo nyt radikaaleimmat muutokset. Berkeley-professori Jacob Steinhardtin mukaan on mahdollista, että GPT-johdannaiset tekoälyratkaisut auttavat ihmisiä tekemään jopa 9 miljoonaa henkilötyövuotta vuodessa vuoteen 2030 mennessä. Tuottavuusloikkia ei kuitenkaan tarvitse odottaa ensi vuosikymmenelle. Harvardin ja Boston Consulting Groupin mukaan konsulttien työn tuottavuus nousi soveltuvissa tehtävissä 17–43% kun käytössä oli GPT4-kielimalli. MIT:n, Microsoftin ja Githubin tutkimuksessa puolestaan kävi ilmi, että ohjelmoijat kirjoittivat koodia 55.8% nopeammin Github Co-Pilot -tekoälyn kanssa kuin ilman sitä.

Tässä on tekoälyn suurin mahdollisuus, ja tämä mahdollisuus ei ole tieteiskirjallisuutta vaan täyttä totta juuri nyt, esimerkiksi Tekoälyn pikaoppaassa kuvatuilla tekniikoilla. 

Toinen median viljelemä pelkokuva liittyy koneiden vallankumoukseen. Tekoälykirjallisuudessa puhutaan kolmesta erilaisesta tekoälystä: kapeasta tekoälystä (eng. artificial narrow intelligence, ANI), yleisestä tekoälystä (eng. artificial general intelligence, AGI) sekä supertekoälystä (eng. artificial superintelligence, ASI). 

Kaikki tällä hetkellä käytössä olevat tekoälyratkaisut ovat kapeita tekoälyratkaisuja. Toisin sanoen, ne toimivat ainoastaan niille määritellyssä tehtäväkentässä, ja mikä keskeisintä, ne eivät kykene itsenäiseen päätöksentekemiseen. Vaikka ChatGPT vaikuttaa keskusteluissa usein aavemaisen inhimilliseltä, se ei tee yhtikäs mitään ellei siltä sitä erikseen pyydä. Täläl hetkellä siis kaikki AGI- ja ASI-ratkaisut ovat yhä puhdasta tieteiskirjallisuutta ja voivat olla sitä pitkään.

Toki huomioiden nykyisen teknologian kehityksen on myös mahdollista, että esimerkiksi AGI-ratkaisuja alkaa ilmestyä hyvinkin pian. Tästä syystä on erityisen tärkeää, että tekoälyn kehitystä säännellään riittävän älykkäästi mutta kuitenkin niin, että sen kehitystä ei pysäytetä etenkään niissä paikoissa, joissa tekoälyä pyritään kehittämään eettisesti. Jos AGI- tai ASI-ratkaisut ovat ylipäätään mahdollisia, ne tullaan jossain vaiheessa toteuttamaan. Olennainen kysymys on, toteuttaako ne ainakin toistaiseksi hyvin eettisesti toiminut OpenAI vai esimerkiksi pimeässä verkossa toimivat kyberrikolliset. Tässä keskeistä on sääntely, eettisten reunaehtojen kirkastaminen ja tekoälyn hallittu mutta riittävän nopea kehittäminen etenkin eettisen vastuun kantavien toimijoiden toimesta.

Supertekoälyt ovat ainakin toistaiseksi ihan puhdasta tieteisfiktiota. Generatiiviset tekoälyt sen sijaan ovat täällä, ja ne voivat auttaa meitä jo tänään tekemään työstämme monin verroin tehokkaampaa. Keskeisin huomio tässä on se, että mikään ei pakota sinua ulkoistamaan työtäsi tekoälylle – mutta voit ulkoistaa sille jo nyt monia sellaisia tehtäviä, joita et joko halua tai osaa tehdä. Vaikka olen itse ChatGPT-tehokäyttäjä, en ole käyttänyt tämän tekstin laatimiseen tekoälyä millään tavalla siksi, että nautin itse kirjoitustyöstä niin paljon. Minulla ei sen sijaan ole kummoisiakaan kuvittajankykyjä, ja siksi on valtavan innostavaa, että Tekoälyn pikaoppaan kuvituksesta on vastannut huikea Midjourney.

Generatiivinen tekoäly tarjoaa meille ennen kaikkea aivan huikean mahdollisuuden keskittyä työssämme juuri niihin tehtäviin, joista nautimme ja joissa olemme taitavia. Tulevaisuuden työ voikin hyvin olla innostavaa työtä, jossa ihminen ja tekoäly työskentelevät saumattomasti yhdessä.

Ja tämä tulevaisuus on täällä nyt.

Teksti on ote 1.10. ilmestyneestä oppaasta Tekoälyn pikaopas – Näin käytät tekoälyä tietotyössä. Opasta päivitetään taajaan sitä mukaa kun uusia tekoälyratkaisuja ilmestyy. Lataa maksuton opas täältä.

Tekoäly on täällä, osa 3/3: Miten käytät tekoälyä sujuvasti ja turvallisesti?

Tekoäly, eli erilaiset koneoppimismalleihin perustuvat ratkaisut, on vaikuttanut jo pitkään monien yhteiskunnan toimintojen taustalla. Viimeistään viime syksynä nämä ratkaisut nousivat myös suuren yleisön tietoisuuteen ennen kaikkea OpenAI:n kehittämän GPT-3 kielimallin läpimurron kautta.

Erilaisia tekoälyratkaisuja syntyy nyt kuin sieniä sateella. Niiden avulla on mahdollista tehdä ällistyttäviä asioita, jotka vielä vuosi sitten olisivat tuntuneet tieteiskirjallisuudelta. Tekoälyn käyttöön liittyy kuitenkin myös reunaehtoja ja haasteita. Niitä tuntemattomalle voi riskinä olla esimerkiksi epätiedon lisääminen tai tekijänoikeuksien loukkaaminen.

Ehkä tunnetuin tekoälyratkaisu on OpenAI:n chatbotti ChatGPT. Vekotin kykenee käymään sujuvaa keskustelua ja viittaamaan edellisiin kysymyksiin ja vastauksiin hämmentävän hyvin. ChatGPT:n avulla on mahdollista synnyttää uutta tekstiä runoista tarinanpätkiin, markkinointitekstistä akateemisiin tutkielmiin. Se auttaa tiivistämään olemassa olevaa tekstiä, luokittelee isojakin aineistoja pääkategorioihin, synnyttää toimivaa tietokonekoodia tai korjaa toimimattomia koodinpätkiä.

Fiktiivisen sisällön osalta haasteena on, että ChatGPT saattaa tulostaa tekijänoikeuden alaista tekstiä. Siksi tekoälyn synnyttämä teksti kannattaa syöttää Googleen tai Google Booksiin ja katsoa, osuuko se lähelle jo olemassa olevaa. Tiedonhaussa ChatGPT:n suurin haaste on puolestaan, että vaikka se antaa aika ajoin häkellyttävän seikkaperäisiä vastauksia kysymyksiin, joiden ratkaisemiseen menisi googlaamalla tuntikaupalla aikaa, se myös usein keksii ihan tuulesta temmattuja vastauksia – mutta ilmaisee ne samalla itsevarmuudella kuin totuudenmukaisetkin faktatiedot. Jos siis käytät ChatGPT:tä mihinkään faktapohjaiseen tekstinsynnyttämiseen, kannattaa joka ikinen fakta ja viite varmentaa luotettavista lähteistä. Vaikka vekotin kehittääkin usein esimerkiksi viitteet tai verkko-osoitteet ihan omasta päästään, syöttämällä ne esimerkiksi Google Scholariin saatat löytää kuitenkin todella käyttökelpoisia artikkeliviittauksia – ne vain eivät yleensä ole ihan sitä, mitä tekoäly väitti.

Kokemus osoittaa kuitenkin, että ChatGPT:n käytössä joka ikinen väitetty tosiseikka pitää varmistaa luotettavasta lähteestä.

Toinen OpenAI:n läpimurtotuote on kuvageneraattori Dall-E 2. Dall-E:n lisäksi voit kokeilla myös loistavaa MidJourney:tä, tosin sen tuotoksia ei voi käyttää kaupallisiin tarkoituksiin ilman maksullista tilausta. Syöttämällä kuvittajatekoälylle mitä mielikuvituksellisimpa syötteitä pystyt kehittämään kuvitusta diaesityksistä kirjan kansiin tai vaikka rakentamaan kokonaan oman sarjakuvan. Tässä haasteita on kolme. Ensinnäkin, tekoälyn piirtämissä kuvissa on yhä ajoittain hämmentäviä yksityiskohtia kuusisormisista ihmisistä erikoisiin perspektiiviratkaisuihin. Siksi tekoälyn tuottamat kuvat kannattaakin syynätä erityisen tarkasti ja tarvittaessa korjata outoudet esimerkiksi Photoshopissa. Toiseksi, kuvatekoäly ei osaa piirtää tekstiä, joten tekstisisältöjä siltä ei kannata pyytää, vaan ne pitää lisätä piirrettyyn kuvaan jälkikäteen. Ja kolmanneksi, kuten tekstin luomisessa, myös kuvatekoälyissä on pieni riski, että tarjottu kuva on niin lähellä jotain tekoälyn lähdemateriaaleista, että kuva loukkaa tekijänoikeuksia. Etenkin kaupallisessa käytössä jokainen kuva kannattaakin syöttää ainakin Googlen käännettyyn kuvahakuun, jotta saat selkeimmät plagiaatit sulkeistettua pois.

Tekoälyn avulla voit myös luoda sujuvaa puhetta tekstistä esimerkiksi Eleven Labsin avulla. Riffusion mahdollistaa hämmentävän tempun, jossa kääntämällä tekstisyötteestä generoitua spektrogrammia ääneksi voit generoida ääni- ja musiikkipätkiä laidasta laitaan, jos kohta äänenlaatu onkin aika heikko. Soundful puolestaan hyödyntää olemassa olevia ääninäytteitä musiikin luomisessa, ja voi kehittää kokonaisia kappaleitakin. Ja kuten jo aiemmin totesin, uusia ratkaisuja tulee nyt jatkuvasti lisää. Kattavan valikoiman tekstintuottamisesta editointiin, presentaatioiden suunnittelusta videoratkaisuihin löydät All Things AI -sivulta.

Tekoälyratkaisut ovat nyt lyöneet läpi ennennäkemättömällä laajuudella ja ne haastavat jo monien toimialojen tekemistä. Samalla ne mahdollistavat ihan uudenlaista luovaa ja suorittavaa työtä, ja ovat jo synnyttämässä uudenlaisia ammattialoja kuten syötesuunnittelijat (eng. prompt engineer), joiden työnä on löytää asiakastarpeeseen toimivimmat tekoälysyötteet.

Seuraavat harppaukset voivat olla jo näköpiirissä tai voi olla, että niitä saadaan odottaa yllättävänkin pitkään.

Toistaiseksi tekoäly ei ole kuitenkaan vielä kokonaan korvaamassa ihmistä millään toimialalla, mutta tekemisen luonnetta se on muuttanut jo nyt peruuttamattomasti. Koska kyse ei kuitenkaan ole ainakaan vielä – ja mahdollisesti koskaan – itsenäisesti ajattelevista ratkaisuista, olisi osuvampi nimeke nykyisille koneoppimisratkaisuille tekoälyn sijaan esimerkiksi Pekka Ala-Pietilän esittämä tukiäly.

Tukiälyratkaisujen avulla voimme nostaa ajattelumme ja luovan kyvykkyyden uudelle tasolle, kunhan tunnemme myös niihin liittyvät haasteet ja opettelemme käyttämään ratkaisuja yhdessä muiden olemassa olevien tietojärjestelmien kanssa toimivien lopputulosten synnyttämiseksi.