Kiiru

MM-kisojen tekoäly nojaa näkymättömään datatyöhön

Anturipallo ja automaattiset paitsiopäätökset näyttävät koneen työltä. Todellisuudessa tuhannet datatyöntekijät merkitsevät otteludataa noin 60 eurolla per peli.

Kalle Lamminpää ·

Paperikollaasi: vaaleansininen ihmishahmo istuu kumartuneena ruudun ääressä, jossa näkyy vihreä jalkapallokenttä navynsävyisin merkein. Ruudusta leijuu oikealle terracotta- ja navynväristen paperilappujen parvi kohti amber-aurinkoa.

Riolainen Adam katsoo paikallista jalkapallo-ottelua tietokoneen ruudulta ja tekee samaa kuin tuhannet muut hänen kaltaisensa eri puolilla maailmaa juuri nyt: hän merkitsee jokaisen syötön, taklauksen ja laukauksen sitä mukaa kun ne tapahtuvat. Yhdestä ottelusta hän saa noin 60 euroa, päälle matkakulut. Adam tietää, mihin hänen koodaamansa data päätyy. “He tarvitsevat reaaliaikaista dataa säätääkseen kertoimiaan kesken ottelun odottamatta virallista raporttia”, hän kertoo Rest of Worldille. Vastaanottaja on vedonlyöntiala.

Samaan aikaan jalkapallon maailmanmestaruuskisat esittelevät teknologiaa, joka näyttää tekevän tämän työn itsestään. Pelaajien kantamat anturit ja anturipallo seuraavat liikettä, paitsiopäätökset syntyvät puoliautomaattisesti, ja Rest of Worldin mukaan jokaisella turnauksen 48 joukkueesta on käytössään oma tekoälyavustaja. Esitys on viimeistelty näyttämään siltä, että kone hoitaa kaiken itse. Niin ei ole. Jokainen tilasto, jolla analyytikot ja vedonlyöntiyhtiöt rakentavat malleja, lähtee liikkeelle siitä, että ihminen istuu ruudun ääressä ja merkitsee tapahtumat käsin.

Käsityötä, jota kone ei tee yksin

Yhden ottelun aikana annotaattori voi merkitä jopa 3 000 tapahtumaa. Työ ei ole mekaanista klikkailua. Sen erottaminen, onko pelaajan kosketus harkittu syöttö vai harhautus, vaatii pelisilmää, eikä konetta ole laitettu hoitamaan sitä yksin. Tästä syystä monet annotaattorit ovat itse pelanneet. Manilalainen merkitsijä, joka pelaa Filippiinien liigassa, kertoi käyttäneensä yhteen otteluun kolmesta neljään tuntia.

Paperikollaasi: suuri terracottanvärinen jalkapallokenttä, jonka päälle on ripoteltu kymmeniä tummia paperipisteitä ja ohuita kynäviivoja niiden välille. Oikealta reunalta sinivalkoinen paperikäsi asettaa pisteiden joukkoon yhden kirkkaan amber-pisteen.

Lopputulos myydään urheiludatayhtiöille, jotka jalostavat siitä tilastot syötöistä, laukauksista ja taklauksista. Niitä ostavat seurat, televisiotuotannot ja vedonlyöntifirmat. Adamin kohdalla ketjun pää on selvä: data palvelee kertoimien säätöä reaaliajassa. Juuri reaaliaikaisuus tekee käsityöstä arvokasta vedonlyöntimarkkinoille. Kertoimet elävät ottelun aikana, ja se taho joka saa tapahtumat kirjatuksi nopeimmin, säätää myös hinnat ensimmäisenä. Pelaaja, joka aikoinaan oli itse kentällä, siirtyi näin ruudun taakse, näkyvistä datan tuottajaksi.

Toronton yliopiston mediatutkija Rafael Grohmann muistuttaa, että ilmiö on jalkapallossa vanha. “Jalkapallo on nojannut tällaiseen työhön paljon pidempään kuin nykyinen tekoälyinnostus on kestänyt”, hän sanoo. Uutta on lähinnä se, että työn ympärille on rakennettu tekoälyn kieli, joka tekee ihmisestä entistä huomaamattomamman.

Yhdeksän miljardin turnaus ja sen pohja

Raha kasautuu ketjun toiseen päähän. Rest of Worldin mukaan nykyisten MM-kisojen tuotto-odotus on noin yhdeksän miljardia dollaria, mikä tekisi siitä historian tuottoisimman urheiluturnauksen. Huipputason seurajalkapallon omistus on samaan aikaan keskittynyt: yli puolet Valioliigan seuroista on amerikkalaisten yksityishenkilöiden tai yhdysvaltalaisyhtiöiden enemmistöomistuksessa, ja Serie A:n joukkueista lähes puolta hallitsevat amerikkalaiset ja kanadalaiset. Datasta on tullut kilpailuetu, jota ostetaan: Forbesin listaamista 30 arvokkaimmasta seurasta 25 etsi avoimissa työpaikoissaan data-analytiikan tai data-engineeringin osaajia.

Tämän pyramidin pohjalla työ teetetään kaupungeissa, joihin sitä on ulkoistettu. Rest of Worldin haastattelemat merkitsijät työskentelivät Manilassa, Rio de Janeirossa, Kambodzassa, Kairossa, Chennaissa ja Ternopilissa. Sama logiikka toistuu laajemmin tekoälyteollisuudessa, jossa mallien kouluttamiseen tarvittava datan merkitseminen ohjautuu maihin, joissa työ on halpaa teettää. Kuvio on tuttu datakeskusten näkymättömästä infrastruktuurista ja alustatalouden työstä globaalissa etelässä.

Paperikollaasi: alarivissä useita pieniä sinivalkoisia paperihahmoja erillisillä terracottanvärisillä maapaloilla, kustakin nousee ohut kynäviiva, ja kaikki viivat yhtyvät oikeaan yläkulmaan kohti yhtä suurta tummaa tornimaista muotoa, jonka vieressä hehkuu amber-piste.

Palkat kertovat saman tarinan tarkemmin. Eco-Businessin selvityksen mukaan nigerialainen datatyöntekijä ansaitsi yhden alustan kautta 127 500 nairaa eli noin 274 dollaria kuukaudessa, mikä tarkoittaa noin 1,50 dollaria tunnilta. Selvityksen mukaan summa ylittää maan minimipalkan, mutta jää murto-osaan siitä, mitä sama työ maksaa rikkaissa maissa. Keniassa OpenAI:lle tehtyä datatyötä on maksettu alle kahdella dollarilla tunnilta. Filippiiniläinen John Anthony Abayari aloitti vuonna 2019 noin 218 dollarin kuukausipalkalla ja on kuudessa vuodessa kivunnut noin 40 000 pesoon kuukaudessa, mikä kertoo siitä että kokeneelle merkitsijälle työ voi tarjota jonkinlaisen uran. Kolmansien osapuolten kautta Intiassa palkka liikkuu 200 ja 300 dollarin välillä kuukaudessa, pienemmillä paikkakunnilla vähemmän.

“Työntekijät ovat tekoälyn arvoketjun pohjalla”, sanoo Urvashi Aneja, tutkimuskollektiivi Digital Futures Labin johtaja. Hän huomauttaa, että työ on usein epävarmaa ja henkisesti kuormittavaa, eikä se näy missään kohtaa valmista tuotetta.

Sama data myös Suomessa

Ketju ei pysähdy maailmanmestaruuskisoihin. Suomalainen jalkapalloanalyysi nojaa samaan käsin koottuun dataan: seurojen ja Palloliiton yleisin työkalu on italialainen Wyscout, jonka tilastot syntyvät siitä, että joku merkitsee jokaisen ottelun tapahtuman käsin. Data-analyytikko Axel Storbacka, joka on tehnyt työtä muun muassa SJK:lle, HIFK:lle ja TPS:lle ja tuottanut jalkapallografiikkaa Ylelle vuodesta 2021, on arvostellut Huuhkajien analyysin nojaamista pelkkään Wyscoutiin. “Pelkän Wyscout-analytiikan käyttäminen on kyllä red flag”, hän sanoo Apulle. Tarkempana pidettyä Statsbombia rajoittaa se, että dataa on saatavilla vasta vuodesta 2020.

Kun katsoja näkee ruudulla syöttötilaston tai laukausten ja taklausten määrät, kuva on viimeistelty näyttämään koneen tuottamalta. Niiden takana on kuitenkin tunteja jonkun käsityötä Manilassa, Riossa tai Kairossa, noin 60 eurolla ottelulta.

Mitä mieltä olit? Kiitos palautteesta.