Ainhize Barrainkua Agirre: "Oso garrantzitsua da algoritmoen iragarpenak kritikoki aztertzea"

2024ko azaroaren 28a

Ainhize Barrainkua Agirre: "Oso garrantzitsua da algoritmoen iragarpenak kritikoki aztertzea"

Bere tesiaren nondik norakoak labur azaldu zizkigun Ainhize Barrainkua Agirrek (Aretxabaleta, 1997) Txiotesia lehiaketan "Ziurgabetasunaren modelizazioa barneratzen ekitate algoritmikoaren arloko metodologietan" ekarpenarekin. Gradu bikoitza du Fisikan eta Ingeniaritza Elektronikoan (EHU) eta Konputazio Ingeniaritza eta Sistema Adimenduetan Masterra (EHU). Doktoregaia da Ingeniaritza Informatikoan (EHUko InformatikaFakultateko doktorego-eskolan) eta Basque Center for Applied Mathematics-en (BCAM) egiten du lan, tesia egiten. Bere ikerketa sakonago ezagutzeko izan gara berarekin.

Fisika eta Ingeniaritza Elektronikoa ikasi eta doktoretza egitea erabaki zenuen gero. Zergatik Fisika eta Ingeniaritza Elektronikoa? Zergatik ikerketa?

Batxilergoko 2. mailan izugarri gustatu zitzaidan Fisikaren arloa, eta ikasi genuenari buruz gehiago ikasi eta sakondu nahi nuen. Gradu bikoitza egiteko aukera zegoela ikusi nuenean, aukera oso polita iruditu zitzaidan interesatzen zitzaidan beste arlo bati buruz ere ikasteko aldi berean. Arlo oso ezberdinak daude gradu horietan, baino guztiek dute amankomunean gauza bat: tresna matematikoak erabiltzea errealitateko arazo bat ahalik eta egokien deskribatu eta soluzio bat aurkitzeko. Eta niri beti piztu dit interesa horrek: matematika erabiltzea errealitate (askotan konplexu) bat deskribatzeko, eta tresna horiek eskaintzen dituzten abantailez baliatzea, errealitate hori hobeto ulertzeko. Eduki teorikoez gain, ikasketa horiek asko lagundu didate intuizioa eta kritikotasuna lantzen. Gainera beti gustatu izan zait asko irakurtzea eta idaztea. Beraz, ikerketa-ibilbidea aukeratu izana dator, batetik, kuriositatea sortzen didaten gaiei buruz ikasten jarraitzeko nahitik, eta bestetik, gustura egiten ditudan ekintzez gozatzen jarraitzekotik.

Algoritmoak dituzu ikergai. Nola sortu da aukera?

Konputazio Ingeniaritza eta Sistema Adimenduen Masterra egiten ari nintzela entzun nuen lehenengoz Basque Center for Applied Mathematics-i (BCAM) buruz, eta interes handia piztu zidaten bertako ikerketa-proiektuek. Master-amaierako lana amaitzen ari nintzela, lan horretan zuzendari nuenaren bitartez jakin nuen BCAMen ikerketa-talde berri bat sortzen ari zirela algoritmoen fidagarritasuna eta gizartean izan dezaketen inpaktua aztertzen jardungo zuena eta, horri lotuta, tesi baterako proiektu bat aterako zela. Proiektua izugarri gustatu zitzaidan, niri asko interesatzen zaizkidan gai sozialak perspektiba matematiko batetik lantzeko aukera berezi bat baitzen. Eta horrela amaitu nuen neure burua proiektu horretara aurkezten. Azkenean, hautaketa-prozesu baten ondoren, tesi-proiektu hori esleitu zidaten, eta ordutik nabil gai horretan murgilduta lanean.

Algoritmoz inguratuta bizi gara...

Bai, edonon daude: sare sozialetan, osasungintzan, hezkuntzan, ekonomian, administrazioan... Egunerokotasuneko ataza askotan laguntza handia eskain dezakete. Adibidez, algoritmoek zehaztasun handiz azter ditzakete irudi medikoak (X izpiak, erresonantzia magnetikoa, etab.) eta minbizia eta beste gaixotasun larri batzuk mediku batek baino bizkorrago detektatu, giza begi batentzat antzeman ezinak diren xehetasunak antzemateko gai izan daitezkeelako. Ataza horietako askotan iragarpenaren subjektua gizakiok izan ohi garenez, algoritmo hauen iragarpenek eragin zuzena daukate gure bizitzetan. Horregatik da oso garrantzitsua algoritmoen iragarpenak kritikoki aztertzea.

... eta gizartean errotuta dauden jarrera diskriminatzaileak algoritmoetara ere transmititzen direla diozu.

Algoritmoak funtzio matematikoak dira, datuekin entrenatzen direnak helburu bat betetzeko. Orokorrean, helburu hori entrenatzeko erabilgarri dauden datu horietara ahalik eta egokien doitzea izan ohi da. Gure gizartean instituzio eta joera arrazista, matxista, homofoboak baldin badaude, ezinbestean islatuko dira gizakioi buruzko datuetan. Beraz, algoritmoak datu horietara doitzeko entrenatzen baditugu, beren iragarpenek ezinbestean islatuko dituzte joera arrazista, matxista, homofobo horiek.

Nola neurtu jarrera hori matematikoki?

Galdera hori ikerketa-arlo honetako galdera garrantzitsuenetako bat da, oraindik asko eztabaidatzen dena, eta ez dauka erantzun bakar bat... Komunitate zientifikoak definizio matematiko ezberdinak proposatu ditu jarrera hori neurtzeko, bakoitzak perspektiba ezberdin bat eskaintzen duelarik. Orokorrean, definizio horiek bi taldetan multzokatzen dira: definizio indibidualak eta taldekako definizioak. Definizio indibidualen helburua da aztertzea ea antzekoak diren pertsonak tratu antzekoa ari diren jasotzen algoritmoarengandik. Baina, nork eta nola erabakitzen du zer den bi pertsona antzekoak izatea, jakinik bakoitza egoera sozioekonomiko oso ezberdin batetik etor daitekeela? Horra hor definizio mota horren mugapen garrantzitsuenetako bat. Gainera, definizio indibidualak ez dira oso efizienteak konputazionalki. Azken mugapen horren harira, taldekako definizioak alternatiba efizienteago bat eskaintzen dute. Taldekako definizioek begiratzen dute ea algoritmoaren errendimendua antzekoa den talde ezberdinentzat. Talde ezberdinentzat errendimendu ezberdina aurkezten badu, horrek adierazten du ez dagoela talde guztientzat berdin doitua, eta errendimendu-tarte horrek kuantifikatzen du ekitate faltaren neurria. Errendimendua metrika oso ezberdinen bitartez neur daiteke, eta bakoitzarekin talde-definizio ezberdin bat zehazten da. Beraz, 20 talde-definizio baino gehiago daude, bakoitzak izaera ekitatibo edo justuaren perspektiba bat deskribatzen duelarik. Hori gutxi balitz bezala, elkarrekiko esklusiboak izan ohi dira talde-definizioak: hau da, definizio bat betetzeak ezinbestean dakar beste bat ez betetzea... Praktikan, algoritmoen jarrera potentzialki diskriminatorioa neurtzeko erabiltzen den metrika atazaren ezaugarrien (sozialak, legalak, etikoak...) arabera erabakitzen da.

Azken finean, ekitatea gisako kontzeptu orokor batentzat baliokidea den definizio matematiko bat proposatzea ez da batere tribiala. Gainera, gizartean ere, denok ez gatoz bat erabakitzeko orduan zer den justua edo ekitatiboa...

Galdera horrek, beraz, zabalik jarraitzen du; eta badirudi horrela jarraituko duela denbora batez bederen. Baina horregatik da, baita ere, horren interesgarria eta beharrezkoa mahai gainera ateratzea... Bestalde, argi erakusten du ekitate algoritmikoaren analisiak multidiziplinarra izan behar duela, ikerketa-eremu ezberdinetan aritzen diren pertsonak batuz: soziologoak, filosofoak, zuzenbidean adituak, matematikariak, informatikariak, giza eskubideen aldeko ekintzaileak, artistak, etab.

Eta nola zuzendu jarrera diskriminatzailea duten algoritmoak?

Komunitate zientifikoak metodologia ugari proposatu ditu onartezinak diren jarrera horiek zuzentzeko helburuarekin, eta hiru multzo nagusitan banatzen dira. Batetik, aurre-prozesamenduko teknikak daude, datuek kodifikatzen duten informazioari diskriminazioaren eragina ezabatzea helburu dutenak. Horrela, algoritmoa joera onartezin horietatik garbi diren datuetan entrenatzen bada, ez dira iragarpen algoritmikoetara transmitituko. Bigarren taldeko metodoek algoritmoaren entrenamendua modifikatzen dute, entrenatzen ari diren bitartean joera onartezinik hartu ez dezaten oinordetzan. Hori lortzeko, entrenamenduko helburua modifikatu ohi da datuetara egoki doitzeaz gain, definitutako nozio etikoak (lehen aipatu ditugun definizio indibidual eta taldekakoak) bete ditzan. Azkenik, post-prozesamenduko teknikak daude, zeintzuek iragarpen algoritmikoak modifikatzen dituzten, azken iragarpenak justuagoak izateko.

Zeintzuk dira erronka nagusiak?

Esango nuke gaur egungo erronka nagusietako bat dela teorikoki garatu diren eta soilik baldintza idealetan jardun dezaketen tekniketatik abiatuz, errealitateko baldintza ez-idealetan aplika daitezkeen metodologiak garatzea. Esaterako, teknika gehientsuenek beharrezkoa dute pertsona guztien generoa, arraza edota orientazio sexuala jakitea, generoan, arrazan edota orientazio sexualean oinarritutako joera diskriminatzaileak zuzendu edo antzemateko. Baina, informazio hori batzea legez kontrakoa izan daiteke. Edo norbaitek erabaki dezake informazio hori ez ematea. Beraz, ezinbestekoa da informazio hori falta delarik ere, jarrera diskriminatzailerik izango ez duten algoritmoak eraikitzeko metodoak garatzea. Bestalde, teknika gehienek marko estatiko bat asumitzen dute, baina, errealitatea dinamikoa da, gizartea etengabe ari baita aldatzen. Horrenbestez, dinamika horiek aintzat hartu behar dituzte proposatutako soluzioek, errealitatean aplikagarriak eta bideragarriak izango badira.

Txiotesian parte hartu zenuen. Zer-nolako esperientzia izan zen?

Oso esperientzia polita izan zen eta ariketa interesgarria iruditu zitzaidan neure buruarekiko ere... Garrantzi handikoa iruditzen zait norberak ikasitako kontzeptu eta metodo teknikoak tonu dibulgatibo batean azaltzeko gai izatea. Gizarteko kide guztion artean ezagutza libreki partekatzea oso aberasgarria izateaz gain, beharrezkoa ere badela iruditzen zait gizarte askeago eta justuago bat eraikiko badugu. Horregatik, Txiotesia oso aukera berezia da egunerokotasunean egiten dugun lana komunitatearekin partekatzeko. Gainera, azalpena perspektiba sortzaile batetik egitea oso polita iruditzen zait, eta asko disfrutatu nuen.

Zeintzuk dira esku artean dituzun erronkak?

Momentu honetan, nire tesiko azken proiektua izango dena ari naiz garatzen. Lan horretan, aurrez aipaturiko gizartearen izaera dinamiko horretan oinarritzen gara; zehazki, algoritmoen iragarpenek gizartearen dinamikan daukaten eraginean. Izan ere, ikusi da, sistema algoritmiko askok egiten dituzten iragarpenen arabera, boterea daukatela gizartea modu batera edo bestera eraldatzeko. Esaterako, musika entzun edo bideoak ikusteko online plataformek dituzten gomendio-algoritmoek gaitasuna daukate beren erabiltzaileak produktu konkretu batzuk kontsumitzera gidatzeko, horrela gizartearen kontsumo-patroiak interes jakin batzuen arabera eraldatuz. Edota, badago beste adibide garrantzitsu bat bankaren kasuan. Bankuan badituzte algoritmo batzuk kreditu bat eskatzeko orduan ez itzultzeko daukazun probabilitatea iragartzen dutenak. Probabilitate hori handia baldin bada, kreditua askoz ere interes handiagoan eskaintzen da, eta ondorioz, norbanakoak zailtasun gehiago ditu zor duen dirua bueltatzeko. Hau da, iragarritako probabilitatea zenbat eta handiagoa izan, handiagoa da zorra ez itzultzeko benetako probabilitatea. Horrela, agian interes txikiagoarekin zor duen dirua bueltatzeko gai dena, ez-gai bihurtu daiteke. Horrenbestez, algoritmoaren iragarpenak indibiduoak dirua itzultzeko zuen gaitasuna aldatu du, bere iragarpen propioak egiazkotuz. Beraz, algoritmoen iragarpenek norbanakoen ezaugarriak moldatu ditzakete, interesatzen zaien norabidean, beren joera propioak berretsiz. Horren ondorioz, berrelikadura-begiztak sor daitezke, algoritmoak bere joera diskriminatzaileak justifikatzen dituelarik (iragarpenarekin asmatu duelako, nahiz eta iragarpena erabat diskriminatzailea izan), jatorrizko diskriminazioa areagotuz. Garrantzi izugarria duen arazo honen aurrean, eta aintzat harturik algoritmoen iragarpenek gizartea moldatzeko gaitasuna dutela, gure helburua da gaitasun horretaz baliatzea gizartea egoera justuago batera bultzatzeko. Hau da, gizartean negatiboki beharrean positiboki eragingo duen algoritmo bat eraikitzen ari gara.

Jakintza-arloak