Dobrodošli v novi dobi odkritij
Prelomni napredek v računalništvu je raziskovalcem nenadoma omogočil iskanje odgovorov na številna nova vprašanja in razvozlavanje starodavnih skrivnosti. V središču te revolucije je več zapletenih tehnologij: strojno učenje, napredni algoritmi, nevronske mreže, veliki jezikovni modeli. Ta orodja, ki jih uporabljajo pionirji, predstavljeni v tem članku, spreminjajo razumevanje planeta – in človekove predstave, kaj je mogoče doseči z rabo UI.
NEVROKIRURGIJA
Besedilo: Chris Gayomalli
Nanoporni sekvencer je napravica, ki stane 2000 dolarjev ali več – to je za medicino poceni, zato je obetaven za bolnišnice v državah v razvoju. Videti je kot spenjač in se prek USB-izhoda priključi na prenosni računalnik; z drugimi besedami, po videzu sploh ni kaka futurološka naprava. Deluje tako, da gre veriga DNK skozi membrano, v kateri so majhne luknjice ali nanopore. Vsaka od njih je povezana z elektrodo in tipalom, ki natančno zaznava prekinitve električnega toka v sistemu, ko se veriga pomika mimo luknjic. Rezultat je edinstven podpis – vsaka veriga je malce drugače “zavita”– ki ga je mogoče dekodirati v zaporedje baz. Pri tem lahko raziskovalci s sistemom Sturgeon ugotovijo, za katero vrsto raka gre.
Velika ovira, tako kot pri vseh programih za identifikacijo, ki uporabljajo UI, kot je denimo Googlovo povratno iskanje slik, je, da imamo opraviti z delčki nepopolnih podatkov, v tem primeru na molekularni ravni. De Ridder svoje delo rad opiše z nazornim primerom: “Če vam pokažem sliko slona, ali bo računalnik prepoznal, kaj je na sliki? To je preizkušnja za UI.” Recimo, da imate le odstotek slike, morda nekaj sivih pik na slonjem rilcu, preostalih 99 odstotkov pa je neznanih ali nerazločnih. “Ali lahko izdelamo UI, ki bo vseeno ugotovila, da je na sliki slon?” se sprašuje. “No, natanko takšno UI smo razvili. V bistvu počne to.”
Druga temeljna težava, zlasti pri otroških možganskih tumorjih, je, da bolnišnice obravnavajo morda manj kot sto primerov na leto, zato je na voljo razmeroma malo podatkov. Pri rabi UI potrebujemo podatkovno zbirko s tisoči primerov, da lahko program, kot je Sturgeon, sploh začnemo učiti za prepoznavanje tumorjev. (Primerjajte to s programom ChatGPT, ki se uči na podlagi milijard prosto dostopnih stavkov na spletu.) Kako uskladiti tako majhen vzorec s potrebo po neizmerno obsežnih podatkovnih zbirkah? Za de Ridderja in Topsa je to pomenilo, da se morata stvari lotiti ustvarjalno.
Podatke sta črpala iz vzorcev tumorjev, predstavljenih v že objavljenih raziskavah. A pomanjkanju se s tem nista izognila. “Imeli smo približno 3000 vzorcev,” pojasnjuje de Ridder. “Torej ne prav veliko.” Toda iz teh 3000 vzorcev so lahko izdelali simulacije za milijone edinstvenih sekvenc nanopor in jih uporabili za učenje Sturgeona – nekako tako, kot bi Neo iz filma Matrica v svoje možgane prenesel stoletja treninga kung fuja. “To smo naredili skupno 45-milijonkrat, da smo dobili dovolj obsežen nabor podatkov za učenje zelo zapletenih omrežij,” pravi de Ridder.
“In glej no, glej, kazalo je, da deluje.”
VESOLJE
Besedilo: Rebecca Boyle
Leta 2018 je začel Valizadegan s svojo skupino snovati program za strojno učenje, da bi pospešil lov na eksoplanete. Program so učili na podlagi podatkov, značilnih za potrjene planete, a tudi za lažno pozitivne, kot so dvojne zvezde, ki zatemnijo druga drugo in jih lahko zamenjamo za mimoidoči planet. Program so poimenovali ExoMiner in ga preizkusili na arhivu opazovanj Keplerjevega teleskopa. “Nisem vedel, kakšna nagrada nas čaka,” pravi Valizadegan. Njegov model je namreč hitro odkril 370 prej neznanih eksoplanetov. “Sprva je bilo zaznati veliko odpora med znanstveniki, ki preučujejo eksoplanete, saj niso verjeli, da gre res zanje. Toda sčasoma so postali zaupljivejši.” Pravi, da doslej niso zavrnili še nobenega ExoMinerjevega odkritja.
Nobeden od teh 370 novih planetov ni podoben Zemlji ali kateremukoli drugemu planetu v našem Osončju. Eden izmed novih svetov, poimenovan Kepler-495 c, je približno dvakrat večji od Zemlje; svojo zvezdo, podobno Soncu, obkroži z bliskovito hitrostjo, vsakih šest dni. Drugi, poimenovan Kepler-27 d, je skoraj tako velik kot Neptun ali približno osemkrat večji od Zemlje; ima leto, ki traja zgolj šest dni in pol. Ti planeti zaradi vročine in sevanja svojih zvezd verjetno niso primerni za življenje. Valizadegan pravi, da so z ExoMinerjem začeli uporabljati UI za reševanje te zapletene težave, podobne iskanju igle v kopici sena. Teleskopi nove generacije za lov na planete, ki bodo začeli delovati v prihodnjem desetletju, bodo zbrali še več svetlobe in tako videli še šibkejša telesa. Poteka tudi razvoj novih programov UI za iskanje planetov, ki gradijo na ExoMinerjevem uspehu. Raziskovalci zdaj menijo, da je UI lahko uporabna ne le pri iskanju novih svetov, temveč tudi pri iskanju razmer, v katerih bi bilo življenje najverjetneje mogoče.
ARHEOLOGIJA
Besedilo: David Montgomery
Spomladi 2023 je študent Luke Farritor med vožnjo na prakso, ki jo je opravljal v družbi SpaceX v središču Starbase v Teksasu, naletel na podkast, ki je takoj pritegnil njegovo pozornost. Gostitelji so predstavljali tekmovanje, katerega organizatorji so udeležencem zastavili drzno nalogo: prebrati 2000 let star zvitek, ne da bi ga fizično razvili.
Rokopis je sodil v zbirko pooglenelih papirusnih zvitkov, ki so ostali pokopani pod pepelom, ko je Vezuv ob izbruhu leta 79 n. š. uničil rimski mesti Pompeje in Herkulanej. Če bi zvitke razprli s prsti, bi razpadli v prah in sporočila na njih bi bila za vselej izgubljena. Tekmovalci, ki bi našli način, kako ob pomoči strojnega učenja pregledati vsebino zvitkov, naj bi si razdelili več kot milijon dolarjev denarne nagrade.
Farritor, študent računalništva, se je podnevi pri delu ukvarjal z vesoljskimi potovanji, večere in konce tedna pa je posvečal Vezuvovemu izzivu – to je nekoliko spominjalo na potovanje skozi čas. Kaj je pisalo na zvitku iz herkulanejske vile, katere lastnik naj bi bil tast Julija Cezarja? Da bi tekmovalci to ugotovili, bi morali razviti svoje lastne programe, sposobne interpretirati 3D-posnetke zvitka, ki so bili na voljo, in evidentirati komaj zaznavne fizikalne spremembe, na podlagi katerih bi bilo mogoče prepoznati zapis na zoglenelem gradivu.
Farritor je najprej preučil z računalniško tomografijo izdelane slike delov zvitkov, kjer črnila na osnovi ogljika ni bilo mogoče razločiti od zoglenelega papirusa. Neki drug tekmovalec (tekmovalci so dobili denarno nagrado, če so si izmenjavali začetne izsledke, do katerih so se dokopali pri delu) je opazil “razpokane” vzorce, ki so spominjali na posušeno blato, vendar bi lahko kazali na prisotnost črnila. Zato se je Farritor pri svojem modelu strojnega učenja osredotočil na iskanje razpok. Nekega poznega sobotnega večera v času, ko je znova študiral na Nebraški univerzi, je prejel sporočilo, da so za tekmovalce naložili še del zvitka. Ker je bil na zabavi, se je s telefonom prijavil na svoje namizje in zagnal model UI, ki ga je zasnoval, da bi obdelal novo sliko. Nekaj ur pozneje je pogledal na telefon in zagledal grške črke pi, omikron in ro, ki so se bleščale kot sporočilo izpred tisočletij.
“Občutek ob tem, da sem pravkar odkril tri črke v pisanju iz obdobja rimskega cesarstva, je bil neverjeten,” je dejal. “Prekipeval sem od navdušenja, prav tako vsi okoli mene. Takoj sem sporočil organizatorjem. Tudi mami sem poslal sporočilo.” Izkazalo se je, da so črke del grške besede za škrlat. Farritor je tako postal prvi človek, ki je uzrl besedo na zvitku, stoletja pokopanem pod več deset metri vulkanskega drobirja.
NARAVA
Besedilo: Anna Peele
Jörg Müller je vodja odseka za varstvo narave v Narodnem parku Bavarski gozd, najstarejšem nemškem narodnem parku, in predava ekologijo gozdov na Univerzi v Würzburgu. Toda raziskave so ga odpeljale na drugi konec sveta, v Južno Ameriko. Razvija novo vrsto “stetoskopa”, ki ob pomoči UI spremlja tropske ekosisteme, izkrčene zaradi kmetijstva. S sateliti in daljinskim zaznavanjem je razmeroma preprosto raziskovati ponoven razrast gozdnih krošenj. Veliko teže pa je ugotoviti, čez koliko časa se bo obnovila avtohtona biotska raznovrstnost – živali in rastline, ki živijo pod krošnjami. Müller sodeluje s statistiki, entomologi, ornitologi in domačini v Ekvadorju, da bi ugotovil, ali so sposobni prepoznati nekatere znake, ki bi lahko bili dokaz, da so prizadevanja za oživitev uspešna.
Leta 2021 je stopil v stik z Zuzano Buřivalovo, docentko na Wisconsinski univerzi v Madisonu, za katero pravi, da je “mlada vzhajajoča zvezda zvočne ekologije”. S sodelavci je razvila metodo rabe bioakustike; na podlagi zvokov, ki jih oddajajo živali, lahko oceni, koliko različnih vrst živi v gozdu. Müller in njegova skupina sta uporabila metodo Buřivalove in namestila snemalne naprave na več krajih v približno 200 kvadratnih kilometrov velikem pasu ekvadorskega gozda Chocó. Štirinajst dni zapored so zbirali podatke in pridobili za skoraj 2000 ur zvočne krajine.
Ptice so eden najboljših kazalnikov splošne vitalnosti tropskega ekosistema; če so si opomogle, potem gre po Müllerjevih besedah dobro tudi drugim vrstam pred njimi ali za njimi v prehranjevalni verigi, od jaguarjev do žuželk. Zato je pritegnil strokovnjaka za ptice Juana Freileja, avtorja knjige Ptice Ekvadorja, in Rudyja Gelisa, da sta na podlagi zvočnih posnetkov prepoznavala oglašanje ptic; dokumentirala sta več kot 300 vrst. Nato je zvočni posnetek primerjal z modelom UI, izurjenim za prepoznavanje 75 vrst, ki jih je vse “slišal” v zvočni pokrajini. Lahko je tudi približno določil njihovo številnost. Müllerju so se zdeli ti izsledki obetavni, saj so pokazali, da je lahko dosledno izurjena UI enako učinkovita kot človeški strokovnjaki – in veliko hitrejša – ter pomaga znanstvenikom pri spremljanju napredka pri obnovi gozdov.
Na podlagi ugotovitev strokovnjakov in UI napoveduje, da potrebuje deževni gozd, ki je bil izkrčen za kmetovanje, približno 55 let, da se v njem znova vzpostavi prvotna biotska pestrost.
SEIZMOLOGIJA
Besedilo: Robin George Andrews
Ker je v Kaliforniji toliko geološke aktivnosti in je tako temeljito pokrita s seizmometri, je bilo podatkov več, kot bi jih lahko strokovnjaki sami smiselno obdelali Poleg tega večina majhnih premikov ob prelomih povzroči majhne, neopazne potrese. Pri tem nastajajo tako neznatni potresni valovi, da jih celo najbolj vešč seizmolog težko opazi v seizmičnih podatkih, še zlasti, če so podobni hrupu človeških dejavnosti, kot je promet. Leta 2017 pa se je Rossu posvetilo. Videl je, kako programi za strojno učenje obdelujejo ogromne zbirke fotografij – prepoznavajo in kategorizirajo prvine na njih, in to veliko natančneje in hitreje, kot bi zmogli ljudje. Pomislil je, zakaj ne bi podobnega postopka uporabili tudi v seizmologiji.
Njegova prva tarča so bili ravno ti številni komaj zaznavni potresi. Čeprav so morda neškodljivi, to ne pomeni, da so nepomembni – njihovi valovi lahko razkrijejo vsak prelom, skozi katerega potujejo, tudi tiste nevarnejše in bolj obremenjene, ki lahko nekega dne popustijo in povzročijo katastrofo. S sodelavci je zbral podatke o potresnih valovih iz celotne Južne Kalifornije, ki so jih znanstveniki prepoznali kot prave potrese. Nato je pripravil kratke vzorce potresnega valovanja vsakega od teh potresov. Nazadnje je na podlagi seizmičnih podatkov sestavil algoritem, ki je podatke o potresih primerjal s temi vzorci in odkrival težko prepoznavne potrese. Algoritem je hitro prepoznal skoraj dva milijona prej skritih komaj zaznavnih potresov med letoma 2008 in 2017 – s tem pa se je razkrila zapletena mreža prelomov in njihovih značilnosti, ki jih prejšnja preučevanja potresov niso mogla zaznati.
Izsledki, objavljeni leta 2019, “so bili tako dobri, da ste se morali celo vprašati, ali so verodostojni,” pravi Ross. “Članek je bil izjemen,” se strinja Marine Denolle, geofizičarka na Washingtonski univerzi, ki pri raziskavah prav tako uporablja strojno učenje. “Ves projekt je navdušujoč.” Toda obstajala je tudi pomanjkljivost. Ta program, nekakšen predhodnik prave programske opreme z UI, je lahko v seizmičnem zapisu našel le potrese, ki jih je bil naučen prepoznati. Drugačni potresni dogodki so ostali neopaženi.
Zato je Ross začel uporabljati naprednejša orodja: programe samodejnega učenja, programsko opremo, ki lahko prevzame že zbrane informacije in ponudi napovedi o prihodnjih dogodkih – v tem primeru, kako bi lahko “zveneli” veliko bolj raznoliki potresi. Ti programi so zelo hitro odkrili najrazličnejše vrste neznano zvenečih potresov – kar so pozneje potrdili tudi znanstveniki. “Opazili smo ogromno stvari, ki so bile prej popolnoma spregledane,” pravi Ross.
Preberite celoten članek v reviji National Geographic.