Parimad palad











{juuli 29, 2009}   Ei saa me läbi progemiseta

Niih. Tänapäeva bioloogi ellu on tulnud siis ka hetk, kui avasin esimese programmeerimisraamistiku (Heru sõnul nimetatakse seda nii) statistika õppimiseks. Statistikat läheb bioloogil ikka vaja, et oma numbrilisi tulemusi kuidagi söödavalt esitada. Mingil hetkel aga tavalisest excelist enam ei piisa. Nimelt muutuvad andmemahud bioloogias juba nii kolossaalseteks, et exceli tabelis neid hallata pole võimalik. Toon näite: analüüsin 20 patsiendi 2 rakutüüpi (seega 40 objekti) 28 800 geeni ekspressioonitaseme suhtes. Kusjuures algandmetes ei ole lihtsalt 28 800 geeni, vaid igaühte veel iga objekti kohta 26 korduses. Lisaks veel kontrollid. Kujutage nüüd seda exceli tablit ette (mina ei oska). Lõplikus avaldatud artiklis on see andmehuilk umbes paari tabeli ja graafikuga kokku võetud.

Igatahes, kuna mu edasijõudnud statistiku teadmised vajavad tõsist täiendamist ja R-i kasutamisoskus on  täiesti olematu, surfasin veidi ringi ja leidsin toredaid asju.  Carnegie Mellon Ülikool Pittsburghis on käivitanud päris nutika iseõppija keskkonna. Tasuta kursuste hulka kuulub ka statistika, kus saab praktiseerimiskeskkonna ise valida. Alustasin R-i põhjal kursuse läbimist, olen hetkel umbes kolmandiku peal ja parasjagu huvitav on. Kursus on kirjutatud muidugi tüüpilisele ameeriklasele: puust ja punaseks ja siis veel umbes kolm korda üle, aga ilmselt tuleb see kasuks, kui päris uute teemadeni jõuan. Iseenesest on see siiski eelkõige statistika ja mitte R-i kursus, mistõttu käsud on kõik ette antud ning ise R-is eriti mõtlemis- ja proovimisruumi pole jäetud.

Õhtusel konsultatsioonil koduse progejaga selgus muidugi, et ma (nagu ka arvasin), ei tea progemmiskeelte põhimõtetest halligi. Heru sõnul ma isegi ei jõudnud keeruliste algaja küsimusteni, sest tema väitis, et ta ei tunne R-i keelt üldse, kuid vastas seejuures mu küsimustele täiesti ladusalt, hehee :D Aga küll ma ka algaja keerukusteni jõuan. Võtsin kõrvale veel päris-päris algaja R-tutoriali ja üritan lähipäevil selle abil natuke mängida.

Kokkuvõteks nii palju, et ilmselt tekib siia blogisse mõnikord naljakaid progemispüüdlusi kajastavaid postitusi. Luban lahkelt kõigil oma it-sõpradele mõnusalt vuntsi muheleda, ja heatahtlikult meenutada, et ka nemad olid kunagi algajad :P Muidugi on võimalik, et annan mingil hetkel alla ja leian, et spetsialistide sabas on ikka oma tulemustega kergem joosta, kui asi ise ära õppida.

Netis surfides leidsin veel ühe toreda õppeprogrammi Oxfordi ülikoolist. Terve online bioinformaatika kursus! Ainult magistrikraadi taotlejatele on kohustuslik 2-nädalane viibimine Oxfordis mingite projektide läbiviimiseks. Muud sertifikaadid ja diplomid saaks nägu näitamata kätte. Loomulikult ei ole need kursused sugugi tasuta, otse vastupidi. Nii et kui keegi tunneb, et tahab investeerida minu haridusse, siis wink-wink!!!



et cetera