mercoledì 20 febbraio 2013

Il corso: metodi ed applicazioni di informatica per l'analisi di dati biologici.


Il programma generale. Eccolo qui:

0. Dove elaborare dati scientifici: alcune piattaforme di riferimento. L’enorme diffusione di strumenti di informatica individuale offre l’opportunità di poter analizzare dati in scenari all'apparenza insoliti ma davvero utili. Esamineremo il caso delle applicazioni windows portabili, installabili ed utilizzabili cioè su e da una semplice chiavetta USB ed il meccanismo delle macchine virtuali, dove un sistema operativo completo viene fatto funzionare all'interno, come ospite, di un altro sistema operativo – evitando così difficili istallazioni.  Infine viene fatto un cenno a git, un sistema di controllo versione che permette di tenere sistematicamente traccia dei propri lavori.

1. Linux, a riga di comando. L’utilizzo di linux viene introdotto attraverso la spiegazione della sua interfaccia tradizionale, la cosiddetta riga di comando (shell), con i suoi meccanismi e programmi di base. Viene poi spiegato il filesystem: come orientarsi tra file, directory e link vari.

2. Le espressioni regolari (regex). Uno dei problemi più frequenti è quello di ricercare, all'interno di un file, solo quelle righe che contengano determinate informazioni. Le espressioni regolari, descritte in modo introduttivo, aiutano a risolvere questo problema in modo elegante e conciso.

3. Il linguaggio Python, un’introduzione. La programmazione scientifica è stata nel tempo effettuata con tutti i linguaggi che si sono via via affermati al pubblico: nella la corrente dei linguaggi di scripting (Perl, Python, Tcl tra gli altri), che predilige la produttività di chi scrive codice rispetto all'efficienza computazionale assoluta, Python è emerso in virtù della sua eleganza nei costrutti di base e della sua efficacia. Per affrontare problemi di derivazione scientifica sono state scritte apposite estensioni al linguaggio che rendono fattibili e semplici attività normalmente ritenute complesse.

4. Elementi di programmazione parallela. Le moderne CPU presentano un parallelismo intrinseco che permette di svolgere più lavori contemporaneamente. Verrà spiegato come trarre vantaggio di questa potenza nei problemi di elaborazione di grandi quantità di dati.

5. Programmare (anche) per gli altri: infine vengono presentati cenni di programmazione professionale. quando cioè si desidera che altri usino i programmi che scriviamo.


Nessun commento:

Posta un commento