Scienza dei dati
Obiettivo: Nella società post-moderna siamo immersi in una costante e copiosa pioggia digitale di dati. Il valore di questi dati è nullo se essi non vengono efficacemente trattati al fine di trasformali in conoscenza. Il corso propone metodologie per la rappresentazione, l'archiviazione, l'interrogazione, l'analisi e la visualizzazioni di dati complessi.
Modalità didattica: Le lezioni saranno frontali più una parte di laboratorio. La parte di laboratorio è mirata all'acquisizione dei linguaggi e strumenti software mediante casi di studio.
Pre-requisiti: Il corso si rivolge a studenti della laurea magistrale in discipline informatiche. I pre-requisiti sono (tra parentesi i livelli richiesti):
- statistica (base)
- algebra matriciale (base)
- algoritmi su grafi (intermedio)
- basi di dati (intermedio)
- programmazione in Java (avanzato)
Programma:
Il programma si divide in due parti (tra parentesi quadre i riferimenti bibliografici, tra parentesi tonde i riferimenti agli strumenti software):
- Introduzione all'infografica [T01]
- Dati gerarchici
- Storia della struttura ad albero [L14]
- Rappresentazione: XML [MS06]
- Archiviazione: basi di dati native per XML (BaseX)
- Interrogazione: XQuery e XQuery Full-Text [MS06] (BaseX)
- Visualizzazione [L14, BGLL13] (BaseX, igraph, Processing)
- Dati reticolari
- Storia della struttura a grafo [L11]
- Archiviazione: basi di dati native per grafi (Neo4J)
- Analisi [N10] (R, igraph)
- misure di centralità di nodi
- misure di similarità tra nodi
- rivelazione di comunità di nodi
- proprietà strutturali
- Visualizzazione [L11, BGLL13] (igraph, Processing)
Libri:
- [MS06] Anders Møller, Michael Schwartzbach. An introduction to XML and Web technologies, Addison Wesley, 2006
- [N10] Mark Newman. Networks: An Introduction. Oxford University Press, 2010.
- [L11] Manuel Lima. Visual Complexity. Princeton Architectural Press, 2011.
- [L14] Manuel Lima. The book of trees. Princeton Architectural Press, 2014.
- [BGLL13] Hartmut Bohnacker, Benedikt Gross, Julia Laub, Claudius Lazzeroni. Generative design. Princeton Architectural Press, 2012
- [T01] Edward R. Tufte. The visual display of quantitative information. Graphics Press; 2nd edition, 2001
Software:
Dataset
Modalità di esame: L'esame consiste in una progetto e in una prova orale.