Scienza dei dati

Obiettivo: Nella società post-moderna siamo immersi in una costante e copiosa pioggia digitale di dati. Il valore di questi dati è nullo se essi non vengono efficacemente trattati al fine di trasformali in conoscenza. Il corso propone metodologie per la rappresentazione, l'archiviazione, l'interrogazione, l'analisi e la visualizzazioni di dati complessi.

Modalità didattica: Le lezioni saranno frontali più una parte di laboratorio. La parte di laboratorio è mirata all'acquisizione dei linguaggi e strumenti software mediante casi di studio.

Pre-requisiti: Il corso si rivolge a studenti della laurea magistrale in discipline informatiche. I pre-requisiti sono (tra parentesi i livelli richiesti):

Programma: Il programma si divide in due parti (tra parentesi quadre i riferimenti bibliografici, tra parentesi tonde i riferimenti agli strumenti software):

  1. Introduzione all'infografica [T01]
  2. Dati gerarchici
    1. Storia della struttura ad albero [L14]
    2. Rappresentazione: XML [MS06]
    3. Archiviazione: basi di dati native per XML (BaseX)
    4. Interrogazione: XQuery e XQuery Full-Text [MS06] (BaseX)
    5. Visualizzazione [L14, BGLL13] (BaseX, igraph, Processing)
  3. Dati reticolari
    1. Storia della struttura a grafo [L11]
    2. Archiviazione: basi di dati native per grafi (Neo4J)
    3. Analisi [N10] (R, igraph)
      1. misure di centralità di nodi
      2. misure di similarità tra nodi
      3. rivelazione di comunità di nodi
      4. proprietà strutturali
    4. Visualizzazione [L11, BGLL13] (igraph, Processing)

Libri:

Software:

Dataset

Modalità di esame: L'esame consiste in una progetto e in una prova orale.