Analisi dei Dati ed Estrazione della Conoscenza

Il sistema R: analisi di dati univariati

Tabelle di contingenza

Riassumiamo i comandi che ci consentono di generare e manipolare le tabelle di contingenza.

Esercizi

Entropia di un vettore

Scrivere la funzione entropia.data che, sfruttando la funzione entropia definita in un esercio precedente, calcola l'entropia non a partire da una distribuzione di probabilità ma da un vettore di dati. Ad esempio

> v <- c("a","a","b","c","a")
> entropia.data(v)
[1] 1.370951

Soluzione

Entropia relativa

Modificare le funzioni entropia e entropia.data in modo da accettare un parametro relative, di default uguale a FALSE, che se posto a TRUE determina il calcolo della entropia relativa.

> v <-  c("a","a","b","c","a")
> entropia.data(v,relative=TRUE)
[1] 0.8649735

Soluzione

Indici statistici

Il sistema R mette a disposizione alcune semplici funzioni per il calcolo di indici statistici. Tutte le funzioni hanno il parametro na.rm che, se impostato a TRUE, elimina i valori NA prima di effettuare ulteriori calcoli.

Come si vede non c'è una scelta molto ampia, tuttavia alcune funzioni sono implementate in package specifici che noi non utilizziamo. Bisogna anche dire che non è difficile scrivere un programmino per il calcolo degli indici statistici che abbiamo visto.

Valid XHTML 1.1 Valid CSS!