PACKAGES
cluster | factoextra | gplots
Cluster: HC¶
r.hc esegue una cluster gerarchica agglomerativa o divisiva.
Argomenti: [1]
- varlist: l’elenco delle variabili da utilizzare nell’analisi
- Determinazione del numero di cluster:
- :method => :silhouette|:wss|:gap_stat: il metodo di stima del numero ottimale di cluster (default: :gap_sta)
- :kmax => num: il numero massimo di cluster da considerare (default: 10)
- :nboot => num: il numero di Monte Carlo samples per il calcolo della statistica gap (default: 100)
- Clustering:
- :k => num|:auto: il numero di cluster da generare oppure :auto per determinare il numero dei cluster in base al metodo :silhouette (default: :auto)
- :scale => true|false: se standardizzare o meno le variabili (default: true)
- :type => :a|:d: :a cluster agglomerativa; :d cluster divisiva
- :metric => :euclidean|:manhattan: metrica utilizzata per il calcolo delle dissimilarità (default: :euclidean)
- :linkage => :average|:single|:complete|:ward|:weighted|:gaverage: metodo di clustering (default: :ward)
- :cluster => name: il nome della variabile cluster
Tabelle disponibili:
- :analysis: riepilogo dei parametri dell’analisi
- :clus: la distribuzione dei cluster
- :centers: i centri (medie) degli scarti
- :descrv: la descrizione dei cluster in base alle variabili originarie
Grafici disponibili:
- :dist: la matrice di dissimilarità
- :nclu: il numero ottimale di cluster
- :dend: il dendogramma
- :fctmap: i cluster plottati sul piano delle prime due componenti principali
- :heatmap: heat map dei centri dei cluster
Metodi dell’oggetto restituito:
- centers(false|true): restituisce i centri dei cluster:
- true: come array di hash con i nomi delle variabili
- false: senza i nomi delle variabili come array di arrai (default)
1 2 | model = [:murder, :assault, :urbanpop, :rape]
r.hc model, :rownames => :state, :k => 3, :palette => 12
|









Note
[1] | Consultare Analisi per l’elenco dei parametri generali. |