PACKAGES

partykit | ggparty

Decision Tree: CTree

ctree: Conditional Inference Trees

r.ctree utilizza l’algoritmo Conditional inference trees [1] per determinare un modello predittivo di classificazione e regressione e generare un albero decisionale binario:

  • classification tree se la variabile obiettivo è una variabile categoriale
  • regression tree se la variabile obiettivo è una variabile continua

CTree cerca di limitare la tendenza all’overfitting dell’algoritmo CART inserendo un test di significatività per selezionare e i predittori più correlati con la variabile obiettivo.

Argomenti: [2]

  • varname => varlist: un hash con la variabile dipendente e l’elenco delle variabili indipendenti
  • :scale => varlist: specifica le variabili singole che devono essere considerate come ordinali
  • :weight => varname: il nome di una variabile di ponderazione
  • :tree => :party|:ggparty: metodo utilizzato per la generazione del grafico (default: :party)
  • :teststat: type of test statistic for variable selection: quadratic maximum
  • :splitstat: type of test statistic for splitpoint selection
  • :splittest: linear (default false)/ maximally selected statistics for variable selection
  • :testtype: distribution of test statistic: Bonferroni MonteCarlo Univariate Teststatistic
  • :nresample: number of permutations for testtype MonteCarlo
  • :alpha: significance level for variable selection
  • :minsplit: minimum sum of weights in a node in order to be considered for splitting
  • :minbucket: minimum sum of weights in a terminal node
  • :minprob: proportion of observations needed to establish a terminal node
  • :maxsurrogate: number of surrogate splits to evaluate
  • :maxdepth: maximum depth of the tree

Tabelle disponibili:

  • :analysis: riepilogo dei parametri dell’analisi
  • :nodes: tabella dei nodi generati
  • :varimp: importanza relativa delle variabili

Grafici disponibili:

  • :tree: il grafico ad albero
  • :varimp: importanza relativa delle variabili
1
2
prev = ["crim", "zn", "indus", "chas", "nox", "rm", "age", "dis", "rad", "tax", "ptratio", "black", "lstat"]
r.ctree :medv => prev, :maxdepth => 3
_images/ctree_1.png
_images/ctree_tree.png
_images/ctree_2.png
_images/ctree_imp.png
_images/ctree_3.png


Note

[1]Hothorn T., Hornik K., Zeileis A. (2006) Unbiased Recursive Partitioning: A ConditionalInference Framework Journal of Computational and Graphical Statistics, 15(3), 651–674
[2]Consultare Analisi per l’elenco dei parametri generali.