Árboles 1

arboles

Parte 1 de árboles

Eduardo Selim M. M. , Carlos A. Ar.
05-09-2021

¿Qué es un árbol de decisión?

¿Cómo se determinan las subregiones?

La función de regresión

Considérese un data set con variables explicativas y respuesta. La idea es explicar cómo se utilizan los árboles de decisión para estimar la función \(f\). Dicha estimación se denotará por \(\hat{f}\).

Detalles de la construcción

Splits binarios

Reglas de paro

Hojas de un árbol de decisión

Splits binarios estandarizados

Splits binarios estandarizados

\[ R_1 \cup R_2 \cup ... \cup R_m = R \] \[ R_1 \cap R_2 \cap ... \cap R_m = \emptyset \]

\[ y = f(x) = \sum_{i=1}^{m} \lambda_i 1_{(\underline{x} \in R_i)} = \begin{cases} \lambda_1 &\text{ si } \underline{x} \in R_1\\ \lambda_2 &\text{ si } \underline{x} \in R_2\\ ...\\ \lambda_m &\text{ si } \underline{x} \in R_m \end{cases} \]

Predicciones

Banda de split para árboles de regresión

Definición Suma de cuadrados

\[ SS(l,c;\lambda_0, \lambda_1) = \sum_{\underline{x}_i \in R_{t0}} (y_i - \lambda_0)^2 + \sum_{\underline{x}_i \in R_{t1}} (y_i - \lambda_1)^2 \]

Split óptimo

Árboles de clasificación

Misclassification error para el caso bidimensional