Clustering

clustering

.

Eduardo Selim M. M. , Carlos A. Ar.
05-11-2021

Definiciones generales

Clustering por k medias

Algorítmo: clústering por k-medias

  1. Paso preliminar, asignar aleatoriamente cada observación a un clúster.

  2. Iteración. Repetir los siguientes pasos hasta que la asignación del clúster no cambie entre 2 pasos consecutivos:

    1. Determinar el centroide \(\bar{x}_k\) para cada clúster \(C_k\) para cada \(k = 1, 2, ..., K\)

    \[ \bar{x}_k := (\bar{x}_{k1}, \bar{x}_{k2},...,\bar{x}_{kp}) \]

    (el promedio en el clúster por cada variable), donde:

    \[ \bar{x}_{kj} = \frac{1}{|C_k|}\sum_{i \in C_k} x_{ij}, \space \space j =1,2, ...,p \]

    1. Asignar a cada observación al clúster del centroide más cercano. De hecho, una observación \(\underline{x}_i\) pertenece al clúster \(k\).

    \[ \sum_{j=1}^p(x_{ij}-\bar{x}_{k'j})^2 \leq \sum_{j=1}^p(x_{ij}-\bar{x}_{k'j}) \text{ para cada clúster } k' \]

Clústering jerárquico