De la misma manera que hemos logrado identificar las diferencias que nos permitieron clasificar a los objetos, tendremos entonces que centrarnos la tarea de identificar las características comunes que nos permitan realizar agrupaciones o realizar conjuntos de objetos, ya que debemos poder tener la capacidad de interactuar con los diferentes objetos.
“No estamos solos en el Universo”
Existen diferentes formas de realizar agrupaciones, una de las técnicas más básicas (y particularmente mi preferida) está basada en los algoritmos de agrupamientos también conocidos como “clustering”.
Clustering: Es un procedimiento de agrupación de una serie de vectores de acuerdo con un criterio de cercanía. Esta cercanía se define en términos de una determinada función de distancia, como la euclídea, aunque existen otras más robustas o que permiten extenderla a variables discretas. Generalmente, los vectores de un mismo grupo (o clústers) comparten propiedades comunes. El conocimiento de los grupos puede permitir una descripción sintética de un conjunto de datos multidimensional complejo. De ahí su uso en minería de datos. Esta descripción sintética se consigue sustituyendo la descripción de todos los elementos de un grupo por la de un representante característico del mismo.
En algunos contextos, como el de la minería de datos, se lo considera una técnica de aprendizaje no supervisada puesto que busca encontrar relaciones entre variables descriptivas pero no la que guardan con respecto a una variable objetivo.
Comments are closed