La diferencia entre el Cluster y Análisis factorial

El análisis de conglomerados y el análisis factorial son dos métodos estadísticos de análisis de datos. Estas dos formas de análisis son muy utilizados en las ciencias naturales y de comportamiento. Tanto el análisis de conglomerados y el análisis factorial permiten al usuario agrupar partes de los datos en "clusters" o sobre "factores ", dependiendo del tipo de análisis. Algunos investigadores nuevos a los métodos de análisis de racimo y de factores pueden pensar que estos dos tipos de análisis son similares en general . Si bien el análisis de conglomerados y el análisis factorial parecen similares en la superficie , se diferencian de muchas maneras, incluyendo en sus objetivos y aplicaciones generales. Objetivo

análisis de conglomerados y análisis de factores tienen diferentes objetivos. El objetivo habitual de análisis factorial es explicar la correlación en un conjunto de datos y relacionar las variables entre sí, mientras que el objetivo del análisis de conglomerados es abordar la heterogeneidad en cada conjunto de datos. En espíritu , el análisis de conglomerados es una forma de categorización , mientras que el análisis factorial es una forma de simplificación.
Complejidad

La complejidad es una cuestión sobre la que el análisis factorial y de conglomerados difieren : tamaño de los datos afecta a cada análisis diferente . A medida que crece el conjunto de datos , el análisis de conglomerados se vuelve computacionalmente intratable. Esto es cierto porque el número de puntos de datos en el análisis de conglomerados se relaciona directamente con el número de posibles soluciones de clúster . Por ejemplo , el número de maneras de dividir veinte objetos en 4 grupos de igual tamaño es más de 488 millones . Esto hace que los métodos computacionales directos , incluyendo la categoría de los métodos a los que pertenece el análisis factorial , imposible.
Solución

A pesar de que las soluciones a tanto el análisis de los factores y problemas de análisis de racimo son subjetivas , hasta cierto punto , el análisis factorial permite al investigador para dar un "mejor" solución , en el sentido de que el investigador puede optimizar un determinado aspecto de la solución ( ortogonalidad , la facilidad de interpretación y así sucesivamente ) . Esto no es así para el análisis de conglomerados , ya que todos los algoritmos que posiblemente podría producir una mejor solución análisis de conglomerados son computacionalmente ineficiente . Por lo tanto , los investigadores emplean el análisis de conglomerados no pueden garantizar una solución óptima.
Aplicaciones

análisis factorial y de conglomerados se diferencian en la forma en que se aplican a los datos reales. Debido a que el análisis factorial tiene la capacidad de reducir un conjunto manejable de variables a un conjunto mucho más reducido de factores , es conveniente para simplificar los modelos complejos. El análisis factorial también tiene un uso confirmatorio, en el que el investigador puede desarrollar un conjunto de hipótesis sobre cómo se relacionan las variables en los datos. El investigador puede entonces ejecutar el análisis factorial en el conjunto de datos para confirmar o desmentir estas hipótesis. El análisis de conglomerados , por otro lado , es adecuado para la clasificación de objetos de acuerdo con ciertos criterios . Por ejemplo, un investigador puede medir ciertos aspectos de un grupo de plantas recién descubiertas y colocar estas plantas en categorías de especies mediante el empleo de análisis de conglomerados .