Cómo encontrar el centroide en un análisis de agrupación

El análisis de conglomerados es un método para organizar los datos en grupos representativos basados ​​en características similares. Cada miembro del grupo tiene más en común con los demás miembros del mismo grupo que con los miembros de los otros grupos. El punto más representativo dentro del grupo se llama el centro de gravedad . Por lo general, esta es la media de los valores de los puntos de datos en los cluster.Things que necesitará
Calculator Foto Papel cuadriculado
Mostrar Más instrucciones Matemáticas 1

Organizar los datos. Si los datos se compone de una sola variable , un histograma podría ser apropiado . Si se trata de dos variables , graficar los datos en un plano de coordenadas. Por ejemplo , si estabas buscando en la altura y el peso de los niños en edad escolar en un aula, representar los puntos de datos de cada niño en un gráfico, con el peso de ser el eje horizontal y la altura de ser el eje vertical. Si se trata de más de dos variables , se pueden necesitar matrices para mostrar los datos .
2

Agrupe los datos en grupos . Cada grupo está constituido por los puntos de datos más cercanos a ella . En la altura y el peso de ejemplo , el grupo de los puntos de datos que parecen estar muy juntos. El número de grupos , y si todos los puntos de datos tiene que estar en un clúster, puede depender de los propósitos del estudio .
3

Para cada grupo , agregue los valores de todos los miembros . Por ejemplo , si un grupo de datos consistió en los puntos ( 80 , 56 ) , ( 75 , 53 ) , ( 60 , 50 ) , y ( 68,54 ) , la suma de los valores sería ( 283 , 213 ) .
4

divida el total por el número de miembros del clúster . En el ejemplo anterior , 283 dividido por cuatro es 70,75 , y 213 dividido por cuatro es 53,25 , por lo que el centro de gravedad del cúmulo es ( 70.75 , 53.25 ) .
5

Trace los centroides de grupo y determinar si cualquiera de los puntos están más cerca de un centroide de otro clúster de lo que son para el centroide de su propio clúster. Si los puntos están más cerca de un centro de gravedad diferente, redistribuirlos al clúster que contiene el centro de gravedad más cerca.
6

Repita los pasos 3 , 4 y 5 hasta que todos los puntos de datos se encuentran en el grupo que contiene el centro de gravedad de los que están más cerca .