Cómo crear Clusters con igual número de miembros y Igualdad Promedio Atributos

La agrupación de análisis es un método de examen de los datos mediante la asignación de los datos a los grupos previamente definidos. El número de miembros de cada grupo se basa en la similitud de características . Cada miembro de un clúster debe tener más en común con los demás miembros del mismo grupo que con los miembros de otros grupos. Las variables por el cual se ordena que los datos pueden ser numérico , binario, categórico, o de cualquier otro tipo . ¿Cómo se ordenan los datos puede ser ligeramente diferente para los distintos tipos de variables.Things que necesitará
Calculadora
Mostrar Más instrucciones
datos numéricos Matemáticas 1

Organizar la datos . Utilice un histograma si sólo una variable está involucrado , o graficar los puntos en un plano de coordenadas , si se trata de dos variables. Si los datos contienen más de dos variables , organizarla en tablas o matrices .
2

dividir el número de elementos de datos por el número de grupos que desee para obtener el número promedio de miembros por grupo .

3

Grupo de los datos en grupos que contiene el número promedio de miembros . Si existe un resto, distribuir cada punto de datos restante a un grupo diferente , de modo que ningún grupo excede cualquier otro en tamaño por más de uno.
4

Encontrar el centroide de cada grupo mediante la adición de los valores de cada miembro y dividiendo por el número de miembros del clúster. Esto le dará el valor promedio para el clúster.
5

Encuentre la distancia de cada miembro de cada grupo a partir de su centro de gravedad . Si cualquiera de los puntos de datos están más cerca del centro de gravedad de otro clúster , a continuación, pasar a la otra agrupación.
6

Cuente el número de puntos en cada grupo . Si los clústeres contienen más que el número promedio, mover el exceso de los miembros más alejados del centro de gravedad al clúster vecino más cercano a ellos .
7

Repita los pasos del cuarto al sexto hasta que no se necesita una redistribución más.

binaria o datos categóricos
8

Encuentra el número de miembros deseados por clúster dividiendo el número total de elementos de datos por el número deseado de grupos .
9

Ponga el número apropiado de elementos de datos en grupos que tienen características similares .
10

Encontrar la ( modal ) valor más común para cada variable para los datos dentro de cada grupo . El centro de gravedad de la agrupación tendrá el valor más común para cada variable.
11

dividir el número de variables de cada elemento tiene en común con el centro de gravedad , por el número total de variables. Esta relación muestra el grado en el que el punto de datos se parece a el resto de la agrupación

12

mover cualquier puntos de datos que tienen relaciones variables de menos de 0,5 a otro grupo con una mayor similitud a ese punto . Redistribuir los puntos como sea necesario para mantener tamaños iguales de los clusters. Repita los pasos del tres al cinco hasta que no se necesitan más movimientos.