Técnicas de análisis estadístico

A pesar del viejo adagio de " mentiras, malditas mentiras y estadísticas ", los métodos estadísticos son fundamentales para el análisis de los datos cuantitativos. Las técnicas estadísticas ayudan a resumir y dar sentido a lo que de otro modo podría aparecer como una gran cantidad de números confusos y códigos.

El análisis por lo general comienza con la estadística descriptiva , los cuales presentan un resumen de los datos. En el análisis principal de datos , los investigadores emplean la estadística inferencial para la construcción de modelos que les permiten ir más allá de los datos y hacer declaraciones sobre la población en general. Uni -variadas Estadística Descriptiva

Las estadísticas descriptivas más útiles para las variables individuales (estadísticas uni -variable ) presentan su distribución y medidas de tendencia central y de dispersión . La distribución es la frecuencia con la que cada valor aparece en el set, y se puede expresar ya sea haciendo una lista de las veces que aparece un valor ( por ejemplo, cuántas personas en el conjunto de datos fueron de 18 años, 19 , 20, 21 , etc ) o mediante la agrupación de los valores en categorías ( cuántas personas eran menores de 25 años , de 25 a 34, 35 a 44 , etc.) Las medidas de tendencia central son la media (promedio ) , la mediana ( el valor central que divide el conjunto de datos exactamente por la mitad ) , y el modo ( el valor más común ) . Las medidas de dispersión incluyen el rango (el más alto menos el valor más bajo ) , la desviación estándar y la varianza ( ambas son medidas de la desviación promedio de la media) .
Correlaciones

la correlación es una medida descriptiva de la asociación , lo que demuestra lo relacionado dos variables son . Los coeficientes de correlación oscilan de -1 a +1 , donde -1 y 1 significa que las dos variables están perfectamente relacionadas , es decir, si se conoce el valor de uno se puede calcular el valor de la otra sin un error. Una correlación negativa significa que los valores más altos de una variable, los valores de la otra variable son más bajos; una correlación positiva significa que los valores más altos de una variable corresponden a valores más altos de la otra . El coeficiente de correlación 0 significa que no hay relación entre las variables .
Estimación de error cuando intenta

Aunque las estadísticas descriptivas proporcionan un cuadro resumen de los datos , la mayoría de los proyectos de investigación no lo hace recopilar datos de toda la población que interesa a los investigadores . Las técnicas estadísticas son así utilizados para calcular el error de medición y para estimar los valores probables de la variable en toda la población

Estadística inferencial : . Prueba la diferencia

Uno de las tareas más comunes de cualquier análisis de datos es para probar una diferencia entre dos o más mediciones , ya sea entre los grupos o para el mismo grupo medido en diferentes puntos de tiempo . Prueba aquí significa establecer si la diferencia observada se debe únicamente a la casualidad o si es probable que reflejen diferencias reales en la población . Diferencias estadísticamente significativas las diferencias de medias que no es probable que la causa por pura casualidad (por cierto, los términos " estadísticamente significativo" no dice nada sobre el tamaño o la importancia de la diferencia) .

Las técnicas específicas adecuadas para probar las diferencias varían dependiendo del tipo de datos . Las diferencias entre las medias se prueban mediante la prueba t o ( en situaciones más complejas ) varias versiones de análisis de la varianza o covarianza ( ANOVA , ANCOVA , MANOVA ) . Si no es posible calcular los medios para la variable --- la variable no se mide en una escala de intervalo , por ejemplo, sexo, religión , nacionalidad --- pruebas no paramétricas son adecuados .
Estadística inferencial : Modelos de Asociación

a menudo , los investigadores quieren ir más allá de las pruebas de las diferencias entre grupos y quieren determinar las relaciones precisas entre variables. La medida más simple de dicha asociación es la correlación, pero es posible construir y estadísticamente probar modelos más complejos que se pueden separar y cuantificar de forma individual la influencia de diversas variables. El análisis de regresión lineal múltiple es la técnica de modelado estadístico más común y muy potente , a menudo combinado con el análisis de la varianza en los intentos de construir modelos causales . También existen otros modelos de regresión , incluidos los modelos no lineales y no paramétricos

Estadística inferencial : . Clasificación

Entre muchas otras técnicas para el análisis estadístico, un importante grupo incluye las técnicas estadísticas que pueden ser utilizada para clasificar y categorizar las variables y sujetos. Estas técnicas para la clasificación incluyen el análisis factorial y análisis de correspondencia , para la clasificación de las variables en las dimensiones de meta-nivel; así como diversos métodos para clasificar a los sujetos (casos) , incluyendo análisis de cluster y los árboles de clasificación .