Cómo calcular unos errores de regresión que incorporan datos de coma

La función de regresión en el análisis estadístico es una función ideal. Cuando se trabaja con datos reales , los estadísticos esperan poder utilizar la función de regresión para modelar los datos de interés . Sin embargo , hay un error de punto de datos involucrados en la recopilación de los datos de ejemplo que será el tema de la regresión. Por lo tanto , a menudo es importante para los estadísticos para dar cuenta de este error en el modelo de regresión en sí . Si bien es imposible calcular los verdaderos valores del error de punto de datos, es posible estimar e incorporarlas en el modelo de regresión. Instrucciones Matemáticas 1

Organizar los datos en una matriz de datos preparado para la regresión . La matriz de datos debe ser de tamaño n por p , donde n es el número de puntos de datos y p es el número de variables independientes en el modelo . Por ejemplo, si los datos incluidos 336 sujetos que fueron medidos en 12 variables diferentes (criterios) , tendrá una matriz de datos con 336 filas y 12 columnas. Llame a esta matriz X.
página 2

ejecutar un modelo de regresión de la forma habitual. Utilice el software estadístico . Por ejemplo , en el paquete de software estadístico R, el comando lm ( Y ~ X) regresa la variable dependiente Y en las variables independientes X. El resultado será una lista de coeficientes. Póngalos en forma vectorial y llamarlos B.
3

transponer la matriz X. Al transponer la matriz , sus filas se convierten en columnas y las columnas se convierten en las filas. De este modo, el resultado final será con una p de la matriz n . Llame a esta matriz X '. Para matrices grandes , es aconsejable encontrar X ' a través de software estadístico . Por ejemplo, en el paquete de software R, el comando t (X ) produce la transpuesta de X.
4

Multiplique la transpuesta de X por X en sí . En este cálculo, el orden importa. Por lo tanto , X'X computing es correcta mientras que XX ' no lo es. Para las grandes matrices que debe efectuar este cálculo en el software estadístico . Si el uso de R , por ejemplo , utilizar % * % para multiplicar dos matrices . Por lo tanto , el comando es X '% *% X.
5

Encuentre la inversa de X'X . Este cálculo no es factible con la mano, a fin de utilizar el software estadístico . En R , el comando para esto es inv ( ) . Por lo tanto , este paso se lleva a cabo por inv ( X'X ) . Llame a esta matriz ( X'X ) -1.
6

Calcular la matriz sombrero. La matriz de sombrero está dada por la fórmula X ( X'X ) - 1X ' . Es decir, se multiplica por X ( X'X ) -1 y luego multiplicar el resultado por X '. Una vez más , las grandes matrices excluyen los cálculos a mano , a fin de utilizar el software estadístico . Llama a esta matriz H.
7

Reste la matriz sombrero de la matriz de identidad, I. La matriz identidad es una matriz que tiene el valor 1 para todos los elementos de la diagonal y 0 para todas las entradas fuera de la diagonal . Llame a la matriz resultante ( IH ) .
8

Calcular los errores de punto de datos estimados. Multiply ( IH ) por el vector de variables dependientes de su conjunto de datos. Llame a este vector e. La solución será un vector de error estimaciones de punto de datos.
9

Añadir las estimaciones de error de punto de datos para el modelo de regresión . El modelo resultante es entonces Y = XB + e.