Técnicas Estadísticas de Comercio y Economía con conjuntos de datos global

Tener un conjunto de datos es sólo la mitad del camino hacia la escritura un gran papel o la realización de un análisis interesante. Una vez que tenga los datos , es necesario determinar una forma de analizar los datos que es útil y estadística. Con grandes conjuntos de datos globales , las técnicas más comunes incluyen análisis de regresión. Regresión lineal múltiple

La forma más básica de análisis de regresión es la regresión lineal múltiple. Técnicas de regresión lineal intentan adaptarse a una función lineal de los datos mediante la estimación de un intercepto y pendientes parciales en relación con las variables independientes en el modelo. Mientras que la regresión lineal múltiple es bastante común, si la variable de interés no se comporta de forma lineal sobre el rango relevante de su regresión , usted puede estar en problemas. Esta técnica es adaptable, pero como empiece a violar los supuestos del procedimiento , los resultados pueden llegar a ser parcial o usted puede sufrir de una falta de poder estadístico .
Regresión logística binaria

Si la medida depende de que usted está interesado en puede ser clasificado como un 1 o un 0 , por ejemplo, si es o no una cualidad está presente en la población , usted puede estar interesado en la regresión logística binaria . Esta técnica de regresión relaciona la variable independiente a la media móvil de la variable dependiente . La función que realiza esta función se denomina logit . Resultados de la regresión logística binaria pueden ser difíciles de interpretar; Sin embargo , son más estadísticamente sonido a continuación, sólo el uso de regresión lineal para hacer predicciones binarios.
Componentes Principales Regresión

Si el conjunto de datos tiene muchas variables independientes , puede ser interesante en el uso de análisis de componentes principales para llevar a cabo una reducción de datos. Una vez que la reducción de datos se completa , los componentes principales se pueden utilizar en una regresión de componentes principales . El procedimiento de PCA utiliza técnicas de álgebra y de optimización lineal para encontrar componentes lineales ortogonales de las variables independientes. Los componentes potenciales son entonces rango clasificadas por la cantidad de variabilidad en los datos que explican y el investigador es capaz de sacrificar una pequeña pérdida de variabilidad explicada por una reducción de los datos y la falta de multicolinealidad . La desventaja de esta técnica es que las estimaciones de la pendiente de los principales componentes parciales pueden ser difíciles de interpretar sin la traducción de vuelta a los valores originales .
Variables Instrumentales Estimación

estimación de variables instrumentales se puede utilizar con grandes conjuntos de datos cuando las variables independientes están correlacionadas con los términos de error en el modelo . Esto ocurre cuando el investigador no está seguro del modelo estructural de la relación que se investiga , que es común en grandes conjuntos de datos globales. Métodos de variables instrumentales pueden utilizar de dos etapas de estimación de mínimos cuadrados , que implica un análisis de regresión de múltiples pasos que rompe la regresión en la regresión de variables endógenas sobre las variables exógenas primero , y luego usa esos valores predichos para realizar otra de regresión . Si bien esta técnica es de gran alcance , a veces es difícil encontrar una variable instrumental que sólo afecta a la variable dependiente a través del efecto de la variable independiente.