¿Cómo estimar Nonparametric Kernel Densidad

Los análisis estadísticos a menudo esperan generalizar pequeños conjuntos de datos individuales a grandes poblaciones , en general. Al realizar el análisis , los investigadores se ocupan a menudo rígidos, pequeños conjuntos de datos. Sin embargo , a menudo es deseable para " alisar " estos datos , el cambio de un histograma rígido en una curva . , La estimación de densidad de kernel no paramétrico hace exactamente esto. Esta función es no paramétrico en que no suponga que hay una estructura fija asociada con los datos . En este proceso, se le aplicará un kernel (una función que cambia el conjunto de datos original en un nuevo conjunto de datos ) para el conjunto de datos para estimar un dataset.Things más suaves que necesitará de software Usted Estadística
Mostrar Más instrucciones Matemáticas 1

Introduzca los datos en el software estadístico. , La estimación no paramétrica de densidad kernel sólo se puede aplicar a los datos de una sola dimensión , por lo que si los datos es multidimensional , que tendrá que realizar la estimación de la densidad de una variable a la vez.
2

Elija el kernel para ser utilizado . La mayoría de los programas de estadísticas ofrecen una amplia variedad de granos . Por ejemplo , el programa estadístico, R, ofrece Gauss , triangular, rectangular, Epanechnikov , biweight , coseno y optcosine kernels. En general , los núcleos rectangulares y triangulares tienden a ser menos suave , mientras que los kernels gaussianos y Epanechnikov tienden a conducir a distribuciones más suaves. La opción más común kernel es el núcleo de Gauss , pero usted puede experimentar con múltiples núcleos.
3

Elija el ancho de banda para la estimación . El ancho de banda actúa como la desviación estándar del núcleo de suavizado y afecta a la forma de la distribución final estimado . Opción de ancho de banda es un tema complejo , muy debatido en las estadísticas y no hay una sola manera de elegir un ancho de banda adecuado . Lo mejor es experimentar con muchos anchos de banda , observando la distribución resultante . En general , existe un compromiso entre la varianza y sesgo para diferentes anchos de banda de tamaño . La elección de un ancho de banda mayor disminuye la varianza , mientras que el aumento de la polarización; elegir el menor ancho de banda aumenta la varianza , mientras que la disminución de la polarización .
4

Ejecute el , función de estimación de densidad de kernel no paramétrica . Software estadístico le pedirá que ingrese los datos , kernel y ancho de banda a llamar a esta función . Por ejemplo, en R , el comando es "densidad (datos, ancho de banda, kernel). "
5

parcela los resultados. Trazado de la salida de la función de densidad le permitirá ver cómo la estimación de la densidad cambia la forma de los datos . Si se realiza correctamente , debería aparecer como una versión más suave de los datos originales .