Limitaciones de los agregados bases de datos

Los datos agregados son información recopilada de varias fuentes. Proporciona información de resumen sobre las características de la base de datos como un todo, pero no tiene en cuenta las variaciones individuales . Un buen ejemplo podría ser las estadísticas de salud de varios condados dentro de un estado . Los datos agregados pueden mostrar tendencias de condado a condado, pero no necesariamente entre los sujetos dentro de cada condado. Falacia ecológica

Una limitación clave de datos agregados que se conoce como la falacia ecológica. Los investigadores pueden usar datos agregados para encontrar características promedio para un grupo , pero no pueden asumir que esas características medias son aplicables a todos los miembros del grupo. Puesto que los datos agregados normalmente no permite una fácil manipulación de variables , puede haber una tendencia a pasar por alto las influencias que pueden estar afectando los individuos dentro del conjunto de datos. Los usuarios de los datos deben recordar que los datos agregados sólo muestra los promedios , los atributos no individuales. Datos
Survival datos

de supervivencia , o datos del tiempo transcurrido hasta el evento , es una componente importante de muchos estudios relacionados con la salud que se centran en los efectos a largo plazo de las variables sobre los individuos . En este tipo de estudio , los investigadores buscan en los sujetos más de una vez durante un período prolongado de tiempo . Esto suele ser fácil de hacer con los datos de pacientes individuales , pero a menudo imposible con datos agregados ya que puede haber ninguna manera de identificar a los sujetos individuales de un estudio. Los investigadores pueden hacer generalizaciones sobre la muestra, pero no pueden volver a sujetos individuales más adelante. Puesto que los datos agregados sólo se refiere a una instancia específica para cada tema , su utilidad para la investigación que tiene un retraso de tiempo es limitado.
Variables individuales

Una de las principales limitación de los datos agregados es que los investigadores no pueden usarla para estudiar los efectos de las variables a nivel de sujeto individual. Los investigadores pueden examinar los amplios efectos de las relaciones pre-especificados en un estudio conjunto, pero no son capaces de explorar las relaciones de otras variables que pueden llegar a ser visible en las bases de datos basados ​​en unidades más . Al basarse en datos agregados , pierden la oportunidad de utilizar los datos para generar más hipótesis .
Problemas de Control de Datos

Una última limitación de los datos agregados tiene menos que ver con su utilidad para la investigación que con su papel secundario en las grandes organizaciones. Colecciones de datos financieros y de salud agregados tienen que mantenerse seguro si tienen alguna cuenta o información de identificación. Los datos sólo es útil si es accesible , pero la accesibilidad puede conducir a la vulnerabilidad a la piratería y el robo de información . Los propietarios de grandes colecciones de datos agregados accesibles deben tomar precauciones extensas para garantizar la seguridad de los datos.