Cuestiones éticas en la preparación de una prueba estandarizada

demandas de rendición de cuentas del 2001 Que Ningún Niño Se Quede Atrás han dado lugar a una mayor dependencia de las pruebas estandarizadas como el barómetro de la escuela y el éxito del maestro. Con tanto en la línea --- Los futuros de los estudiantes, profesores y carreras de administrador , la reputación del distrito escolar , valores de la propiedad --- no es de extrañar el desarrollo de instrumentos de prueba de sonido es un tema candente perenne en la educación , sobre todo porque la tarea de recoger válido y información confiable acerca de las habilidades y conocimientos académicos de los estudiantes presenta problemas éticos espinosos. Campo de juego Lopsided

pruebas estandarizadas deben medir efectivamente el logro del estudiante sin dar ciertos estudiantes pueden ganar algunas ventajas . Algunos investigadores sugieren que la forma en que las pruebas se componen hace que determinados grupos de estudiantes a ser más propensos a malinterpretar la información debido a los antecedentes culturales , el idioma /dialecto interferencia y de género. En 1980 , Allan Nairn y asociados alegaron que el Scholastic Aptitude Test ( SAT ) clasificó a los examinandos no por la aptitud , sino por la clase social. Desde probadores pusieron el grito en terminología elitista como el "yate" y " regata ", estas palabras específicas se han retirado de la prueba en los años 1970 , y el SAT ha recorrido un largo camino para asegurar que el contenido sea más accesible a todos los estudiantes . Sin embargo, en 2009 , los resultados del SAT seguían divididos por la raza, el género y los ingresos familiares, con hombres blancos de clase media alta que realizan significativamente mejor . Las repercusiones pueden ser significativas cuando bajas calificaciones prohíben los estudiantes tengan acceso a las oportunidades educativas.
Cultural /sesgo étnico

Basar las decisiones de colocación de estudiantes en las pruebas estandarizadas se ha traducido históricamente en etiquetado injustificada de las minorías como deficientes mentales y terminar en grupos de habilidad. Muchos pleitos desde finales de 1960 han argumentado que las diferencias raciales en las puntuaciones de la prueba se deben a los prejuicios culturales en el diseño de la prueba . En el caso de Larry P. vs Riles ( 1972 ) , el tribunal determinó que el sesgo cultural en los tests de inteligencia dio lugar a puntuaciones más bajas entre los estudiantes negros. Diseñadores de pruebas estandarizadas deben tener cuidado de no encuadrar objetos en términos de situaciones que requieren familiaridad con predominantemente blancos , experiencias de clase media.
Lingüística Sesgo

Inglés los estudiantes del idioma (ELL) en general se desempeñan peor en las pruebas estandarizadas que sus contrapartes nativos de habla Inglés , pero las puntuaciones más bajas pueden ser menos debido a un conocimiento de la materia objeto de los estudiantes que a su falta de familiaridad con el Inglés en la que las pruebas son escrito . Los estudiantes ELL pueden malinterpretar las instrucciones o enredarse en detalles irrelevantes que emplean vocabulario desconocido . En los exámenes de matemáticas , los estudiantes ELL hacerlo mejor en los problemas basados ​​en fórmulas que en problemas de palabras , la diferencia de lo que sugiere que el tema se basa en la competencia lingüística general. El problema de sesgo lingüístico en las pruebas estandarizadas se puso de relieve en el caso legal 1970 Diana vs Junta de Educación de 1970 , en la que los estudiantes de origen mexicano ganó otros 15 puntos de CI cuando lo permita tomar el examen en español del Estado de California , lo que indica que la prueba medido dominio del Inglés en lugar de la inteligencia. El caso nunca llegó a los tribunales , pero , no obstante, dio lugar a cambios sustanciales en el proceso de pruebas , incluyendo el desarrollo de pruebas de coeficiente intelectual específicamente para personas que no hablan inglés y que permite a los estudiantes elegir el idioma utilizado en sus respuestas.
Género sesgo

en 1992, el Centro de Patrimonio del Atlántico informó que los chicos tuvieron mejores resultados que las niñas en el SAT a pesar de que las niñas obtuvieron mejores resultados académicos en todos los grados . Un avance rápido hasta 2009 y las mujeres seguían anotando significativamente más bajos que los hombres en el SAT , de acuerdo con un artículo " EE.UU. Hoy en día " por Scott Jaschik . La explicación puede residir en la construcción de pruebas . Elementos de prueba pueden orientarse más a los hombres cómo resolver problemas. Por otra parte , los niños tendrían una ventaja si los elementos de prueba se encuentran en contextos de orientación masculina . Por ejemplo , en una prueba de rendimiento en matemáticas , basando ciertos problemas matemáticos se basan en un escenario de fútbol podría sesgar la prueba hacia los niños. Vadeando a través de la terminología deportiva que no están familiarizados con las niñas podría costar un tiempo valioso que podría ser mejor gastado averiguar menos escenarios específicos de género .
Prueba de seguridad

En la preparación de las pruebas estandarizadas , el contenido debe ser salvaguardado adecuadamente para que ningún estudiante obtiene una ventaja injusta al tener acceso anticipado a los elementos de prueba específicos . La publicidad de las preguntas del examen compromete la validez de los resultados . Organizaciones de pruebas de renombre siguen procedimientos rigurosos de seguridad que pueden requerir los preparadores de prueba para firmar acuerdos de confidencialidad , mantener los materiales bajo llave y estrictamente especificar los procedimientos para el envío y la eliminación de materiales de prueba .
Evaluación Alternativa

durante su campaña a la presidencia , Barack Obama pidió " una mayor cantidad de evaluaciones que pueden evaluar las habilidades de orden superior ", y sin embargo, el estado actual de las pruebas estandarizadas sigue sin evaluar el aprendizaje de la disposición o capacidad para la investigación intelectual . La búsqueda de la objetividad y la fiabilidad hace que los diseñadores de las pruebas estandarizadas a depender en gran medida de preguntas de opción múltiple , que a diferencia de los problemas de la vida real tienen una y sólo una respuesta correcta. Evaluaciones alternativas --- que tengan en cuenta las tareas basadas en el desempeño , tales como carteras --- pueden proporcionar un cuadro más revelador de la verdadera competencia de un estudiante que si las burbujas correctas en la hoja de respuestas se ennegrecen . Aunque las evaluaciones alternativas presentan retos de fiabilidad , una evaluación de una muestra ampliada de trabajo de los estudiantes se puede utilizar para complementar las pruebas estandarizadas tradicionales.