Diccionario de términos psicométricos: Letra V. Validez

Glosario de psicométricas

“V”

VALIDEZ. Uno de los principales criterios de bondad de un test, que expresa la exactitud de éste en relación con un criterio. La validez indica el grado de exactitud con que un test “mide efectivamente aquella característica de personalidad o aquel comportamiento que debe o se propone medir” (Lienert). Según las directrices de la APA para tests pedagógicos y psicológicos, hay que distinguir entre validez de contenido, validez de criterio y validez de constructo.
Hay validez de contenido cuando el test o las tareas contienen la característica o las cualidades a medir. Se habla entonces, también, de validez lógica. Si el valor obtenido en un test se pone en relación con un valor-criterio, hay validez de criterio. Aunque otras especies de validez se obtienen también o se controlan empíricamente, algunos autores designan la validez de criterio como validez empírica. Según los datos de los que se extraiga el criterio, se habla de validez (de criterio) interna o externa. Si se extrae como criterio un valor de test que mide constructos o cualidades semejantes, o constructos o cualidades desemejantes, se habla de validez interna. Si se extrae un criterio fuera de los valores del test (por ej., midiendo un rendimiento concreto o mediante juicio estimativo), se habla de validez externa. El punto temporal de la obtención del valor del test y del criterio hace razonable distinguir entre validez de coincidencia y validez de predicción. Si un valor de test ha de predecir valores de criterio que pertenecen al futuro, se habla de validez de predicción. En la validez de coincidencia no se exige este pronóstico. En la validez de constructo se trata principalmente de la clarificación teórica de un valor de test o de una variable. Indica la importancia psicológica que posee un valor o una variable. La determinación de la validez de un test es costosa en tiempo y en recursos económicos. Los resultados de tal análisis los da a conocer el autor del test a los usuarios. El tipo de valores de la validez de un test resulta del método estadístico empleado.
Si se utiliza para la validación el método de los grupos extremos, la medida de validez resultante es la diferencia entre valores medios de los grupos. Si se utiliza el método de los grupos representativos, la medida son los coeficientes de correlación según la clase de datos existentes.
Validez de Concepto. Denominación que da Cattell a la validez de constructo.
Validez de Contenido. Expresa el grado en que el contenido de un test constituye una muestra representativa de los elementos del constructo que pretende evaluar. Vale decir si resultan una muestra representativa y relevante del dominio comportamental que se pretende medir. En la validación de contenido deben seguirse las siguientes fases
1) Definición del universo de observaciones admisibles
2) Identificación de expertos en dicho universo
3) Juicio de los expertos acerca del contenido del test
4) Procedimiento para resumir los datos resultantes
En el caso de las pruebas de rendimiento, la validez es el grado hasta donde el contenido de la prueba representa un muestreo equilibrado y adecuado de los resultados (conocimientos, destrezas, etc.) del curso o del programa de enseñanza que pretende abarcar. Se demuestra mejor mediante una comparación del contenido de la prueba con los cursos impartidos, los materiales de enseñanza y las formulaciones de los objetivos de enseñanza y, muchas veces, mediante un análisis de los procesos requeridos para proporcionar las respuestas correctas a los ítems. Las validez aparente, referente a una observación de lo que parece medir una prueba, es un tipo extratécnico de evidencia que, en algunos tipos de tests, puede resultar conveniente
Validez de Constructo. Designación propuesta por Cronbach y Meehl (1955) para un tipo de análisis de validez en el que el significado del valor del test se verifica mediante conceptos o constructos psicológicos. Con la validez de constructo se intenta expresar algo sobre el significado psicológico o la base teórica de un test.
Se trata de un procedimiento muy genérico. Mientras en la validez orientada hacia el criterio no se plantea el problema de la causa del grado de correlación entre valor del test y valor del criterio, esta cuestión es fundamental en la validez de constructo.

Esta incluye algunos pasos principales. En el primer paso el investigador debe formular, sobre la base de la teoría por él escogida, hipótesis acerca del grado mayor o menor de valores del test. Luego, seleccionar ítems o tests que representen manifestaciones del constructo y realizar la recolección de datos empíricos para poner a prueba las hipótesis. Finalmente, establecer la consistencia entre los datos y las hipótesis y examinar hasta qué punto podrían explicarse mediante modelos alternativos o hipótesis rivales.
La validez de constructo es esencial para realizar inferencias acerca de conductas o atributos que pueden agruparse bajo un constructo psicológico particular. Integra toda la evidencia que permite la interpretación de las puntuaciones de los tests.
A continuación se citan los procedimientos utilizados con más frecuencia en la validación de constructo, solos o en combinación
1) Diferenciación entre grupos: se trata de establecer la validez a través de la diferenciación entre grupos de edades, en el caso de que la variable sea susceptible de ello. Ejemplo de esto son las habilidades cognitivas que aumentan con la edad. Este método es también apropiado cuando se busca la validación de constructos en escalas ordinales, como en el caso de la Teoría de los estadios de Piaget o los Estadios del desarrollo moral de Köhlberg
2) Correlaciones con otras medidas del constructo: se trata del análisis de correlación entre un nuevo test y otros tests ya validados como evidencia de que el nuevo test mide el mismo constructo
3) Análisis factorial: Véase “Análisis factorial”
4) Matrices Multimétodo – multirasgo: Para aplicar este procedimiento deben disponerse de dos o más modos de medir el constructo de interés e identificarse otros constructos diferentes (pero relacionados) que puedan ser medidos por los mismos métodos (Por ejemplo: Métodos: “Autoinforme” y “Evaluación de los compañeros”; Constructos: “Liderazgo”; “Sociabilidad” y “Popularidad”). Se selecciona una muestra de sujetos a los que se aplican todas las medidas de cada constructo y de cada método. Se calculan las correlaciones y se presentan en forma de una matriz denominada Matriz multimétodo – multirasgo. Se obtienen las siguientes datos:
coeficientes de fiabilidad: correlaciones entre medidas del mismo constructo usando el mismo método de medida – coeficientes de validez convergente: correlaciones entre medidas del mismo constructo usando diferentes métodos
coeficientes de validez discriminante: correlaciones entre medidas de diferentes constructos usando el mismo método de medida o entre diferentes constructos utilizando distintos métodos
5) Validación basada en la Teoría de la Generalizabilidad: se estudia si las observaciones para un individuo sobre un constructo son invariantes frente a distintos métodos de medida
6) Contribuciones de la Psicología Cognitiva: validación mediante diferentes métodos propios de esta corriente. Por ejemplo, simulación de procesos a la exploración de lo que miden los tests de inteligencia; análisis de protocolos verbales, en los que se pide a los sujetos que “piensen en voz alta” mientras realizan una tarea; análisis cronométrico; técnica de correlatos cognitivos; movimientos oculares, etc.
Validez de Criterio. Expresa las relaciones del constructo con otros constructos, operacionalizada, en general, en términso de correlaciones y regresiones del test con otras medidas//. El grado hasta donde las puntuaciones alcanzadas en una prueba concuerdan con (validez concurrente), o predicen (validez predictiva), alguna medida criterio. La validez predictiva se refiere a la exactitud con que una prueba de aptitud, de pronóstico o de madurez, indica el futuro éxito didáctico en alguna área, demostrados por las correlaciones observadas entre las puntuaciones alcanzadas en la prueba y futuras medidas criterio de semejante éxito (como por ejemplo, la relación existente entre la puntuación alcanzada en una prueba de aptitud académica, administrada durante la segunda enseñanza, y el promedio académico alcanzado en cuatro años de bachillerato).

En la validez concurrente, no transcurre ningún intervalo de tiempo significativo entre la administración de la prueba que se valida y la medida criterio. Este tipo de validez puede demostrarse a través de medidas concurrentes de capacidad y rendimiento académico, de la relación existente entre una nueva prueba y otra, generalmente aceptada o reconocida como válida, o mediante la correlación observada entre las puntuaciones obtenidas en una prueba y medidas criterio que son válidas, pero menos objetivas y más difíciles de obtener que una puntuación de prueba.// Este tipo de validez indica cuál es la eficacia del test en la predicción de algún tipo de comportamiento futuro del sujeto en situaciones específicas. Por ejemplo, un test de razonamiento abstracto podría utilizarse para predecir el éxito de un alumno en la disciplina de Matemáticas. Esta predicción será tanto más precisa cuanto mayor sea la validez del test de razonamiento con respecto al rendimiento en Matemáticas.
Validez, coeficiente de. La validez relativa al criterio se juzga como el grado de relación entre el test que actúa como predictor y otra variable de interés que actúa como criterio.
Si la relación entre las puntuaciones en el test y las de la variable criterio es lineal, entonces el coeficiente de correlación lineal es una medida apropiada de la relación.
Se define el coeficiente de validez de una variable X con respecto a una segunda medida
Y como el valor absoluto de la correlación
La variable X, que toma los valores de las puntuaciones en el test, es la variable preditora, y la variable Y que se predice se la denomina variable criterio.
Las medidas en la variable criterio pueden hacerse al mismo tiempo en que se administra el test, o en momentos diferentes. Estas situaciones han dado lugar a que a veces se  distinga entre dos tipos de validez, la llamada validez concurrente y la denominada validez predictiva.
En la validez predictiva transcurre un período de tiempo entre la medición del predictor y del criterio y en ese período se produce algún tipo de intervención en los sujetos, o
se gana experiencia, o conocimientos etc. La validez concurrente, por el contrario, implica la recogida de ambos tipos de medidas al mismo tiempo, o al menos en momentos tan contiguos como para que no pueda considerarse que se producen cambios ni en los sujetos ni en las condiciones.
Los procedimientos estadísticos utilizados para la validación en forma concurrente o predictiva son los mismos y en las últimas versiones de los “APA Tests Standars” se minimiza la importancia de esa distinción en cuanto a las relaciones temporales; sólo en ciertas situaciones aplicadas se mencionan, especialmente en las dirigidas a la selección de personal, en las que se suele utilizar la validación predictiva, quedando relegada la concurrente a los procesos de sustitución de unos instrumentos por otros.
Esta definición dada del coeficiente de validez como la correlación entre la variable predictora X y el criterio Y, se puede relacionar en este contexto de la teoría clásicacon el coeficiente de fiabilidad, como correlación entre dos medidas paralelas X y X’.
Desde este punto de vista puede considerarse la fiabilidad de un test como su validez con respecto a un test paralelo.
Validez Ecológica. Término ambiguo, aún no bien aclarado, que a veces no se distingue lo bastante de la “representatividad ecológica”. La validez significa aquí (casi siempre) “legitimidad”, la proporción de correspondencia o coincidencia. Pero desde la perspectiva de la validez ecológica no se juzgan sólo los tests y otros medios de investigación diagnóstica, sino también pruebas experimentales o cada uno de sus componentes, como tareas, condiciones marco espaciales y temporales, resultados de investigación, teorías, etc. Se busca así la correspondencia con el “biotipo” (Pawlik 1976), con las condiciones en circunstancias de vida “natural” (de ahí, ecológico). Este tipo de cuestiones sobre la validez o correspondencia se presenta especialmente cuando se abordan conocimientos científicos empíricos desde una situación relativamente artificial, construida específicamente, alejada del contexto vital natural (situaciones de test, de laboratorio).

Volver al glosario «Letra V«

Volver al índice principal de «Diccionario de términos psicométricos«