Валидность тестов

Для того чтобы инструменты оценки считались соответствующими требованиям к психометрическим характеристикам, у них должны быть достаточные показатели надежности и валидности. В этой статье мы опишем валидность батарей наших тестов.

Валидность – это способность методики измерять именно то, для оценки чего она была создана. Чтобы не запутаться в терминах, возьмем в качестве аналогии стрельбу. Надежность методики можно сравнить с кучностью результатов, а валидность - с точностью попадания. Как и в случае с надежностью, оценка валидности теста не исчерпывается каким-либо одним способом. Существует несколько аспектов валидности и, соответственно, способов ее измерения: от субъективных до точных, математически обоснованных.

Конструктная валидность

Конструктная валидность — это ответ на вопрос, действительно ли наш тест измеряет именно то, что заявлено, и то, что мы от него ожидаем. Например, используя тест интеллекта, мы задаем себе вопрос: действительно ли этот тест меряет интеллект? Или, может быть, он измеряет эрудицию? А может быть, только один из аспектов интеллекта – способность к выполнению математических операций? Применимо к личностным опросникам этот вопрос звучит так: действительно ли мы измеряем именно те факторы, которые хотим измерить? Для ответа на этот вопрос прибегают к использованию некоторых процедур, позволяющих получить ответ об уровне конструктной валидности.

Наиболее часто используют независимо созданные тесты, которые измеряют те же характеристики, что и Ваш тест. Ваши респонденты заполняют два теста, после чего остается только посчитать корреляцию между показателями Вашего теста и контрольного.

Другой способ — это проведение тестирования в группе, которая заранее выделяется среди остальных по необходимому вам параметру. Например, бухгалтеры хорошо считают, у архитекторов хорошо развито абстрактное мышление и т.д. Если ваш тест покажет значимое различие между этой группой и остальными, значит, он действительно измеряет данную черту.

Еще один способ – это оценить выраженность измеряемого качества у определенной группы людей с помощью экспертной оценки, а потом дать оцениваемым людям заполнить ваш опросник. Если мнения экспертов совпали с результатами вашего теста, то вы можете утверждать о наличии у него высокой конструктной валидности.

Критериальная валидность

Это, пожалуй, самый важный показатель эффективности теста при его использовании в бизнес-среде. Измерение критериальной валидности позволяет ответить на вопрос, насколько результаты тестирования коррелируют с успешностью работы.

Заметим, что при использовании тестов низкие показатели критериальной валидности могут говорить как о низком качестве методик, так и о том, что измеряемые ими способности не связаны с успешностью работы. Для получения достоверной информации о показателях критериальной валидности проводится корреляционное исследование. В качестве объекта исследования могут быть выбраны сотрудники фирмы; в этом случае сравниваются результаты, которые они показали в тестах, и показатели эффективности их работы. Такой вид валидности называется конкурентной валидностью.

Конструктная валидность батареи GREEN «Интерпретация информации»

Для проверки конструктной (теоретической) валидности компанией ONTARGET было проведено исследование по сравнению результатов выполнения тестов батареи «Интерпретация информации» и тестов британской компании Psytech, адаптированных для русскоязычных респондентов. Исследование проводилось в 2017 году.

Таблица 1. Корреляции тестов батареи «Интерпретация информации» с тестами британской компании Psytech

Конструктная валидность батареи SAPPHIRE «Анализ информации»

Одним из показателей валидности батареи тестов является коэффициент корреляции между результатами тестов батареи. Показатели корреляции вербального и числового тестов батареи «Анализ информации» свидетельствуют о том, что, хотя результаты по тестам значимо связаны между собой (что следует из предположения о наличии общего фактора интеллекта), тесты, тем не менее, измеряют принципиально различные способности. Исследование было проведено в 2019 году.

Таблица 2. Внутренние корреляции между тестами батарей ONTARGET.

Критериальная валидность батареи RED «Понимание информации»

В целях валидизации тестов было проведено исследование корреляции результатов теста и уровня развития поведенческих компетенций. Результаты по тестам сопоставлялись с оценками по компетенциям, полученными в рамках центров оценки и центров развития, проводившихся компанией Detech Group. Общая выборка исследования составила более 160 менеджеров различных уровней. Исследование проведено в 2019 году.

Так как в различных центрах использовались разные модели компетенций, все компетенции были объединены в несколько больших кластеров. Были получены следующие корреляции (показаны только коэффициенты корреляции, значимые на уровне 0,05):

Таблица 3. Корреляции тестов «Понимание информации» с компетенциями центров оценки и развития

Результаты показывают наличие корреляций той или иной степени выраженности между результатами по тестам и рядом компетенций. Из них следует, что числовой тест по большей степени связан с возможностями анализировать и решать проблемы, а вербальный – с коммерческим мышлением.

Критериальная валидность батареи SCARLET «Администрирование»

Одним из показателей валидности батареи тестов является коэффициент корреляции между результатами тестов батареи. Показатели корреляции вербального и числового тестов батареи «Администирование» свидетельствуют о том, что, хотя результаты по тестам значимо связаны между собой (что следует из предположения о наличии общего фактора интеллекта), тесты, тем не менее, измеряют принципиально различные способности. Исследование проведено в 2019 году.

Таблица 4. Внутренние корреляции между тестами батарей (Понимание инструкций и Работа с числовой информацией

Конструктная валидность батареи SCARLET «Администрирование»

Для проверки конструктной (теоретической) валидности компанией Ontarget было проведено исследование по сравнению результатов выполнения тестов батареи Администрирование и тестов британской компании Psytech, адаптированных для русскоязычных респондентов. Исследование проводилось в 2017 году.

Таблица 5. Корреляции тестов батареи «Администрирование» с тестами британской компании Psytech

Сертификация Продукты

+7 495 663−20−82 | info@ontarget.ru

Пользовательское соглашение

Наверх