Учебник - общая психодиагностика - 2006 (846296), страница 23
Текст из файла (страница 23)
Повышение надежности отнюдь не обязательно приводит к повышениювалидности1. В терминах А. Анастази валидность определяется репрезентативностью теста относительно измеряемой области поведения. Если эта область поведения складывается из разнообразных феноменов, то содержательная валидность теста автоматически требуетпредставленности в нем моделей всех этих разнообразных феноменов.Возьмем глобальное понятие «речевая способность» (этому психолингвистическому термину в традиционной тестологии соответствует термин «вербальный интеллект»). Сюда относятся такие относительно независимые друг от друга навыки, как навыки письма и чтения.
Еслизаботиться о содержательной валидности соответствующего теста, тонужно ввести в него группы заданий на проверку этих довольно разных по своему операциональному составу компонентов вербальногоинтеллекта. Вводя разнородные пункты и субшкалы (субтесты), мыобязательно сокращаем внутреннюю согласованность, одномоментнуюнадежность теста, но зато добиваемся существенного повышения валидности. Таким образом, для расширения области применения тестапсиходиагност должен избегать излишнего повышения внутренней согласованности.
Одновременно с этим снижением внутренних корреляций между различными пунктами теста (об этом уже говорилось в разделе 3.1) обязательно исчезает отрицательный эксцесс на кривой распределения тестовых баллов, и она все более приближается по формек нормальной кривой.Эмпирическая валидность. Если в случае с содержательной валидностью оценка теста производится за счет экспертов (устанавливающих соответствие заданий теста содержанию предмета измерения),то эмпирическая валидность измеряется всегда с помощью статистического коррелирования: подсчитывается корреляция двух рядов1Предельной внутренней согласованностью будет, например, обладать тест-опросник, состоящий из повторения одного и того же вопроса.
Но валидность в данном случае будет минимальной.112значений - баллов по тесту и показателей по внешнему параметру, избранному в качестве критерия валидности.Прагматические традиции западной тестологии привязывали эмпирическую валидность теста к внешним для психологии социальнопрагматическим критериям. Эти критерии являются показателями, обладающими непосредственной ценностью для определенных областейпрактики. Практика всегда имеет целью либо повысить, либо понизитьэти показатели. Например, в области педагогической психологии это«успеваемость» (которую надо повысить), в психологии труда это«производительность труда» и «текучесть кадров», в медицине - «состояниездоровьяпациента»,впсихологииуправления-«совместимость», «срабатываемость» коллектива, в юридической психологии - «преступность» (которую надо понизить) и т. п.Ориентируясь непосредственно на эти категории, психолог, пытающийся скоррелировать результаты теста с этими показателями,фактически решает сразу две задачи: задачу измерения валидности изадачу измерения практической эффективности своей психодиагностической программы.
Если получен значимый коэффициент корреляции, то можно считать, что решены с позитивным результатом сразуобе эти задачи. Но если корреляции не обнаружено, то остается неопределенность: либо невалидна сама процедура (тестовый балл не отражает, например, стрессоустойчивость оператора), либо неверна гипотеза о наличии причинно-следственной связи между психическимсвойством и социально значимым показателем (стрессоустойчивостьне влияет на процент аварийных ситуаций).Таким образом, социально-прагматические критерии являютсякомплексными: они позволяют измерить валидность-эффективность,но не каждое из этих двух свойств теста отдельно. На практике психолога часто ожидает и еще более сложная ситуация, когда заказчиктребует от психолога на основании полученного диагноза сразу же определенных мер по вмешательству в ситуацию (отбор, консультирование, обучение и т.
п.). В этом случае повышение показателей(достоверное по сравнению с контрольной группой) доказывает одновременно и валидность-эффективность диагностики, и эффективность самого вмешательства. А отрицательный результат дает ещебольшую неопределенность, так как оказывается невозможным от113делить неэффективность вмешательства от низкой валидности диагностики.Ориентация на социально-прагматические критерии, приводящие к склейке понятий «валидности измерения» и «причинного прогноза по результатам измерения», бесспорно, сдерживала и продолжает сдерживать развитие концептуального аппарата дифференциальной психологии.
При этом суть самого предмета измерения: измеряемого психического свойства - оказывается вне фокуса внимания нетолько заказчика, но и самого психолога, превращающегося в этомслучае в тестолога, которого не интересует, что именно он измеряет,главное лишь, чтобы от этого «нечто» перекидывался мостик к полезному эффекту, обеспечивающему психологу социальное признание.Процедура эмпирической валидизации. Организация выборкипри эмпирической валидизации зависит от временного статуса критерия. Если этот критерий - событие в прошлом (ретроспективная валидизация), то к участию в психодиагностическом обследовании достаточно привлечь только тех испытуемых, которые оказались на экстремальных полюсах по этому критерию1.
В результате применяется метод экстремальных (контрастных) групп. Коррелирование с суммарнымбаллом по тесту оценивается с помощью бисериального коэффициентапо формуле (3.2.17). При этом в статусе дихотомической переменной(на месте отдельного пункта) оказывается сам критерий валидности: x— сумма баллов по тесту, полученных «высокой» группой по критерию;pq - стандартная ошибка критерия, связанная с численностью«высокой» (р) и «низкой» (q) групп.Если критерий - будущее событие (проспективная валидизация),то выборка должна быть составлена с запасом - с учетом вероятногообъема экстремальных групп в будущем. Например, нужно выяснить,позволяет ли диагностика темперамента прогнозировать повышенныйриск психосоматических заболеваний (гипертония, язва, астма и т.
п.).Пусть на основании эпидемиологических исследований известно, что втечение трех лет из. 1000 здоровых людей этими болезнями заболе1В этом случае имеет место схема исследования, известная под названием «квазиэксперимент»:контроль осуществляется не в виде воздействия на независимую переменную, а в виде привлечения особой выборки испытуемых.
Подробнее о квазиэкспериментах см. кн.- Д. Кэмпбелл,1980.114вают 57 человек. Это означает, что превентивной (предупреждающей)диагностикой должно быть охвачено около 2000 человек, чтобы получить численность «высокой» группы (заболевших) порядка 100 человек. Проспективная валидизация выявляет прогностическую эффективность диагностической процедуры.
Высокая прогностическая валидность доказывает как валидность самого измерения, так и наличиепредполагаемой причинной связи.Ретроспективная валидизация позволяет в лучшем случае решить только первую из двух задач. Например, если для исследованияличностной предрасположенности к совершению краж проведено обследование лиц, находящихся под следствием (т. е. уже совершившихпреступление), то выявление акцентированных черт «тревожности»,«агрессивности» и т.
п. еще не может интерпретироваться как свидетельство причинных факторов преступности - эти черты могут бытьлишь следствием сложившихся обстоятельств: лишение свободы, угрызения совести и т. п. (Ратинов А. Р., 1979). Во многих медико-психологических исследованиях был выделен особый диагностическийсиндром «госпитализации», который обнаруживается у любой категории госпитализированных больных (обычно он выражается в повышении шкал «депрессии» и «ипохондрии» по MMPI – Шхвацабая,1980). Очевидно, что подобные личностные сдвиги никак нельзя интерпретировать в смысле симптомов предрасположенности к определенным психогенным заболеваниям, ибо они относятся к следствиям, ане к причинам этих заболеваний.Конструктная валидность.
В отличие от прагматической валидизации собственно психологическую валидизацию порой оказываетсяпровести гораздо труднее в силу отсутствия какого-либо более объективного внутрипсихологического критерия, чем сам тест.Наиболее благополучная ситуация имеется тогда, когда для измерения данного свойства в психологии уже имеется процедура с известной валидностью. В этом случае корреляция между баллами двухтестов - линейная (см. формулу 3.2.3) или ранговая (см.
формулу3.2.5)- указывает на то, обладает ли новый тест конвергентной валидностью по отношению к старому. Если новый тест обнаруживает высокую конвергентность результатов со старым и одновременно оказывается более компактным и экономичным 'в проведении и подсчете, то115психодиагносты получают возможность использовать новый тест вместо старого.Однако во многих случаях для измеряемого свойства психодиагност не может найти в литературе ни одного уже апробированноготеста с известной валидностью. В этом случае он может сформулировать ряд предсказательных гипотез о том, как будет коррелироватьего новый тест с другими тестами, измеряющими родственные характеристики испытуемых. Эти гипотезы выдвигаются на основе теоретических представлений об измеряемом свойстве.