Учебник - общая психодиагностика - 2006 (846296), страница 10
Текст из файла (страница 10)
Здесь использование тестов позволило преодолеть методологический тупик, в котором оказались авторы многочисленных теорий,концепций, интуитивных догадок и иных умозрительных построений,не видевших способа обоснования истинности своих суждений. Непосредственное же обращение к практике как критерию истины нередкодает противоречивые результаты, ибо действительно научная аргументация требует определенного структурирования, опосредования,абстрагирования и, кроме того, методической вооруженности исследователя.Только в последние годы в психологии стала широко осознаваться задача согласования теоретических разработок с эмпирическими результатами, для чего стали необходимыми методы, позволяющиеэто делать без заметной потери качества такого согласования.
Тестыявляются сейчас, по-видимому, наиболее развитой в научном отношении частьюметодического арсенала,позволяющего адекватно43скреплять теорию с эмпирией, в соответствии с некоторыми известными стандартами качества информации. Именно такое пониманиетестов все в большей мере начинает утверждаться в новейшей отечественной и зарубежной литературе (Анастази А., 1982; Бурлачук Л. Ф.,1979; Кабанов М. М., Личко А. Е., Смирнов В. М., 1983; Кулагин Б.
В.,1984; Марищук В. Л. и др., 1984; Мельников В. М., Ямпольский Л. Т.,1985; Практикум по .психодиагностике. Дифференциальная психометрика, 1984; Психологические методы исследования личности в клинике, 1978; Шванцара И. и др., 1978),Обоснование качества результатов психологических исследований требует обращения к внепсихологическим понятиям и критериям:философским, логическим, математико-статистическим. В частности,философский элемент в теорию психологических измерений вноситизвестный тезис о неизбежности погрешности измерений. Критикипсихологических тестов нередко апеллируют к этому тезису как к основанию принципиальной порочности тестов в смысле точности измерений.
Неточные измерения, считают они, науке вообще не нужны.При этом как-то забывается, что формой преодоления этого философского скепсиса является тезис о возможности приближенного измерения с достаточно приемлемой точностью. Применение на практике последнего тезиса позволило получить, например в физике, те фундаментальные результаты, которыми эта наука по праву гордится.Не вдаваясь в детальный анализ концепции надежности, представляющей предмет отдельного рассмотрения в данной книге, отметим здесь лишь ее связь с понятием «тест». Действительный отход отупрощенного понимания тестов требует наполнения интересующегонас понятия элементами научного языка, восхождения на более высокую ступень абстракции. Концепция надежности составляет одну изоснов переосмысления сущности теста, а также одну из характеристикего качества. С появлением корреляционного анализа (в начале XX в.)были предложены три основных методических подхода к определениюнадежности теста.
Это - повторное тестирование, использование параллельных форм одного и того же теста и, наконец, однократное тестирование с последующим разбиением матрицы исходных результатов(X) на две или большее число частей. За показатель надежности принимается значение коэффициента корреляции.44Значительно позже появились попытки теоретического осмысления этой концепции.
Исходным пунктом всех построений является ужеупоминавшийся тезис о неизбежности погрешности измерений и, какследствие, признание множественности возможных причин искаженияистинного результата измерения.Как результат факторно-аналитического переосмысления концепции надежности и гомогенности теста родилась новая технологиярасчета коэффициента надежности теста.
Ее появление надо рассматривать как реакцию на неприемлемость и искусственность ряда такихусловий и ограничений, как, например, параллельность форм одного итого же теста, равенство дисперсий всех высказываний, одинаковая ихкоррелируемость друг с другом. Д. Армор использовал известный факткорреляции тестовых высказываний между собой и стал рассматриватьее как аргумент, статистической функцией которого является надежность теста.Если все высказывания измеряют один и тот же признак (свойство), то для фиксированного их числа чем больше корреляция междуними, тем более надежен тест.
С другой стороны, высокая корреляцияобеспечивает хорошую факторизуемость корреляционной матрицы (К)и, следовательно, является залогом выделения такого одного фактора,который может объяснить связь большей части дисперсии в R. Следовательно, надежность тестов должна быть связана с результатом факторного анализа.
Предложенная Армором формула оказалась сравнительно простой (Armor D., 1974, с. 20):1 k 1 1 k 1 θ= где θ - коэффициент надежности теста; k— количество высказываний; λ1 - наибольшее значение корня, получаемое при решении характеристических уравнений вида /R - λ • J/ = 0.Помимо надежности в понятие «тест» входит и концепция валидности. Поскольку в психологии нередки случаи увлечения точностью измерения неточно выделенных свойств, соотношение между надежностью и валидностью можно образно представить в виде кучнойстрельбы, но не в центр мишени, т. е.
стрельба ведется из оружиявполне надежного, но прицел стрелок выбрал не совсем точно.Современный тест - это не только надежный, но и валидный45тест, однако не на все случаи жизни, а разработанный для конкретнойцели. Нет тестов вообще надежных и валидных. Эти качества характеризуют не только инструмент измерения, но обязательно характер,цель и время его применения. В историческом разрезе концепция валидности, так же как и надежности, начиналась с наивного предположения о том, что метод «работает», т.
е. каждый создаваемый тестрассматривался как валидный, примерно так, как если бы каждая создаваемая социологами анкета годилась для решения поставленных задач. Первые же проявления действительно научной критики развенчали эту, по сути дела, «веру» в валидность. Они же стимулировали поиск. Привлечение известных ученых к созданию тестов было для научной общественности в начале нынешнего века гарантией убедительности обоснования валидности как бы по авторитету. Но это былдотеоретический,доэмпирический,посуществу,донаучныйэтапоценки качества тестов.Поскольку в те годы тесты разрабатывались исключительно длярешения практических проблем, эмпиризм и соответствующая ему методология стали главными для обоснования качества инструментария.Это особенно проявилось в создании тестов для решения кадровыхпроблем: профотбора, профориентации, профконсультации, а такжераспределения принятого контингента по специальностям и отделениям внутри производства или учебного заведения.С точки зрения истории, можно выделить два основных, эмпирических подхода к валидизации тестов.
Первый назовем прогностическим. Его логика такова. Если те, кто хорошо работает (по критериюУ), показывают высокие результаты по какому-либо теcту (X), значит,здесь есть связь, быть может, и причинная. Иначе говоря, Y, вероятно,зависит от X.
Отдавая предпочтение при приеме на работу тем, у коговыше результаты по X, предполагается, что они покажут и более высокую производительность труда. Ожидания такого рода часто сбываются, но в различной степени. Другой подход к эмпирической валидизации тестов основан на использовании экспертных оценок. Здесь логика еще проще: если эксперты (множество авторитетов) согласованносчитают одних более способными, других - менее, значит, «это так». Вслучае когда результаты теста указывают на сходную тенденцию, т. е.данные по тесту коррелируют с данными экспертизы, то принимается,46что тест является валидным и его можно далее примерять и в другихподобных ситуациях. Так проводилась валидизация первого теста дляизмерения интеллектуальных способностей (Бине А.
и Симон Т.), а внаше время - некоторых тестов для измерения социальных потребностей молодежи (Прогнозирование социальных потребностей молодежи.М., 1978).Развитие тестов в тесных рамках эмпиризма не могло продолжаться сколь-нибудь долгое время. Без теоретического мышления, какуказывал Ф. Энгельс, невозможно связать между собой хотя бы двафакта природы или уразуметь существующую между ними связь(Маркс К., Энгельс Ф. Соч., т. 20, с. 382). Обращение к внеэмпирическим критериям истинности было неизбежным.
Отсюда последовалитакие подходы к валидизации, в которых теория сочеталась с эмпирией. В качестве примера можно взять важную для традиционной психологии область научных конструктов, ключевых психологических понятий. Именно понятия и конструкты стали основным предметом многихисследований с помощью тестов. Последние призваны уточнить эмпирический состав индикаторов (высказываний), соответствующих такимконструктам-понятиям, как личность, темперамент, интеллект, экстраверт и многим другим. В современной психологии они стали предметомэмпирического исследования, и делается это с целью фундаментального обоснования практической значимости теоретических суждений.Теперь пора ответить на последний вопрос - что же такое современный психологический тест? Это теоретически и эмпирически обоснованная система высказываний (заданий), позволяющая получитьизмерения соответствующих психологических свойств.
Теоретическоеобоснование предполагает всесторонний анализ теста и результатовего применения в свете известных достижений современной психологической науки. Эмпирическое же обоснование связано с обращением к опыту, измерениям и эксперименту.Здесь может возникнуть ошибочная ассоциация с неопозитивистским принципом верификации. Этому способствует наличие в обоихслучаях требования эмпирического согласования теоретических концепций (конструктов).