Учебник - общая психодиагностика - 2006 (846296), страница 17
Текст из файла (страница 17)
Е., 1983; Osgood Ch., 1959). В сущности, эта методика была началом введения в контент-анализ корреляционной техники, а затем ифакторного анализа.Новым этапом в развитии контент-анализа стала его компьютеризация в 60-х годах. Ё Массачусетском технологическом институтепоявился «универсальный анализатор» (The General Inquirer) - комплекс компьютерных программ анализа текстовых материалов, при помощи которого можно подсчитывать частоты категорий содержаниятекста, получать различные индексы на основе совместного появленияэтих категорий и т. д. (Stone Ph., Dunphy D., 1966). Подобным образомбыли исследованы речи двадцати американских президентов при ихвступлении на этот пост, редакционные статьи в газетах разных стран,личные письма, сочинения, вербальное поведение психически больных людей и прочие материалы.
С 70-х годов в США разрабатываютсястандартные компьютерные программы анализа разнообразных документов, которые предлагаются организациям и частным лицам (СохопА., 1977), компьютерный контент-анализ развивается и в других странах (Deichelsel A., 1975).Естественно, что использование компьютерных программ в контент-анализе обеспечивает этому методу явные преимущества, заключающиеся в надежности получаемых данных и быстроте анализа, посравнению с ручным, выполняемым людьми-кодировщиками, которыеподвержены ошибкам из-за утомления и субъективных факторов. Таким образом, трудоемкость составления программ окупается тем огромным объемом содержания, которое достаточно быстро и надежноможно проанализировать на компьютере, а также освобождением кодировщиков от их чрезвычайно утомительного труда. В целом проблемы использования машинного контент-анализа близки общей страте75гии применения компьютеров в эмпирических социальных исследованиях.
Важно правильно определить, когда следует воспользоватьсямашинным, а когда ручным анализом, что зависит от задач исследования, от объема материалов, подлежащих анализу, от степени их формализуемости.ГЛАВА 3 ПСИХОМЕТРИЧЕСКИЕ ПСИХОДИАГНОСТИКИ3.1. РЕПРЕЗЕНТАТИВНОСТЬ ТЕСТОВЫХ НОРМОсновные статистические принципы построения тестов достаточно полно освещены в появившейся в начале 80-х годов на русскомязыке литературе по дифференциальной психометрике (Аванесов В.С., 1982; Анастази А., 1982; Гайда В.
К., Захаров В. П., 1982). Тем неменее в указанных руководствах центральная проблема психометрикитестов-вопросотестовыхнормах-ещенеполучилапос-ледовательного освещения. Прежде всего это относится к руководствуизвестной представительницы американской тестологии А. Анастази.В руководстве Анастази не получают достаточного критическогообсуждения две основополагающие предпосылки традиционной западной тестологии: вопрос о применении статистических норм (квантилей распределения баллов) в качестве диагностических норм и вопрос о сведении всех эмпирических распределений к нормальной модели.
Ниже эти предпосылки будут проанализированы в контекстекраткой реконструкции системы основных понятий дифференциальнойпсихометрики.Статистическая природа тестовых шкал. Типичный измерительный тест в психодиагностике - это последовательность краткихзаданий, или пунктов, дающая в результате ее выполнения испытуемым последовательность исходов, которая затем подвергается однозначной количественной интерпретации.
Примеры интерпретации винтеллектуальных тестах, состоящих из отдельных задач: «правильное решение», «ошибочное решение», «отсутствие ответа» (пропускзадачи из-за нехватки времени). Примеры интерпретации в случаеличностных опросников, состоящих из высказываний, предлагаемыхдля подтверждения испытуемым: «подтверждение» (ответ «верно»),76«отвержение» (ответы «не согласен», «неверно»).Суммарный балл по тесту подсчитывается с помощью ключа:ключ устанавливает числовое значение исхода по каждому пункту.Например, за правильное решение задания дается «+1», за неправильное решение или пропуск - «О».
Тогда балл буквально выражаетколичество правильных ответов.Исход по отдельному заданию подвержен воздействию не толькосо стороны измеряемого фактора - способности или черты личностииспытуемого, но и побочных шумовых факторов, которые являютсяиррелевантными по отношению к задаче измерения. Примеры случайных факторов: колебания внимания, вызванные неожиданными отвлекающими событиями (шум на улице, стук в дверь и т. п.), трудности в понимании смысла задания (вопроса), вызванные особенностямиопыта данного конкретного испытуемого, и т. п.
Последовательностьисходов оказывается последовательностью событий, содержащей постоянный и случайный компоненты. Как известно, основным приемом,позволяющим устранить искажающее влияние случайных факторов нарезультат (суммарный балл), Является балансировка этого влияния спомощью повторения. При этом фактически предполагается, что повторение обеспечивает рандомизацию (случайное варьирование) неконтролируемого фактора, в результате чего при суммировании исходов Положительные и негативные эффекты случайных факторов взаимопоглощаются (о механизме рандомизации см.: Готтсданкер Р.,1982).В оптимальном тесте набор и последовательность заданий организуются таким образом, чтобы повысить долю постоянного компонента и сократить долю случайного в величине суммарного балла.
Темне менее, несмотря на различные статистические ухищрения, суммарный балл в психологических измерениях содержит несравненно большую долю случайного компонента, чем в обычных физических измерениях. В силу этого суммарный балл оказывается определеннымлишь в известных пределах, заданных ошибкой измерения.Для того чтобы оценить эффективность, дифференциальнуюценность всей процедуры измерения, необходимо соотнести размерыошибки измерения с размерами разброса суммарных баллов, вызванных индивидуальными различиями в измеряемой характеристике меж77ду испытуемыми. В терминах Статистики речь идет о сравнении такназываемой истинной дисперсии распределения суммарных баллов сдисперсией ошибки.
Именно этим обусловлен необходимый интереспсихометристов к распределению суммарных баллов. Поэтому анализраспределения необходим не только при использовании статистических норм, но и в случае абсолютных и критериальных норм.Как известно, частотное распределение суммарных баллов имеет удобную графическую интерпретацию в виде кривых распределений: гистограммы и кумуляты (см., в частности, удачное популярноевведение в описание распределений в книге: Кимбл Г., 1982, с.
5570). В случае гистограммы по оси абсцисс откладываются «сырые очки» -первичные показатели суммарных баллов, возможных для данного теста, по оси ординат - относительные частоты (или проценты)встречаемости баллов в выборке стандартизации (Анастази А., 1982, с.66). Как известно, для «колоколообразной» кривой нормального распределения дисперсия визуализируется как параметр, ответственныйза «распластанность» графика плотности вероятности (теоретическогоаналога эмпирической кумуляты) вдоль оси X. Чтобы визуализироватьдисперсию ошибки измерения, нужно было бы многократно провеститест с одним испытуемым и построить графическое распределениечастот его индивидуальных баллов (рис.
1).Очевидно, что дифференцирующая способность теста сводится кнулю, если кривые, иллюстрирующие «истинную» и «ошибочную»дисперсии» совпадают. Как видим, анализ распределения тестовыхбаллов необходим уже для анализа надежности теста (см. раздел 3.2).Проблема меры в психометрике и свойства пунктов теста. В физических измерениях калибровка шкалы производится на основе контроля за равномерным варьированием измеряемого свойства в эталонных объектах.
Носителем меры является эталон- физический объект, стабильно сохраняющий заданную величину измеряемого свойства. В дифференциальной психометрике такие физические эталоны отсутствуют: мы не располагаем индивидами, которые были бы постоянными носителями заданной величины измеряемого свойства.78Рис.
1.Соотношение индивидуальной и общей вариациитестовых балловРоль косвенных эталонов в психометрике выполняют сами тесты: в том смысле, в каком трудность задач можно рассматривать каквеличину, прямо пропорционально сопряженную со способностью (чемтруднее задача, тем выше должен быть уровень способности, требуемый для ее решения). Аналогом понятия «трудность» для «ливопросов»1 опросника является «сила»: более «сильные» высказывания (в логическом смысле) вызывают подтверждение (согласие) уменьшего числа испытуемых. Ни трудность, ни силу пунктов тестанельзя выявить иначе, чем с помощью проведения теста. Операциональным определением трудности оказывается «процентильная мера»:процент испытуемых, справившихся с заданием теста (или ответивших«верно» на «ли-вопрос»). Чем меньше процент, тем выше трудность.Кривая распределения тестовых баллов отражает свойства пунктов, из которых составлен тест.
Если кривая имеет правостороннююасимметрию, то в тесте преобладают трудные задания; если криваяимеет левостороннюю асимметрию, значит, большинство пунктов втесте - легкие (слабые) (рис. 2).Рис. 2.Асимметрии распределения тестовых баллов1«Ли-вопросы» - это вопросы, содержащие высказывания, с которыми испытуемый должен либо согласиться, либо не согласиться.79Тесты первого типа плохо дифференцируют испытуемых с низким уровнем способностей: все эти испытуемые получают примерноодинаковый низкий балл. Тесты второго типа, наоборот, хуже дифференцируют испытуемых с высоким уровнем способностей.Если пункты обладают оптимальным уровнем трудности (силы),то кривая распределения зависит от того, насколько пункты однородны. Если пункты разнородны (исход по одному пункту не предопределяет исход по другому), то мы получаем тест в виде последовательности независимых испытаний Бернулли.