131396 (593613), страница 4
Текст из файла (страница 4)
За индекс надежности принимается коэффициент корреляции между результатами тестирования двумя этими частями. Он называется коэффициентом внутренней согласованности теста.
Валидность и надежность. Тест может быть надежен, но не валиден. Это означает, что он измеряет какое-то свойство очень точно, но какое именно – остается под вопросом. В такой ситуации необходима более точная валидизация теста, как содержательная, так и практическая.
Со стороны взаимодействия испытуемого с тестом, причины недостоверности результатов могут быть следующие:
-
у респондента может не быть четкого представления о том, о чем его спрашивают;
-
на респондента влияет фактор социальной желательности, то есть респондент пытается представить себя в наивыгодном свете, отвечает, ориентируясь на общепринятые нормы. Во избежании влияния такого фактора в опросники вводятся шкалы лжи;
-
респондент не способен оценить те черты, о которых его спрашивают;
-
позиционный стиль ответов, то есть через некоторое время испытуемый начинает отвечать в одном ключе, поймав какую-то нить (например, «да, да, да...»). Чтобы этого не происходило, вводят прямые и обратные вопросы;
-
респондент отвечает случайным образом. Чтобы избежать случайных ответов, вводят дублирующие друг друга вопросы (очень близкие синонимы).
2.4. Процесс разработки психодиагностических методик (опросников)
-
Определение гипотетического конструкта.
Прежде всего, необходимо точно определить, что будет измерять тест. Для этого анализируем соответствующую литературу, чтобы уточнить понятие. Сразу же стоит определить характеристики выборки, для которой тест предназначен – пол, возраст, другие особенности, если они важны. Результатом является т.н. теоретическое определение, раскрывающее сущность явления (измеряемого свойства) и его связи с другими психическими свойствами. Но для создания методики определение должно быть более подробным, и раскрывать также причины – другие, более глубокие явления, с которым связано измеряемое. При этом важно, чтобы определение было корректным с точки зрения логики, иначе тест, если и будет создан, будет измерять неизвестно что.
Далее, на основе теоретического, создаётся операциональное определение. Оно описывает соответствующее измеряемому свойству поведение и состояния.
Следующий шаг – выделение из операционального определения индикаторов.
-
Разработка первоначальной формы опросника
Принимается решение о форме ответов: дихотомия, трихотомия, количественная оценка и т.п.
Далее, к каждому индикатору придумывают ряд заданий (вопросов или утверждений). При этом должно быть примерно одинаковое число прямых и обратных заданий
Требования к формулировкам заданий:
-
неочевидность значений ответов;
-
понятность и недвусмысленность;
-
конкретность;
-
в каждом задании должен быть только один вопрос или утверждение;
-
следует избегать вопросов о частоте, если она не определена;
-
не должны навязываться определённые ответы;
-
формулировка должна побуждать к первому, пришедшему на ум ответу;
-
испытуемому над ответами не приходилось бы надолго задумываться;
-
задания должны охватывать всю область проявления.
Когда задания сформулированы, их следует «перемешать» так, чтобы
-
вопросы по одному индикатору не шли подряд;
-
прямые и обратные вопросы чередовались, лучше – случайным образом.
2.4..3. Психометрическая проверка (анализ пунктов).
С помощью первоначальной формы тестируют выборку испытуемых (т.н. первоначальное тестирование). По поводу необходимого её размера спорят, но все сходятся, что минимальное число испытуемых – 200 человек. Более точный размер зависит от специфики конструкта. Разумеется, выборка должна соответствовать стандартным требованиям.
После тестирования данные обрабатываются.
Для теста в целом основной показатель – коэффициент однородности α, показывающий, насколько задания в целом измеряют что-то одно. Чаще всего это коэффициент Кьюдера-Ричардсона, значение которого д.б. не менее 0.75 – 0.85, лучшие по надежности тесты дают коэффициенты порядка 0,90 и более.
Используется также коэффициент корреляции при расщеплении пополам Спирмена-Брауна.
Для каждого задания существует ряд показателей, главные из которых
-
коэффициент корреляции с итоговым баллом и индекс дискриминативности
2.4.4. Отбор и корректировка заданий
На основании подсчитанных показателей отбираются пригодные. Отбрасываются, прежде всего, те, что имеют корреляцию с итоговым баллом, близкую к 1 . кстати. Потом выбрасываем недискриминативные задания. Обычно «вылетают» более половины заданий. Если оставшихся не хватает, то предпринимаем следующие меры:
-
в заданиях, имеющих отрицательную и значимую корреляцию с итоговым баллом ключ меняют на обратный;
В недискриминативных вопросах:
- смягчают или конкретизируют формулировку;
-
по-другому определяют объём;
-
анализируют содержание и определяют социокультурные факторы искажения, изменяют формулировку с учётом этого;
2.4.5. Проверка валидности и надёжности исправленной формы.
Из отобранных и изменённых заданий формируют исправленную форму с соблюдением тех же требований. Она проверяется на аналогичной, но другой выборке. Далее повторяется вся процедура проверки, но если отбор был произведён тщательно, отбрасывать больше нечего. В противном случае всё приходится начинать сначала.
Однако следует выяснить, что же измеряет получившийся, уже надёжный тест. Для этого существует два основных метода:
А) Метод контрастных групп
Б) Перекрёстная валидизация (проверка конкурентной валидности). Здесь мы снова обратимся к теоретическому определению и подберём уже проверенную надёжную методику, измеряющее то же, связанное или противоположное свойство. Эта методика предлагается тем же испытуемым, на которых проверялась исправленная форма. Между результатами этой и разрабатываемой методики подсчитывается коэффициент корреляции, он должен быть значимым .Если это действительно так, валидность можно считать подтверждённой.
Оптимально совместное использование обоих этих методов.
Следующий шаг – проверка ретестовой надёжности.
2.4.6. Стандартизация и комплектность готовой методики.
Тестовые показатели сами по себе не имеют смысла. Их необходимо сопоставить с усреднёнными нормами. Для современных методик существует требование переводить сырые баллы в стандартные единицы.
На этапе создания теста формируется некоторая группа испытуемых, на которой проводится данный тест. Средний результат выполнения этого теста в данной группе принято считать нормой. Средний результат - это не единственное число, а диапазон значений. Существуют определенные правила формирования такой группы испытуемых, или, как ее иначе называют, выборки стандартизации:
1) выборка стандартизации должна состоять из респондентов, на которых в принципе ориентирован данный тест.
2) выборка стандартизации должна быть репрезентативной, то есть представлять собой уменьшенную модель популяции (группы, для которой тест предназначен) по таким параметрам, как возраст, пол, профессия, географическое распределение и т.д.
Распределение результатов, полученных при тестировании испытуемых выборки стандартизации, можно изобразить с помощью графика - кривой нормального распределения (гистограммы). Он показывает, какие значения первичных показателей входят в зону средних значений (в зону нормы), а какие выше и ниже нормы.
Очень важный, наиболее сложный этап – создание интерпретации, то есть прогнозное описание поведения, свойственного испытуемым с таким-то стандартным баллом. Она создаётся на основе определения, с учётом обнаруженных при проверке валидности связей, анализе того, какие именно индикаторы остались после отбора заданий и т.п.
Итогом всей работы является руководство к тесту, в которое, если это приличный тест, входят:
-
Стандартный стимульный материал (бланк, опросник и инструкция).
-
Ключи и шаблоны для обработки.
-
Краткий теоретический обзор проблемы тестирования данного свойства.
-
Описание и обоснования «идеологии» измерения в данном тесте.
-
Теоретическое и операциональное определения конструкта, индикаторы.
-
Описание популяции, процедуры и условий тестирования.
-
Описание процедуры разработки и следующие показатели:
-
общие коэффициенты однородности всей шкалы;
-
показатели дискриминативности и корреляции с итоговым баллом по каждому заданию;
-
показатели ретестовой надёжности;
-
данные проверки конкурентной валидности (коэф-ты корреляции с каждой из шкал «проверочных» методик);
-
описание выборки стандартизации.
-
Нормы и таблицы перевода сырых баллов в стандартные для каждой категории испытуемых.
-
Интерпретация.
-
Имена авторов, рецензентов, адрес организации.
-
Описание исходной методики
Рассмотрим предложенную В. Леви методику (см. приложение Таблица 1) с точки зрения требований к характеристикам тестов (см. глава 2).
Конструкция данной методики позволяет измерить только наличие определённого уровня страха, но, поскольку шкалы не стандартизированы, трудно судить о том, какой страх преобладает у тестируемого. Утверждения, относящиеся к панфобиям, эзофобиям, присутствуют вперемешку с социальными и зависимыми страхами. Этого можно было избежать, разделив тест на части, каждая из которых представляла бы утверждения, относящиеся к определённому виду страха – так удобнее испытуемым, они могут сосредоточиться на определенной области. Неудобна для испытуемого цифровая оценка. На этом фоне, более привлекательным видится система типа «никогда, редко, в половине случаев, в большинстве случаев, всегда »
Рассмотрим следующие утверждения опросника.
14. Мне случалось испытывать состояние бесконтрольной паники.
Если верить С. И. Ожегову – паника не может быть контролируемой [19]. Однако это утверждение может запутать тестируемого и он будет «вспоминать», в каких случаях паника была контролируемой, в каких нет.
15. Жизнь для меня также страшна, как и смерть.
Здесь подходят ответы типа «да - нет». Ранжирование ответа на это утверждения не только затруднительно, но и глупо.
3.При волнении у меня бывает учащенное сердцебиение, стесненное дыхание, дрожь, потливость, скованность, др. неприятные ощущения…(Если верно хоть одно ставьте баллы).
Допустим у тестируемого в 5 случаях из 10 при волнении бывает учащённое сердцебиение, скованность и потливость; в 5 случаях из 10 – только скованность и неприятные ощущения, а иногда, один раз в год, к выше описанному, добавляется дрожь. Какую цифру в ответе поставить испытуемому?
9. Волнуюсь перед экзаменами, перед публичными выступлениями, перед важными встречами…(Если верно хоть одно ставьте баллы).
22. При нахождении на улице у меня часто возникает боязнь попасть в драку, подвергнуться нападению, ограблению или нас
16. Боюсь летать в самолётах, ездить в метро, автобусе, автомобиле, находиться в лифте…(Если верно хоть одно ставьте баллы).
17. Боюсь темноты, избегаю неосвещённых пространств, предпочитаю не спускаться в подвалы и пещеры.
29. Боюсь уколов, зубоврачебных процедур, медицинских манипуляций в ухе, глазу, других органах…(Если верно хоть одно ставьте баллы).
31. Чтобы снять беспокойство, начинаю больше есть, больше пить, принимать лекарства…(Если верно хоть одно ставьте
35 Оставаясь в полном одиночестве, сплю тревожно, испытываю дискомфорт баллы).
36. Случается, по нескольку раз проверяю, закрыта ли дверь, выключен ли газ, свет, взято ли с собой нужное…(Если верно хоть одно ставьте баллы).
40. Стараюсь откладывать про запас, «на чёрный день» деньги, провизию, вещи, материалы. …(Если верно хоть одно ставьте баллы).
42. Испытываю сильную тревогу, когда заканчиваются запасы денег, еды, сигарет, вина…(Если верно хоть одно ставьте баллы).
В каждом задании содержится несколько утверждений, что делает его бесполезным. Следует сделать утверждения более точными.
5. Обычно стараюсь не рисковать.
7. Люди в основном не заслуживают доверия
11. Постоянно испытываю беспокойство за жизнь и здоровье своих близких (родителей, ребёнка…)