Биогенный магнетит и магниторецепция. Новое о биомагнетизме. Под ред. Дж. Киршвинка. Том 2 (1989) (1095848), страница 89
Текст из файла (страница 89)
ошибочного отрицания нулевой гипотезы). Статистические результаты, значимые на уровне а < 0,10 в случае двухстороннего критерия, автоматически сводятся к значимым на уровне а к 0,05 простым формальным принятием одностороннего критерия. Я полагаю, что при анализе результатов, полученных Бэкером, следует использовать ненаправленные гипотезы, поскольку мы слишком мало знаем о возможных механизмах магнитного чувства у человека, чтобы с уверенностью говорить о наличии какого-либо эффекта вообще. В главе, написанной Бэкером, нет оснований принимать направленную гипотезу для совершенно нового круга явлений хотя бы по той причине, что она является обзором.
Иногда применение односторонних критериев оправдывают тем, что цена ошибки, связанной с отбрасыванием нулевой гипотезы (т.е. риск не обнаружить новое явление), больше, чем цена ошибочного предположения о наличии этого явления. Однако в таких случаях (и особенно в поисковом исследовании) необходимо использовать двухсторонние критерии и высокие значения а (более 0,10). Использование односторонних критериев неявным образом увеличивает вероятность появления ошибки 1 рода. Бэкер справедливо указывает, что если данные не являются независимыми, необходимо анализировать нх на более высоком уровне, чем «уровень один» (обычно называемый в литературе уровнем 1-го порядка). Б таком случае нужно объединять данные по отдельным индивидуумам, опытам и т.п.
до тех пор, пока результаты не станут независимыми. Анализ 2-го порядка широко используется в работах по ориентации, поскольку оценки направления, произведенные испытуемыми, почти всегда зависят от предыдущих оценок. Например, если испытуемый, участвующий в автобусных опытах, решил, что первый пункт, в котором была сделана остановка, находится к югу от дома, то, будучи перевезен на небольшое расстояние, он, вероятно, не станет думать, что находится теперь к северу.
Следовательно, нужно усреднить оценки, сделанные испытуемым при определении направления во всех пунктах, н рассматривать результаты усреднения как единственную экспериментальную точку с е = 1. Применение же анализа третьего порядка бывает целесообразно лишь в очень редких случаях. Бэкер неправ, утверждая„ что если анализ 2-го порядка хорош, то анализ 3-го порядка еще лучше.
Последний имеет смысл применять только тогда, когда есть причины подозревать, что испытуемые не являются независимыми друг от друга. У меня нет оснований для такого предположения, но если оно все-таки справедливо, то это значит, что опыты были так плохо организованы и проведены, 27.
Критическое замечания ло поводу гл. 26 377 что полученным в них данным нельзя доверять независимо от примененного статистического анализа. Анализ более высокого порядка обладает определенными недостатками, поэтому не следует прибегать к нему, не будучи уверенным, что это совершенно необходимо. Цель его состоит в том, чтобы ценой частичной утраты информации, содержащейся в исходных данных, получить надежную оценку. Если исходные данные слабо зависят друг от друга, то при переходе к анализу более высокого порядка утрачивается довольно много независимой информации, и в таком случае, вероятно, лучше использовать анализ более низкого порядка. Так, например, испытуемые, участвующие в автобусных опытах, по всей видимости, независимы друг от друга, поэтому следует использовать анализ 2-го, но не 3-го порядка.
В то же время оценки, даваемые испытуемыми, которые участвуют не в одной, а в нескольких поездках, вероятно, не будут независимыми. Испытуемые могут рассуждать таким образом: «Вчера они везли меня к югу, но есть только одна длинная дорога в южном направлении; вероятно, они не повезут меня в одно и то же место два раза подряд, так что сегодня я вряд ли нахожусь к югу от дома». В данном случае более приемлем анализ 3-го порядка. Наконец, поскольку в этой главе используется много критериев, фактическая вероятность ошибки 1 рода значительно превышает вероятность такой ошибки для отдельных критериев; это недостаток любого мета-анализа. Фактическая вероятность ошибки достигает очень большой величины, 0,5, при использовании 13,5 независимых критериев, в то время как для каждого из них она равна 0,05.
(Отметим, что поскольку не все критерии, использованные Бэкером, являются независимыми, величина 0,5 достигается при большем их числе.) Значимый результат может быть получен чисто случайно, поэтому очень важно проверить его адекватность, проведя несколько аналогичных экспериментов. Для этого и следует использовать формальный мета-анализ, которым пренебрегает Бэкер. 2.
Опыты с вращающимся креслом (разд. «Результаты») Когда в опытах с вращающимся креслом Бэкер попытался определить, ухудшается ли средняя точность оценок (средияя по всем испытуемым) в последней (восьмой) пробе по сравнению с первой, он не мог адекватно оценить, в какой мере испытуемые используют инерционное чувство. Здесь он опять-таки не применил формальный тест на различие между группами.
Я согласен с тем, что характер различия не свидетельствует об использовании испытуемыми инерционного чувства (г в восьмой пробе больше, чем в первой), однако это различие-всего 0,047 — столь мало, что оно скорее всего является случайным. Заметим, что в данном случае следует руководствоваться только длиной вектора ц поскольку Ч.
У. Восприятие магнитных полей человеком 378 инерциальная ошибка у всех испытуемых должна быть случайной по величине и направлению; средний угол в первой пробе должен быть таким же, что и в восьмой. Из предположения об использовании инерционного чувства следует, что число испытуемых, сделавших самые большие ошибки в восьмой пробе, должно быть больше, чем в первой, поэтому г, вычисленное для восьмой пробы, должно быть меньше, чем для первой, Однако я сильно сомневаюсь в правомочности такого сопоставления двух оценок. Кумулятивная ошибка, связанная с инерционным чувством, по-видимому, слишком мала по сравнению с другими эффектами, поэтому следовало бы проанализировать тенденцию изменения оценок в восьми пробах у каждого отдельного испытуемого. Второй метод, использованный Бэкером для выявления инерционного чувства, фактически является просто тестом на выявление «хороших» н «плохих» испытуемых как таковых. Скорее всего «плохие» испытуемые будут одинаково «плохими» при определении как второй, так и первой оценок независимо от того, каким чувством они пользуются-магнитным или инерционным.
Следовательно, этот способ бесполезен для выделения кумулятивной ошибки, присущей инерционному чувству. 3. Данные принстонских опытов не подтверждают выводов Бэкера Я присутствовал при проведении серии опытов Принстон-2, вел счет некоторых карточек с ответами и при помощи компьютера вычислял по исходным данным статистики 2-го порядка.
Я указал Гоулду на расхождения между моими данными н результатами его работы (Ооп1д, Аые, 1981), и он прислал мне поправки, сделанные после проверки карточек с ответами. Гоулд любезно предоставил в мое распоряжение я исходные данные серии опытов Принстон-1, из которых я определил статистики 2-го порядка. Из всех принстонских опытов значимая ориентация по направлению к дому наблюдалась лишь у группы испытуемых с магнитами в серии Принстон-1 (табл.
27.1). Заметим, что характер различия между «магнитной» и контрольной группами в сериях Принстон-1 и Принстон-2 неодинаков, и это наводит на мысль, что значимый результат в серии Принстон-1 является случайным; вероятность получения по меньшей мере одного значимого результата случайным образом при проведении 12 принстонских опытов, представленных в табл. 27.1, составляет около 40'4.
Бэкер никогда ие сообщал о незначимости различий между «магнитной» и контрольной группами в серии Принстон-2, а указывал лишь на значимость такого различия в серии Принстон-1; выводы о такой значимости были основаны на расчетах, проведенных им самим. Однако в этой серии он необоснованно использовал односторонний критерий; применение же корректного для данного случая двухстороннего крите- 379 Таблица 27.1.
Анализ 2-го порлдка применительно к результатам принстонских опытов" л еэ) г Ч Данные — 0,551 — 4,573 — 0,527 — 3,485 20 15 19 50 20 — 6,4 0,3348 6,653е' 20 19 1О 45 3,426 2,605 1,220 6,110»' 15 13,1 0,2131 3,113 Все американские контрольные данные 50 — 107,4 0,2329 45 19,0 0,1436 1О 77 0,14 9 79 0,17 30 20 0,541 144 — 1,8 0,1 284 Принстон-1з' Принстон-2з' Олбаннэ' Корнеллэ' Итого Иапытуемые с магнитом по отношению к контрольным испытуемым л„„, Гт по Уолрофу 20 20 188,5 15 10 62 Принстон-1 2.5.80 Принстон-2 18.2.81 " Все крвтервн — двухсторонпле.
Сравпвте эту таблицу с табл. 26.4. э' е — угловое отклонение 2-го порлдка по отношению к направлению па дом. э' Пра аналлэе оценок четырех напытуеыых в серии Прпнатов-1 попользовав анализ 3-го порядка, поскольку этн испытуемые учаатвовала в опытах 3040.80 а 3 !. !0.8(Г в случае другах пспытуемых л пренебрег ах неоднократным участвем в опытах, поскольку мелду опытами был большой перерыв. Сходвыы образом были обработаны результаты четырех папызачеыых в контрольной труппе опытов Прапстоа-2. Оаевка одного папытуеыого, которые дала г = О, быхп вшлючепы аз аваллэа.
" Я пе обсчитывал влодвые двааые опэпов в Олбавл л Корпелле в лпквк ле проверял пх. о 005 < Р < О,!О; эм ОО! < Р < 005; ччы Р< ОООО!. рия к его неверным числам приводит к незначимому результату. Я не обнаружил никакой значимой разницы между «магнитной» и контрольной группами ни в серии Принстон-1, нн в серии Принстон-2. Здесь особенно уместны двухсторонние критерии, поскольку используются противоположные гипотезы: от предположения о том, что постоянные магниты облегчают ориентацию (например, в манчестерских опытах 27.
Критические замечания ло поводу гл. 2б Контрольные испытуемые 02.05.80 30.10.80 31.10.80 и 24.11.80 Итого" Испытуемые с магнитом 2.5.80 Контрольные испытуемые 16.2.81 17.2.81 18.2.8!м Итогов! Испытуемые с магнкгом 18.2.81 Принстон-1 — 94,3 0,3709 — 172,6 0,3074 — 95,7 0,2783 — 107,4 0,2329 Принстон-2 — 8,8 0,1733 44,7 0,1928 — 8,9 0,1235 19,0 0,1436 — 3,485 6 110е! 0,315 0,292 15,251 чаю 18,485**' 380 Ч. К Восприятие магнитных нолей человеком 198! — 82 гг.; гл.
2б), до предположения об нх «дезорнентнрующем» эффекте (напрнмер, в опытах, проводившихся в Бернард-Кастле, о чем впервые сообщил Бэкер в 1980 г.). Итак, я в отличие от Бэкера считаю, что в принстонских опытах серии 2 нн в «магннтной», нн в контрольной группах не наблюдается значимой ориентации к дому; такая ориентация имела место лишь для «магннтной» группы в серии 1. Хотя анализ результатов всех контрольных опытов, проведенных в Америке (см.