Популярные услуги

КМ-3 Важнейшие аспекты теории графов - любой вариант за 3 суток!
Любая задача по линалу
Решу любую задачу
Любая задача по математическому анализу и по интегралам и дифференциальным уравнениям
Любая задача по Линейной алгебре и аналитической геометрии
НОМОТЕХ
Повышение уникальности твоей работе
Контрольная работа по рядам (КМ-3) ИДДО 2022
Предельные теоремы и математическая статистика
Сдам любой тест по дискретке в течение суток на положительную оценку!

Рандомизированный сдвоенный план

2021-03-09СтудИзба

10.2. Рандомизированный сдвоенный план

Можно значительно увеличить точность сравнений, делая их в пределах подобранных пар объектов эксперимента. Рандомизация в этом случае осуществляется чрезвычайно легко и может обеспечить правильность таких экспериментов. Покажем это на примере эксперимента с ботинками мальчиков [Box с соавт. (2005) стр. 81].

В таблице 10.2.1 представлены данные результатов измерений износа подошв ботинок, которые носили 10 мальчиков. Подошвы ботинок были изготовлены из двух разных синтетических материалов, а именно, стандартного А и более дешёвого В. Данные износа показаны на Рис.10.2.1 чёрными кружками для материала А и белыми кружками для материала В. На рисунке нет ясного представления, что один материал более износостойкий чем другой.

Таблица 10.2.1. Результаты эксперимента с ботинками мальчиков

Мальчики

Материал А

Материал В

Разности d=B–A

1

Рекомендуемые материалы

13,2(Л)

14,0(П)

0,8

2

8,2(Л)

8,8(П)

0,6

3

10,9(П)

11,2(Л)

0,3

4

14,3(Л)

14,2(П)

–0,1

5

10,7(П)

11,8(Л)

1,1

6

6,6(Л)

6,4(П)

–0,2

7

9,5(Л)

9,8(П)

0,3

8

10,8(Л)

11,3(П)

0,5

9

8,8(П)

9,3(Л)

0,5

10

13,3(Л)

13,6(П)

0,3

Усреднённая разность =0,41

Рис.10.2.1. График данных износа для двух различных материалов А и В.

В этом эксперименте опыты проводились сдваиванием, то есть каждый мальчик носил пару ботинок, у которых одна подошва была из материала А, а другая из материала В. Решение об изготовлении левой или правой подошв из А или В осуществлялось подбрасыванием монеты. В опытах некоторые мальчики износили подошвы ботинок больше чем другие, однако для каждого мальчика его пара ботинок подвергалась одинаковому рассмотрению, то есть находилась разность износов подошв из материалов В и А. При этом, рассматривая 10 разностей В–А износа подошв пар ботинок, большая часть вариации износа от мальчика к мальчику устраняется. План эксперимента такого типа называется рандомизированным планом сдвоенного сравнения.

Заметим, что в то время как желательно, чтобы ошибка эксперимента внутри пар ботинок была малой, нет необходимости и даже желания, чтобы вариацию между парами делать малой. Сначала можно подумать, что было бы лучше выполнить все опыты с одним и тем же мальчиком, но на самом деле это не так. Если бы это было сделано, то выводы были бы применимы только к этому отдельному мальчику. Использование 10 разных мальчиков вносит в эксперимент то, что Фишер называл «более широкой индуктивной основой». При этом получаемые выводы много меньше зависят от выбора мальчиков. Такая идея экспериментирования является особым случаем для разработки устойчивых к различным воздействиям изделий, как будет обсуждаться позднее. Здесь же можно сказать, что получаемые на основе эксперимента выводы не зависят от выбора мальчиков.

Анализ данных эксперимента по плану сдвоенного сравнения

Материал А был стандартным, а материал В был более дешёвым его заменителем. Опасались, что такая замена даст в результате увеличение износа. Задачей эксперимента было проверить гипотезу, что при замене материала А на В не происходит изменения износа, в сравнении с тем, что при использовании материала В наблюдается увеличение износа. Данные этого эксперимента приведены в таблице 10.2.1.

Рандомизация эксперимента сдвоенного сравнения осуществлялась путём подбрасывания монеты. Выпадение герба означало, что левую подошву изготовляли из материал А. Результаты подбрасывания монеты получены следующими:

Л         Л         П         Л         П         Л         Л         Л         П         Л,

приводя к показанной в таблице 10.2.1 последовательности опытов.

Будем считать нулевую гипотезу верной, то есть, что износ подошв из материалов А и В одинаковый. Согласно этой гипотезе, данные парам результатов износа обозначения просто определяют знак разности В–А. Каждая последовательность из 10 результатов подбрасывания монеты является одной из 210=1024 равновероятных последовательностей. Поэтому, для проверки нулевой гипотезы, полученная в эксперименте усреднённая разность 0,41 может быть сравнена с другими 1024 усреднёнными разностей, вычисленными для каждой из 1024 возможных последовательностей знаков + и – в выражении

=.                                          (3.2.1)

Для вычисления этих усреднённых необходима матрица размеров 1024х10 с расположенными в случайном порядке элементами из чисел +1 и –1. На компьютере такая матрица может быть получена с использованием функции RANDBETWEEN(1,2) программы Microsoft Excel. Эта функция позволяет получить требуемую матрицу с элементами в виде двух чисел, которые можно заменить на +1 и –1 с использованием Microsoft Word. Далее, используя программу Mathcad, эта матрица умножается справа на вектор абсолютных значений столбца разностей d=B–A таблицы 10.2.1 и получаемый вектор делится на 10. Результат такого вычисления даёт 1024 усреднённых разности.

Гистограмма этих усреднённых разностей вместе с графиком функции плотности вероятности надлежащим образом нормированного нормального распределения, показаны на Рис.10.2.2.

Для полученного в эксперименте значения =0,41 только 9 из 1024 усреднённых разностей, вычисленных путём изменений знаков + и – в выражении (3.2.1), дают значения  равные или большие чем 0,41. Таким образом, уровень вероятности получается 9/1024≈0,009. Следовательно в результате этой рандомизированной проверки получается, что использование более дешёвого материала В даёт весьма статистически значимое увеличение износа.

Рис.10.2.2. Гистограмма усреднённых разностей и график функции плотности вероятности нормированного нормального распределения

Проверка с использованием распределения t

Рассмотрим снова приведённые в таблице 10.2.1 разности d. Если гипотеза случайного выбора их усреднённых из нормально распределённой популяции со средним δ верна, то можно использовать распределение t для сравнения усреднённых  с любым гипотетическим значением δ0 среднего δ. Если существует n разностей, то оценка их дисперсии делается по формуле

sd2==0,149

и оценки стандартного отклонения разностей и их усреднённых делаются соответственно по формулам

sd ==0,387 и ===0,122.

Соответствующее нулевой гипотезе δ0=0 значение статистики tр0 получается так

tр0===3,35.

Уровень вероятности Pr(tр≥3,35) для этого значения статистики можно взять из таблицы значений вероятности распределения t с v=9 степенями свободы или найти по формуле

Pr(tр>3,35)=1–pt(3,35, 9)≈0,004,

используя компьютерную программу Mathcad. Этот уровень вероятности согласуется со значением 0,009, полученным в результате проверки с использованием множества из 1024 усреднённых разностей.

Упражнение 10.2.1. Используя обычную нулевую гипотезу, создайте распределение для сравнения и соответствующее распределение t и вычислите основанные на каждом уровни вероятности для полученных по рандомизированному сдвоенному плану для сравнения следующих данных:

В   А

7    9

А   В

3    5

А   В

8    12

В   А

11   4

А   В

4    6

Упражнение 10.2.2. Повторите предыдущее упражнение со следующими данными:

В   А

29  29

В   А

32  30

А   В

23  25

А   В

36  37

В   А

39  38

В   А

31  31

А   В

27  26

В   А

30  27

Обсуждение рассмотренных проверок

Из приведённых примеров проверок с использованием рандомизации и перестановок, а также связанных с ними проверок на основе распределения t может возникнуть впечатление, что этими проверками всегда можно воспользоваться. Следующий пример показывает, что это не так. Из него следует, что для сравнения двух средних полученное с использованием рандомизации распределение может не аппроксимироваться нормальным [Ludbrook, Dudley (1998)].

В примере полагалось, что посещающим тренировочный центр 12 мужчинам было предложено участвовать «в эксперименте, чтобы установить, что питание рыбой (а не мясом) приводит к более низким концентрациям холестерина плазмы, чем питание мясом (а не рыбой)». Мужчины были случайно распределены по питающимся рыбой или мясом группам и далее считалось, что в конце одного года питания их измеряемые концентрации холестерина были следующими:

Питание рыбой:

5,42

5,86

6,16

6,55

6,80

7,00

7,11

nр=7, рыба=6,41

Питание мясом:

6,51

7,56

7,61

7,84

11,50

nм=5, мясо=8,20

Отметим, что большинство исследователей заметили бы выделяющееся значение 11,50 в питавшейся мясом группе (см. графики кумулятивных вероятностей данных на Рис.10.2.3). При этом утверждается, что это не было результатом неверной записи или использования некоторой другой процедуры измерения.

Считая верной гипотезу, что питание рыбой или мясом не меняет концентрации холестерина плазмы, и используя комбинации, можно вычислить множество разностей между усреднёнными мясорыба по представленной в приложении к этой главе методике, а также построить на Рис.10.2.4 их гистограмму. Эта гистограмма представляет распределение с двумя вершинами непохожее на симметричное нормальное распределение.

Рис.10.2.3. Графики кумулятивных вероятностей распределения данных для питавшихся рыбой или мясом

Рис.10.2.4. Гистограмма сдвоенного распределения для разностей мясорыба

В реальном исследовании, обнаружив, что резко выделяющийся результат является действительным (а не ошибкой записи), было бы очень важно задать вопрос: «Может было что-то не так с рассматриваемым объектом или с этим отдельным опытом, который дал резко выделяющийся результат?» Все ли измерения холестерина были сделаны в одной и той же лаборатории? Каковы были записи холестерина для мужчин в начале изучения? Отклоняющийся от нормы мужчина, не член ли фамилии, у которой уровни холестерина были свойственны данной местности? Не прекратил ли мужчина ходить на тренировки? Не изменил ли он вид тренировок? Не подтверждают ли проверки физического состояния и соответствующие лабораторные анализы другие аномалии? В реальном научном исследовании ответы на такие вопросы в большой степени повлияли бы на направление последующего исследования.

Поставленный статистический вопрос был: «Является ли нулевая гипотеза верной, что питающиеся мясом и рыбой являются представителями одной и той же популяции или из двух популяций с разными средними?» Однако если любое из приведённых выше объяснений было бы найдено правильным, то отклоняющееся от нормы наблюдение было бы из третей популяции (например, питающихся мясом, кто были членами фамилии с высоким уровнем холестерина). При этом выделяющееся наблюдение является членом иного подмножества и полученное на основе двух выборок распределение для сравнения, найденное на основе рандомизации и комбинаций, не является пригодным для сравнения.

Левая часть гистограммы на Рис.10.2.4 получается в основном из-за отклоняющегося от нормы значения 11,50. Почти все выборки левого горба содержат отклоняющееся от нормы значение для усреднённых мясо и те, что в правом горбе - для усреднённых рыба. В последующем исследовании этих данных не должно использоваться это распределение с двумя вершинами для выполнения проверки значимости или поиска некоторой другой проверки, но надо постараться определить причину резко выделяющегося результата наблюдения. Если эта причина будет найдена, то может состояться наиболее важное открытие этого эксперимента.

12.3 Дальнейшее развитие культурной жизни - лекция, которая пользуется популярностью у тех, кто читал эту лекцию.

Учёт резко выделяющихся результатов наблюдений

Независимо от области экспертизы, в рассмотренных примерах присутствуют важные уроки, которые должны быть усвоены. В книгах и во многих опубликованных статьях рассматривается в основном анализ данных, которые в течение долгого времени мертвы. С резко выделяющимися от остальных наблюдениями можно иметь дело, только проводя их разные проверки. Поэтому, найдя отдельное подозрительное «множество данных», необходимо его анализировать, а затем повторно анализировать. В нём один эксперт найдёт резко выделяющееся значение, другой будет спорить, что существует, возможно, два резко выделяющихся значения, а другой скажет, что если делается соответствующее преобразование данных, то не будет ни одного резко выделяющегося значения, и так далее. Но такой анализ мертвых данных, полученных на экспериментальной установке, которой уже не существует, являются неминуемо неактивным и не может привести к каким-то определённым выводам.

Вопрос: «если вы получили эти результаты, то, что вы теперь будете делать?» редко задаётся и, если довольствоваться только анализом данных, то в любом случае с этим ничего нельзя сделать. Причина противоречивых результатов опытов, не являющихся ошибками записей, может быть найдена только наблюдением и проверкой генерирующего данные объекта и, возможно, выполнением одного или двух дополнительных опытов и обнаружением того, что сделано неправильно и может объяснить подозрительные результаты опытов. (Экспериментируйте и увидите.) Это возможно только, если непосредственно участвовать в выполнении проводимого исследования.

Таким образом, когда в исследовании получаются отклоняющиеся от нормы результаты, то необходимо пройти в лабораторию к опытной установке или испытательному стенду, где получаются данные, и выяснить, как они получаются у ответственного за эксперимент и за обстановку, окружающую процесс сбора данных. Это одна из многих причин, почему разработчик и специалист по анализу данных эксперимента должны вместе участвовать в исследовании.

Посещая лабораторию, процесс или испытательный стенд, где были получены данные, и, общаясь с выполняющим эксперименты персоналом, первое, на что необходимо обращать внимание это являются ли анализируемые данные теми же, что и данные записываемые изначально. Если не было ошибок записи, то необходимо попытаться обнаружить, не случилось ли чего-нибудь необычного при выполнении подозрительного опыта. Хорошие экспериментаторы ведут записи о выполняемых опытах эксперимента. И это рекомендуется делать всем экспериментаторам. Экспериментатор может сказать: «да, чтобы обеспечить эту особую комбинацию устанавливаемых условий, необходимо изменить другие определённые факторы» (например, использовать более высокое давление или увеличенный расход). Отступления от предписанных условий такого типа может быть причиной необычно больших значений (возможно хороших) или малых значений (возможно плохих) данных. В первом случае проявляет себя неучтённый фактор, который может использоваться для улучшения процесса, а во втором, видимо, найдены условия, которых необходимо избегать. В любом случае поиск причины появления необычных данных, вероятно, научит чему-то и укажет направление, в котором необходимо проводить дальнейшее экспериментирование.

Необходимо помнить, что инженеры и технологи вашего предприятия, как и инженеры и технологи ваших конкурентов, имеют похожее образование и владеют похожими убеждениями. Поэтому обнаружение неожиданных данных является, несомненно, важным, так как это может поставить вас впереди конкурентов. Говорят, что дыра в слое озона атмосферы была бы найдена много раньше, если бы данные постоянно передаваемые с орбитального спутника не фильтровались программой компьютера, которая автоматически удаляла или снижала резко выделяющиеся значения. Если «плохие значения» просто выбрасываются, то с ними может выбрасываться важная информация.

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5184
Авторов
на СтудИзбе
436
Средний доход
с одного платного файла
Обучение Подробнее