108987 (Репрезентативная теория измерений и её применения), страница 2
Описание файла
Документ из архива "Репрезентативная теория измерений и её применения", который расположен в категории "". Всё это находится в предмете "наука и техника" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "рефераты, доклады и презентации", в предмете "наука и техника" в общих файлах.
Онлайн просмотр документа "108987"
Текст 2 страницы из документа "108987"
из всех средних по Коши в порядковой шкале в качестве средних можно использовать только члены вариационного ряда (порядковые статистики), в частности, медиану, но не среднее арифметическое, среднее геометрическое и т.д.;
в шкала интервалов из всех средних по Колмогорову можно применять только среднее арифметическое;
в шкале отношений из всех средних по Колмогорову устойчивыми относительно сравнения являются только степенные средние и среднее геометрическое).
Доказательство первого из этих утверждений приведено в [12, 16, 17], второго и третьего - в [16, 17, 30], причем в [30] дано обобщение на случай взвешенных средних и несколько обобщены математические "условия регулярности", при справедливости которых верны рассматриваемые утверждения.
Приведем численный пример, показывающий некорректность использования среднего арифметического f(X1, X2) = (X1+X2)/2 в порядковой шкале. Пусть Y1= 1, Y2 = 11, Z1 = 6, Z2 = 8. Тогда f(Y1, Y2) = 6, что меньше, чем f(Z1, Z2) = 7. Пусть строго возрастающее преобразование g таково, что g(1) = 1, g(6) = 6, g(8) = 8, g (11) = 99. Тогда f(g(Y1), g(Y2)) = 50, что больше, чем f(g(Z1), g(Z2)) = 7. В результате преобразования шкалы упорядоченность средних изменилась.
Кроме расчета средних, аналогичные задачи рассмотрены для других алгоритмов статистического анализа данных, в частности, связанных с расстояниями [13,14] и мерами связи случайных признаков [17,31].
Приведенные результаты о средних величинах [17, 30] Я.Э.Камень применил для анализа методов агрегирования датчиков в АСУ ТП доменных печей [32]. Л.Д.Мешалкин выступил с критикой требования равносильности условий (13) и (14) и предложил собственную постановку [33].
Велико прикладное значение РТИ в задачах стандартизации и управления качеством [34], в частности, в квалиметрии [26]. Так, В.В.Подиновский показал, что любое изменение коэффициентов весомости единичных показателей качества продукции приводит к изменению упорядочения изделий по средневзвешенному показателю [35]. Н.В.Хованов развил одну из возможных теорий шкал измерения качества [36].
Максимальными инвариантами в порядковой шкале являются ранжировки, возможно, со связями (синонимы: упорядочения, нестрогие линейные порядки, квазисерии). Поэтому от теории измерений - естественный путь к применению иных методов статистики объектов нечисловой природы, в частности, рассмотренных в обзорах [1-3, 37].
Рассмотрим в качестве примера один сюжет, связанный с ранжировками и рейтингами.
Методы средних баллов
В настоящее время распространены экспертные, маркетинговые, квалиметрические, социологические и др. опросы, в которых опрашиваемых просят выставить баллы объектам, изделиям, технологическим процессам, предприятиям, проектам, заявкам на выполнение научно-исследовательских работ, идеям, проблемам, программам, политикам и т.п., а затем рассчитывают средние баллы и рассматривают их как интегральные оценки, выставленные коллективом опрошенных. Какими формулами пользоваться для вычисления средних величин? Обычно применяют среднее арифметическое. Мы уже более 25 лет знаем, что такой способ некорректен, поскольку баллы обычно измерены в порядковой шкале (см. выше). Обоснованным является использование медиан в качестве средних баллов. Однако полностью игнорировать средние арифметические нецелесообразно из-за их распространенности. Поэтому целесообразно использовать одновременно оба метода - и метод средних арифметических рангов (баллов), и методов медианных рангов. Такая рекомендация находится в согласии с концепцией устойчивости [17], рекомендующей использовать различные методы для обработки одних и тех же данных с целью выделить выводы, получаемые одновременно при всех методах.
Рассмотрим конкретный пример применения только что сформулированного подхода.
Анализировались восемь математических моделей некоторого физико-химического явления, обозначенные следующим образом: Д, Л, М-К, Б, Г-Б, Сол, Стеф, К. В 12 экспериментах измерены реальные значения интересующей исследователей характеристики этого явления. Для условий этих 12 экспериментов найдены расчетные значения рассматриваемой характеристики по каждой из 8 моделей. В приведенной ниже таблице приведены ранги 8 моделей по точности приближения в отдельных экспериментальных точках (ранг 1 - самая точная модель, ранг 2 - вторая по точности, ... , ранг 8 - самая далекая от истинного экспериментального значения модель). Ранжировки получены путем сравнения относительных погрешностей моделей.
Табл. Ранги 8 моделей по точности
приближения и результаты расчетов
№ эксперимента | Д | Л | М-К | Б | Г-Б | Сол | Стеф | К |
1 | 5 | 3 | 1 | 2 | 8 | 4 | 6 | 7 |
2 | 5 | 4 | 3 | 1 | 8 | 2 | 6 | 7 |
3 | 1 | 7 | 5 | 4 | 8 | 2 | 3 | 6 |
4 | 6 | 4 | 2,5 | 2,5 | 8 | 1 | 7 | 5 |
5 | 8 | 2 | 4 | 6 | 3 | 5 | 1 | 7 |
6 | 5 | 6 | 4 | 3 | 2 | 1 | 7 | 8 |
7 | 6 | 1 | 2 | 3 | 5 | 4 | 8 | 7 |
8 | 5 | 1 | 3 | 2 | 7 | 4 | 6 | 8 |
9 | 6 | 1 | 3 | 2 | 5 | 4 | 7 | 8 |
10 | 5 | 3 | 2 | 1 | 8 | 4 | 6 | 7 |
11 | 7 | 1 | 3 | 2 | 6 | 4 | 5 | 8 |
12 | 1 | 6 | 5 | 3 | 8 | 4 | 2 | 7 |
Сумма рангов | 60 | 39 | 37,5 | 31.5 | 76 | 39 | 64 | 85 |
Среднее арифметическое рангов | 5 | 3,25 | 3,125 | 2,625 | 6,333 | 3,25 | 5,333 | 7,083 |
Итоговый ранг по средн. арифм. | 5 | 3,5 | 2 | 1 | 7 | 3,5 | 6 | 8 |
Медианы рангов | 5 | 3 | 3 | 2,25 | 7,5 | 4 | 6 | 7 |
Итоговый ранг по медианам | 5 | 2,5 | 2,5 | 1 | 8 | 4 | 6 | 7 |
В соответствии с методом средних арифметических рангов приведенные в таблице значения складываются по всем экспериментальным точкам (суммы приведены в четвертой снизу строке таблицы) и модели ранжируются в порядке возрастания суммы рангов. Итоговый ранг приведен в третьей снизу строке таблицы. Ранжировка по суммам рангов (или, что то же, по средним арифметическим рангам) имеет вид:
Б < М-К < {Л, Сол} < Д < Стеф < Г-Б < К . (3)
Поскольку модели Л и Сол получили одинаковую сумму баллов, то по рассматриваемому методу ранжирования они эквивалентны, а потому объединены в группу (кластер), т.е. ранжировка (2) имеет одну связь.
Медианы совокупностей из 12 рангов, соответствующих определенным моделям, приведены в предпоследней строке таблицы. (При этом медианы вычислены по обычным правилам статистики - как среднее арифметическое центральных членов вариационного ряда.) Итоговое упорядочение по методу медиан приведено в последней строке таблицы. Ранжировка по медианам имеет вид:
Б < {М-К, Л} < Сол < Д < Стеф < К <Г-Б . (4)
Поскольку модели Л и М-К имеют одинаковые медианы баллов, то по рассматриваемому методу ранжирования они эквивалентны, а потому объединены в группу (кластер), т.е. ранжировка (4) имеет одну связь.
Сравнение ранжировок (3) и (4) показывает их близость (похожесть). Можно принять, что модели М-К, Л, Сол упорядочены как М-К < Л < Сол, но из-за погрешностей статистических данных в одном методе признаны равноценными модели Л и Сол (ранжировка (3)), а в другом - модели М-К и Л (ранжировка (4)). Существенным является только расхождение, касающееся упорядочения моделей К и Г-Б: в ранжировке (3) Г-Б < К, а в ранжировке (4), наоборот, К < Г-Б. Однако эти модели - наименее точные из восьми рассматриваемых, и при выборе наиболее точных моделей для дальнейшего использования на указанное расхождение можно не обращать внимание.
Рассмотренный пример демонстрирует сходство и различие ранжировок, полученным по методу средних арифметических рангов и по методу медиана, а также пользу от их совместного применения.
Заключение
С 1973 г. работает неформальный научный коллектив вокруг научного семинара “Математические методы экспертных оценок и нечисловая статистика”, созданный в рамках секции "Планирование эксперимента" Научного Совета АН СССР по комплексной проблеме "Кибернетика" (сейчас название семинара - "Экспертные оценки и анализ данных"). Проведено много научных исследований, опубликованы десятки монографий и сборников, сотни статей. Существенная часть полученных результатов посвящена проблемам статистики объектов нечисловой природы и отражена в обзорах [1-3,37]. Однако не было стимулов стремиться к практическому внедрению теоретических исследований, разрабатывать методики и компьютерные системы.
В настоящее время ситуация изменилась. Возникла масса аналитических центров, которым разработки нашего научного коллектива явно полезны. Однако важно установить контакты между нами, теоретиками, и менеджерами аналитических центров, наладить систему обучения. Знания должны быть основой для компьютерных систем. В частности, мы разрабатываем Автоматизированное Рабочее Место “Математика для экспертизы” (АРМ МАТЭК) специалиста по проведению экспертных исследований [38].
Подводя итоги, можно сказать, что репрезентативная теория измерений (или репрезентационная, как предпочитает писать Ю.Н.Толстова) в состоянии дать рекомендации по выбору методов анализа статистических данных, измеренных в тех или иных шкалах, а потому является частью научного инструментария специалиста по математическим методам исследования.