Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика (1027378), страница 70
Текст из файла (страница 70)
Применение главных компонент при анализе производительности труда рабочих. Различные показатели производительности труда г" =(р(1>, у('>, ..., У("'>) характеризуют, как известно, отношение реально произведенной продукции к затратам труда на ее производство. Задача изучения зависимости показателей производительности труда от набора регулируемых (и нерегулируемых) признаков Х' —-- 868 Спорт Мебель Предметы обихода Хлебобулочные изделии Овощи Мисиые продуаты Рыбные продукты Молочные продукты Жиры Яйца Сахар Кондитерские изделии Общественное октавие (включаи расходы временно выехавших членов семьи) Культурно-просветительные мероприятия Траисиорт Услуги почты н телеграфа Жилищно-коммунальные расходы Продукты растительного происхождения Продукты животного ироисхождеини Услуги (включаи х(м> и х(м> плюс бытовые и т.
и.) Общественное питание (исключав расходы временно выехавшнх членов семьи) Все продовольственные товары Алкогольные напитки Все промышленные тона. ры = (х<о, хда>, ..., хо>), характеризующих технический и организационный уровень производства, личные качества рабочих, социально-демографические условия их жизни, постоянно <и правомерно) привлекает к себе пристальное внимание исследователей. Среди различных возможных подходов к решению этой задачи выделим следующие две схемы исследования.
г г г ° э ° з~ .г I ! < ° 28 ° ° 20н Рнс. 13.4. Исследонанне пзанмоспизей между признаками, характернзукиннмн структуру н объем семейного потреблении С х е м а 1. Состоит из двух этапов: 1) разбиение исследуемой совокупности рабочих на однородные группы в пространстве объединенных признаков (Х', Г), например, с помощью главных компонент, построенных по набору признаков х<'>, х<а>, ..., хо'>, у<4, ..., у<"'>; 2) статистическое исследование зависимостей типа г' = = 1< (Х), произведенное отдельно внутри каждой группы, выявленной на первом этапе (< — номер группы, внутри которой анализируется искомая зависимость).
С х е м а 2. Состоит из трех этапов: 1) разбиение исследуемой совокупности рабочих на однородные группы в пространстве признаков-аргументов П» (Х), например, с помощью главных компонент, построенных по набору признаков х<'>, х<п..,., х<»>; 2) расщепление вектора признаков-аргументов Х' = = (х<»>, х<'>,..., х<»>) на два подвектора; подвектор Х<0' = = (х<'>, х<»>, ..., х<«>) признаков (как правило, труднорегулируемых), описывающих технический и организационный уровень производства (<)( р), и подвектор Х<'>' = (х<«+">, х<«+'>, ..., х<»>) признаков (регулируемых), описывающих социально-демографические условия труда. Затем разбиение исследчемой совокупности рабочих на однородные группы 5<!>, 5,'>,..., 5ь<> в подпространстве П«(Х<">) «нерегулируемых» признаков, а также на однородные группы 5<<>, 5<««>, ..., 5)*,> в подпространстве П>'-'> (Х<'>) «регулируемых» признаков; 3) статистическое исследование зависимостей типа У=1)<'(Х<" )Х«'Е 5<") (/=1, 2, ..., й ) и У = 1<<" (Х" ' ( Х" ' ~ 5',") (1 = 1, 2, .
„, л ), произведенное отдельно внутри каждой однородной группы подпространства П«(Х<'>) (при аргументах Х<'>) и подпространства П< '> (Х<'>) (при аргументах Х<'>). Здесь 7)" (Х'*') Х'" с 5<") означает векторную функцию от (р — <)) переменных х<«+<>, х<«">, ..., х<»>, описывающую зависимость У от Х<'> при условии, что значения «нерегулируемых» аргументов х<'>, х<'>, ..., х<«> принадлежат области 5<<>, Аналогично определяется векторная функция Г<<«>. В 19) приводятся результаты статистического анализа исходных данных по 100 работницам-ткачихам (и = 100) льнокомбината «Красная текстильщица» г.
Нерехта Костромской области, составляющим более 80 % всей численности ткачих комбината. Эти результаты можно рассматривать как фрагменты осуществления этапов 1 и 2 и в вы>неописанных схемах исследования. Интересный пример применения главных компонент, в прямой и двойственной постановках задачи, связанный со статистической обработкой экспертных оценок применительно к задаче классификации картин абстрактной живописи, читатель найдет в [18Н. 13.6. Нелинейное отображение многомерных данных в пространство низкой размерности В некоторых случаях более точного отображения геометрической структуры исходной матрицы данных Х в пространстве малой размерности можно добиться, используя нелинейное отображение [300, 9, 152[.
Для получения таких отображений задаются тем илн иным критерием (мерой) искажения 1 Я (Х)) и решают задачу на определение минимума 1. Рассмотренные в данном параграфе меры искажения основаны на сравнении попарных расстояний между точками в исходном пространстве и пространстве отображения. В зависимости от выбранного критерия может получаться та или иная конфигурация точек и существенно меняется время вычисления. 13.6.1. Нелинейное отображение по критерию типа стресса.
Мера искажения, рассматриваемая ниже, была предложена Сэммоном [300) и является аналогом критерия «стресса», используемого в многомерном шкалировании (см. гл. 16) '. 1(Е(Х)) =Яе(Е, а) = 1 ( ~ 1лец~ ~ (Рц — 














