Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика, страница 9
Описание файла
DJVU-файл из архива "Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика", который расположен в категории "". Всё это находится в предмете "системы автоматизированного проектирования (сапр)" из 11 семестр (3 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "интеллектуальные подсистемы сапр" в общих файлах.
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 9 - страница
е, класс допустимых преобразований 1. (Х) — это класс линейных (как правило, подходящим образом нормированных) преобразований исходных признаков х<'>, ..., х<ю (в книге нелинейным преобразованиям посвящены лишь у 13.6 и !7.3); 2) спецификация формы задания исходной информации связана со спецификацией смысловой нацеленности критерия информативности, а поэтому их удобнее давать в обшей графе. Ланная в табл.
В.б типологизация, как и всякая иная классификация, не претендует на исчерпывающую полноту. з~ щ, г»»» р, гщ г, » * < ф х) Е (Х) =-(г<Ч(Х), ..., «<Я < (Х)). который обращает в максимум нлн мнннмум (в зависимости от конкретного содержательного смысла оптнмнзнрусмого критерия ннформатнвносгн) значение )р, (7). Поэтому справа в данном соотнощеннн записано ех<г («экстремум»). 37 Таблица В.й Название соответствующих моделек Н метовон. главы И параграфы «наги не и/в Метод главных компонент, гл. 13 Класс в смысвовав нацеленность ьрнтсрвв ннформатианости, форма папанин нсаолноа мнфсрмацнн АИ максимизация содержащейся в го), ., г<Ы! доли суммарной варнабельностн исходных признаков «ы!, ..., хайнц Описательная информация: в форме (В.1).
Обучающая кнформация: нет АИ: макснмкзацня точности воспро. изведения корреляцкониых связей между нсходнымн признаками по их аппроксимациям с помощью вспомогательных переменных гн>... г<р'>, Описательная ннформацкя. в форме (Н.1) Обучающая информация; нет АИ: разбиение исходных пркзнаков нз группы высококоррелкрованкых (внутри группы) переменных н от. бор от каждой группы фактора, имеющего максимальную интегральную характеристику корреляционных связей со всеми признаками данной группы Оппсательнаа информация; в фор. ие (В.1] Обучающая кнформацня: нет АИ: пркпнсыванке каждому объекту О, значений условных координат (а!~1..., г!Р,1)тикки образом, чтобы по ннм максимально точно вос. станавлкзалась заданная структура попарных описательных отношений между объектамн. Описательная кнформацнн; в форме (В!').
Обучающая информация: нет Модели н методы факторного анализа, гл. 14 Метод зкстремальной группи. ровкн парамет. ров, п. 14.2.1 Многомерное шка- лнрованке, гл. 16 Продолжение Название соответствующая иоделей и методов, главы и цараграфы ванги Ы и/н Клшс н смыслова» нацеленность аритсрия внформативностн, форма задания исходной информации АИ; максимальное сохранение заданных описательным массивом (В.1) анализируемых струнтурно-геометрических н вероятностных свойств после его проецирования в пространство меньшей размерности (в прост. ранство, натянутое на ятг>,..., х1р 1, р'(р).
Описательная информация: в форме (В.1). Обучающая информация: нет ВИ: минимизация ошнбкн прогноза (восстановления) значения результирующей количественной переменной по значениям описательных переменных (преднкторов). Описательная информация: в форме (В 1). Обучающая информация: в форме зарегнстрнрованных на объектах Оь ..., О значеннй соответственно рь ..., у„результирующего количественного показателя у ВИ: минимизация вероятностей ошибочного отнесения объекта к одному нз заданных классов по значениям его описательных переменных Описательная информация: в форме (В.1).
Обучающая информация: для каждого описанного с помощью (В.1) объекта указан номер класса, к которому он относится ВИ: максимизация точности воспроизведения (по значениям вспомогательных признаков) заданных в «обученны» отношеннй объектов по анализируемому результирующему свойству. Описательная информация: в форме (В.1). Методы целенаправленного проецирования п от. бор тнпообразующнх признаков в кластер-анализе, гл. 11, 1 — 21 Отбор существенных преднкторов в регресспонном анализе, см. (11, % В.7) Отбор тнпообразующнх признаков в днскрнмннантном анализе, 2 1.4, 2.5, 2.6 Методы латеятноструктурного анализа, в том числе построение некоторой сводной ла.
тентной характе. Продолжение Наааание соотнатстауююа«моаелеа и методов, гланы и параграфы книги Класс Н емыслоаая наиолснность «рикер«я иифорыатннноотн. 4юрма аадання Иеходнон информаоии Не п)п Обучающая ннформпцня. н форме попнрпых срнвненнй нлн упорядочений объектов по анализируемому результирующему свойству (см сноску х с. 36 о возможности нспользонпння формы (В.1') для предстнилення обучающей инфо мацнн) рнстнкн изучаемого результнрующего свойства, гл.
16 ВИ: мпхснмнзацня точности носпронзиедення (по значениям условных вспомогательных переменных) заданных и «обучившей информации» попарных отношений объектов по анализируемому результирующему свойству. Опнсательваи внформнцня; нет. Обучающпя ввформнцвя; и форме (В 1') (см. сноску к с. 36) Многомерное шян- лнроиннне хак средство латент- но-структурного анализа, гл. 16 Пр я мечи ни в АИ вЂ” автоинформатнвность, ВИ вЂ” внешняя ннформатнвяость. пункт 4, онн отличаются только интерпретацией исходных данных вида (В.1') н соответственно конечными приклад- ными целями исследования. В.4.
Основные атапы в решеннн задач классификация н сннження размерностн 40 Целью данного параграфа является конкретнзацня сформулнронанных н (12, и. 1.1.3] общих рекомендаций по методике проведения всякого статистического аналнза данных. В этой конкретизации будем опираться на описанную выше специфику задач классификации н снижения размерностн, н н частности на нмеюшуюся теперь возможность выбора подходящего типа практической задачи н соответствующнх ему конечных прикладных целей исследования (см.
5 В.2), а также подбора необходимого математического ннструментарня (см. 3 В.З). Представим весь процесс решения задач классификации н снижения размерности в виде следующей схемы (рнс. В.1) н прокомментируем ее. Ф а~ Ф о о в о О И о о 34 \.Р х ФЦ о д Х ф~ 41 Этап I (установочный). На этом этапе главную роль играет «заказчик», т е специалист той предметной области (экономики, социологии, геологии, медицины и т д ), к которой относится решаемая задача гга предметно-содержательном уровне должна быть сформулирована постановка задачи, включающая в себя характер научных или практических выводов, ко~орые требуется получи~ь <на выходе» задачи (диапюстический, прогнозный, аналитическип и т.
п.), описание предмета исследования, объектов статистического обследования, выделяемые для решения задачи ресурсы (время, трудозатраты) и т. д. Этап 2 (поспгановочный) На этом этапе необходимо тесное сотрудничество «заказчика» и «инструмен газ ыцика», т. е специалиста по прикладной статистике Отправляясь от выработаннои на этапе ! предметно-содержательнои установки на главные цели исследования, они должны сформулировать эти цели в терминах основных типов прикладных задач, рассматриваемых в теории статистических методов классификации и снижения размерности (см. й В 2). Необходимым условием успешнои реализации этого этапа (и соответственно всего последующего статистического анализа) является полное взаимопонимание и согласие «заказчика» и «инструментальщика» в принятом решении (что достигается далеко не просто).
Этап 3 (информаг(ионный) Состоит в выработке н реализапии плана сбора исходной статистической информации (если ее не представил <заказчик» уже на этапе 1), в подробной аггестации этой информации (объяснение способа сбора, формы представления и т. п.), в вводе исходных данных в ЭВМ, их выверке и редактировании Эта>« 4 (априорный математика-постановочньгй). На базе выводов и информации, полученных в результате реализации этапов 1---3, требуется осуществить предварительный (априорный, т. е. до проведения каких-либо расчетон) выГ>ор базовых математических моделей, которые целесообразно использовать в математической постановке данной коггкретггой задачи (см.
й В 3). При этом факторами, от которых решающим образом зависит выГюр, являются, как уже знаем, характер конечных прикладных целей исследования, природа и форма исходных статистических данных. Этап а (разведочный анализ). Этот этап составляюг всевозможные методы предварительной статистической обработки, «прощупывания» исходных даггных с целью выявления специфики их вероятностной и геометрической природы (112, гл. 10 и 111, а также гл. 18 — 21 данной книги).
42 «На выходе» этапа должны быть уточненные сведения о физическом механизме генерирования наших исходных данных, а значит, о базовой математической модели этого механизма. Этап 6 (апастериарный математика-постановочный). На этом э~вне уточняется математическая постановка решаемой задачи с учетом выводов, полученных на предыдущем этапе. Этап 7 (ыычислипкльный). Производная вычислительная реализация намеченного использования выбранного иа предыдущем этапе математического инструментария в решении задачи. При этом желательно воспользоваться типовым программным обеспечением (см.
гл 21). Этап 8 (итогоыый). Анализируются и интерпретируются результаты проведенной статистической обработки (классы, факторы и т.п.). В зависимости от результатов этого анализа (достигнуты ли все намеченные на этапе 2 прикладные цели исследования, насколько естественно интерпретируемы полученные результаты, степень их достоверности и т. п.) либо формулируются окончательные научные или прикладные выводы, либо даются уточнения и дополнения к заданию и возвращаются к одному из предыдущих этапов обычно к этапу 3, 4 или 5). ВЫВОДЫ 1.
Разделение рассматриваемой совокупности объектов или явлений на однородные (в определенном смысле) группы называется классификацией. При этом термин «классификация» используют, в зависимости от контекста, для обозначения как самого процесса разделения, так и его результата. Это понятие тесно связано с такими терминами, как группировка, типологизация, систематизация, дискриминация, кластеризация, и является одним из основополагающих в практической и научной деятельности человека.
2. Переход от характеризующего состояние или функционирование некоторой совокупности объектов исходного массива данных к существенно более лаконичному набору показателей, отобранных из числа исходных или построенных с помощью некоторого их преобразования таким образом, чтобы минимизировать связанные с этим потери в информации (содержавшейся в исходном массиве данных относительно рассматриваемой совокупности объектов), составляет сущность процесса снижения размерности.
43 Этот процесс использует, в частности, логику и приемы классификации, и сам в свою очередь используется в классификационных процедурах. 3. В ситуациях, когда каждый из исследуемых объектов или явлений характеризуется большим чисчом разнотипных и стохастически взаимосвязанных параметров, и исследователь имеет возмож>юсть получить, или уже получил, результаты статистического обследования по этим параметрам целой совокупности таких объектов или явлений, для решения задач классификации и снижения размерности следует привлекать специальный математический инструментарий многомерного статистического анализа: дискриминантный и кластер-анализ, методы расщепления смесей распределений, методы иерархической классификации, многомерное шкалирование, главные компоненты, факторный анализ, целенаправленное проецирование миогомерных данных и т.