referat region (708456), страница 2
Текст из файла (страница 2)
сопоставлений на многомерных объектах. В таксономических методах сопоставления проводятся с помощью матрицы расстояний, а в факторном анализе — с помощью матрицы корреляций.
2.2. Таксономические методы
В настоящем разделе большее внимание уделено таксономическим методам. Их название происходит от двух греческих слов: таксис (что означает расположение, порядок) и номос (закон, правило, принцип). Таким образом, таксономия — это наука о правилах упорядочения и классификации. Первоначально это понятие употреблялось только для определения науки, занимающейся классификацией растений и животных. Сейчас понятия и методы таксономии находят применение для упорядочения и разбиения на группы объектов различной природы, а не только биологических. Ими стали пользоваться антропологи, затем географы, а в последнее время к таксономии все чаще прибегают представители различных экономических дисциплин.
Основным понятием, используемым в таксономических методах, является так называемое таксономическое расстояние. Это — расстояние между точками многомерного пространства, исчисляемое чаще всего по правилам аналитической геометрии. Размерность пространства определяется числом признаков, характеризующих единицы изучаемой совокупности. В двойственной же задаче, в которой признаки выступают в роли объектов исследования, размерность пространства определяется числом структурных единиц. Таким образом, таксономическое расстояние исчисляется между точками-единицами, либо точками-признаками, расположенными в многомерном пространстве. Исчисленные расстояния позволяют определить положение каждой точки относительно остальных точек и, следовательно, определить место этой точки во всей совокупности, что делает возможным их упорядочение и классификацию.
В зависимости от целей исследования таксономические методы можно разделить на три группы: методы упорядочения, методы разбиения, методы выбора репрезентантов групп.
Первая группа включает методы, упорядочивающие единицы изучаемой совокупности, причем здесь можно выделить два направления. В одном случае достигается линейное упорядочение, в другом - нелинейное.
Линейное упорядочение (например, методом Чекановского) заключается в проецировании точек многомерного пространства на прямую.
Вроцлавские математики разработали так называемый метод дендритов (именуемый также вроцлавской таксономией), при котором точки многомерного пространства проецируются на плоскость, чем достигается нелинейное упорядочение изучаемых элементов.
Вроцлавская таксономия находит все большее применение во многих экономических дисциплинах как в своем первоначальном
виде, так и в дальнейших модификациях.
Вторая группа методов имеет дело с задачами разбиения множества на группы однородных элементов. Среди них можно выделить метод Чекановского, приспособленный для проведения территориальных экономических исследований благодаря тому, что в нем учи-тывается информация о связях между всеми объектами (расположены ли они далеко или близко друг от друга). Другим широко используемым методом является так называемый метод шаров. Он менее трудоемок, нем другие методы, что составляет его несомненное достоинство.
Третья группа таксономических методов применяется с целью выбора репрезентантов групп. Она имеет большое значение, особенно при нахождении так называемых диагностических признаков, т.е. признаков, передающих самые существенные особенности весьма
многочисленного набора исходных признаков.
3. Факторный анализ
Другим целям служит факторный анализ. Его название происходит от введенного Ч. Спирмэном понятия общий фактор. Этот термин был впервые употреблен в психологии. Идею Спирмэна в дальнейшем развил Л.Л. Тэрстоун, который считается создателем многофакторного анализа.
Главная цель факторного анализа — установление общих закономерностей, определяющих сущность изучаемого явления. Материалом, на базе которого проводятся такие исследования, служат наблюдения над вариацией значений множества признаков, характеризующих данное явление. Непосредственное раскрытие сущностных закономерностей бывает весьма затруднено, а иногда и просто невозможно, если рассматриваемое множество признаков оказывается настолько велико, что избыток информации начинает мешать пониманию наиболее существенных взаимосвязей. Выявление закономерностей облегчается, если среди рассматриваемых признаков найдутся такие, которые сильно коррелированы между собой и поэтому мало отличаются друг от друга в отношении информации об исследуемом явлении. В таких случаях следует заменить группу сильно коррелированных признаков некой расчетной «синтетической» величиной (равнодействующей). Полученная величина после интерпретации (соответствующей области исследования) называется фактором и рассматривается как одна из закономерностей изучаемого явления.
Такая замена групп коррелированных признаков факторами должна проводиться с наименьшими потерями информации, заключенной в исходном множестве признаков. Теоретически полное отражение информации, содержащейся в некотором множестве признаков, достигается лишь в том случае, когда число факторов равно числу признаков.
В настоящее время в управленческой практике используется множество социально-экономических показателей, всесторонним образом характеризующих происходящие процессы.
Однако для текущего управления экономикой области многие из этих показателей не являются необходимыми. Многократное описание одного и того же явления большим числом различных показателей не только не проясняет, а, наоборот, часто даже затемняет картину действительности.
Все более широкое введение автоматической обработки данных создает опасность «переинформирования» руководителей путем предоставления им очень большого количества отчетов, содержащих подробные фактические данные с низкой степенью аналитичности.
Вполне целесообразно поэтому разработать метод получения как можно меньшего набора социально-экономических показателей, с помощью которых руководители будут получать необходимую информацию о наиболее важных особенностях социально-экономических процессов, происходящих в области. Наличие такого рода сведений, например, необходимо для проведения быстрой оценки уровня социально-экономического развития районов области, что, в свою очередь, делает возможным своевременное принятие решений на будущий период. Ведь в этом случае внимание руководителя не поглощено изучением обширного перечня аналитических данных с небольшим количеством обобщенной информации, содержащейся в существующих сводных показателях.
К настоящему времени опубликовано большое количество работ, авторы которых применяют корреляционный и регрессионный анализы в экономических исследованиях. Однако следует отметить, что в некоторых из них авторы не принимают во внимание то обстоятельство, что корреляционный и регрессионный анализы базируются на ряде предпосылок вероятностного характера, что, приступая к изучению экономических явлений, исследователь выдвигает определенную гипотезу о существовании, характере и форме связи и на заключительном этапе исследования может с определенным уровнем вероятности принять ее или отвергнуть. Поэтому весьма часто исследователи делают неправильные и необоснованные выводы, заменяя конкретный причинный анализ изучаемых явлений чисто формальным. При моделировании конкретного экономического явления необходимо прежде всего четко и полно сформулировать те условия допущения и ограничения, в рамках которых можно применять построенную модель. Использование математической теории бывает оправдано в той степени, в какой выполняются предпосылки ее применения. В то же самое время формальный математический аппарат не должен заменять экономический анализ и интуицию исследователя, потому что целью анализа является сущность экономических закономерностей, а не математические формулы.
То есть количественный и качественный виды анализа на всех этапах построения модели должны быть в диалектическом единстве.
Используя корреляционный и регрессионный методы анализа экономических явлений, необходимо учитывать их особенности:
многомерность, немногочисленность (по сравнению с естественными микроявлениями), быструю изменчивость, дискретность, наличие случайной компоненты. Использование этих методов может быть только тогда эффективным, когда достаточно последовательно и правильно будут выполнены их теоретико-вероятностные предпосылки.
4. Корреляционный анализ
Корреляционным анализом называют анализ зависимостей случайной величины от случайных аргументов в отличие от регрессионного анализа, под которым понимают анализ зависимости случайной величины от .неслучайных аргументов.
Как всякий статистический метод, классический корреляционный анализ применим при определенных предпосылках:
1) случайные величины У и Х (в многомерном случае X1, Х2, ..., Хр) представляют собой выборку из двумерной (многомерной) генеральной совокупности с нормальным законом распределения;
2) отдельные наблюдения стохастически независимы, т.е. значения данного наблюдения не должны зависеть от значения предыдущего и последующего наблюдений (проверка наличия автокорреляции);
3) аналитическое выражение, аппроксимирующее эмпирическую кривую У=1 (X) (в многомерном случае V=f (X1, X2, ..., Хр), должно быть линейным относительно своих параметров;
4) дисперсия случайной величины У остается постоянной при изменении величины Х (или Xi) или пропорциональной некоторой известной функции от Х(Хi).
5. Регрессионный анализ
Применение регрессионного анализа предполагает обязательное выполнение предпосылок 2—4 корреляционного анализа. Он тесно связан с корреляционным анализом. Но регрессионный анализ предъявляет менее жесткие требования к исходной информации. Например, проведение регрессионного анализа возможно даже в случае некоторого отличия распределения случайных величин от нормального, что существенно, так как часто распределение экономических величин асимметрично. При многомерном регрессионном анализе часто возникает проблема мультиколлинеарности, т.е. между несколькими аргументами существует линейная связь или коллинеарность — линейная взаимосвязь между двумя показателями.
В классическом регрессионном анализе предполагается, что между независимыми переменными отсутствует линейная связь (это в экономической практике встречается довольно редко).
Мультиколлинеарность затрудняет проведение анализа. Во-первых, усложняется процесс выделения наиболее существенных факторов; во-вторых, искажается смысл коэффициентов регрессии. В-третьих, при решении системы нормальных уравнений для получения коэффициентов регрессии определитель близок к нулю, что влечет за собой появление множества оценок коэффициентов регрессии. На практике считается, что два аргумента коллинеарны, если парный коэффициент корреляции между ними по абсолютной величине равен 0,8.
Более точный метод — следующий: аргумент можно отнести к числу мультиколлинеарных, если коэффициент множественной корреляции этой переменной от всех остальных аргументов больше коэффициента множественной корреляции между зависимой переменной и множеством всех независимых переменных.
К одной из эффективных мер по устранению мультиколлинеарности, как показывает опыт, относится исключение из рассмотрения одного или нескольких линейно связанных аргументов либо привлечение дополнительной информации. Другой метод устранения влияния мультиколлинеарности состоит во введении искусственной ортогональности.
Следует отметить также, что матрица парных коэффициентов корреляции позволяет в некоторой степени сократить информацию путем перехода от системы первоначально зарегистрированных параметров к системе меньшей размерности при повышении адекватности отражения изучаемых процессов.
До последнего времени для построения экономико-статистических моделей в основном применялись методы группировок и методы корреляционного и регрессионного анализов. Необходимость расширения формального аппарата экономико-статистического моделирования связана с объективными трудностями, которые продиктованы невыполнением предпосылок использования корреляционного и регрессионного анализов, так как классическая теория вероятностей и математическая статистика создавались применительно к анализу явлений природы. Социально-экономические же явления многомерны, разнообразны, дискретны, имеют случайную компоненту. Вышеперечисленные особенности экономических процессов требуют применения в дополнение к аппарату классической статистики более универсальных методов математического описания. Од ним из путей решения этой проблемы является использование методов распознавания образов, как правило, на ЭВМ.
Аппарат теории распознавания образов позволяет выделить однородные группы по большому числу признаков, находить зависимости одновременно от количественных и качественных факторов. Методы теории распознавания образов можно применять почти на всех этапах экономико-статистического исследования: при анализе структуры выборочной совокупности, для выбора представителей групп, при обработке экспертных оценок.
Однако в теории распознавания образов много нерешенных проблем. В распоряжении исследователя пока нет надежных формальных критериев для оценки и сравнения разных алгоритмов и программ распознавания образов.
В то же время комплексное применение методов корреляционного и регрессионного анализов и теории распознавания образов способствует идентификации эконометрических моделей больших размерностей; позволяет учитывать факторы, не имеющие количественного измерения.
Содержание моделирования с помощью комплексного применения трех вышеуказанных методов состоит в том, чтобы интересующую нас зависимость выразить как совокупность моделей двух типов: дискретной модели, описывающей типологическую структуру совокупности, и системы непрерывных моделей объектов внутри классов. Построение дискретно-непрерывной модели включает две основные стадии: разбиение общей совокупности объектов на однородные части с помощью методов теории распознавания образов и построение для каждой части самостоятельной регрессионной модели.
С целью получения обобщенных показателей можно пользоваться среди прочих таксономическими методами или методами факторного анализа, причем можно также предложить такой подход, при котором одновременно находят применение и те и другие методы.
Предварительная операция, имеющая важнейшее значение для получения правильных конечных результатов, одинакова для всех процедур. Она заключается в определении множества исходных признаков (системы показателей), характеризующих исследуемый объект.
Построение показателей только на основе таксономических методов заключается в осуществлении следующих шагов. Первой операцией является разбиение исходного множества показателей на подмножества однородных элементов. Тогда элементы каждого из подмножеств можно рассматривать как описание определенного аспекта объекта исследования.















