АА Френкель ЕВ Адамова К и р а в эконом приложениЯх уч. Пособ. М87 мэси АМ Дубров ф и к а уч. пос. м89 мэси
АМ Дубров ВС МхитарЯн ЛИ Трошин мсм и основы экономет уч-практ. пос. м98 мэси
Экономическая постановка задачи
В экономических исследованиях часто решают задачу выявления факторов, определяющих уровень и динамику экономического процесса. Такая задача чаще всего решается методами корреляционного, регрессионного, факторного и компонентного анализа.
Все многообразие факторов, которые воздействуют на изучаемый процесс, можно разделить на две группы: главные (определяющие уровень изучаемого процесса) и второстепенные. Последние часто имеют случайный характер, определяя специфические и индивидуальные особенности каждого объекта исследования. Взаимодействие главных и второстепенных факторов и определяет колеблемость исследуемого процесса. В этом взаимодействии синтезируемая как необходимое, типическое, определяющее закономерность изучаемого явления, так и случайное, характеризующее отклонение от этой закономерности. Случайные отклонения неизбежно сопутствуют любому закономерному Явлению.
для достоверного отображения объективно существующих в экономике процессов необходимо выявить существенные взаимосвязи и не только выявить, но и дать им количественную оценку. Этот подход требует вскрытия причинных зависимостей. Под причинной зависимостью понимается такая связь между процессами, когда изменение одного из них является следствием изменения другого.
Основными задачами корреляционного анализа являются оценка силы связи и проверка статистических гипотез о наличии и силе корреляционной связи. Не все факторы, влияющие на экономические процессы, являются случайными величинами. Поэтому при анализе экономических Явлений обычно рассматриваются связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом.
Методами факторного анализа можно подтвердить существующую гипотезу или сформулировать новую гипотезу на основе большого числа наблюдений. Факторный анализ надо рассматривать как статистический метод вне зависимости от области его приложения. В факторном анализе мы исходим из того, что несколько измеряемых параметров сильно коррелируют между собой. В этом случае эти характеристики процессов взаимно определяют друг друга; например, выработка предприятия и производительность труда, оцениваемая как выработка на одного работника. В связи с накоплением большого статистического материала при изучении сложных экономических Явлений, например при анализе производственно-хозЯйственной деятельности, при прогнозировании по многим параметрам, становится очень трудным, а зачастую и невозможным решить проблему на основе одних логических рассуждений. Факторный анализ позволяет: упорядочить данные, описать взаимосвязи, получить дополнительный материал для проверки интуитивных соображений руководителя или исследователя.
Использование возможностей современной вычислительной техники, оснащенной пакетами программ машинной обработки статистической информации на ЭВМ, делает практически осуществимым оперативное решение задач изучения взаимосвязи показателей коммерческой деятельности методами коррелЯционно-регрессионного, факторного и компонентного анализа.
При машинной обработке исходной информации на ЭВМ, оснащенных пакетами стандартных программ ведения анализов, вычисление параметров применяемых математических функций является быстро выполняемой счетной операцией. Результаты выдаются в виде соответствующих машинограмм (распечаток) ЭВМ. В данной работе необходимо исследовать методами корреляционного, регрессионного, факторного и компонентного анализа зависимость с использованием пакета прикладных программ “Олимп”.
Методика корреляционно-регрессионного анализа
Исследование начинается с построения матрицы парных коэффициентов корреляции. Анализ этой матрицы позволит получить начальное представление об исследуемых взаимозависимостях между показателями (теснота и направление связи). Оценить значимость можно как по самим значениям коэффициентов корреляции, так и по соответствующим значениям t-статистики.
Чтобы оценить дублирование информации необходимо построить матрицу частных коэффициентов корреляции порядка (L-2), где L-число исходных переменных, включая результативный признак.
Исследование парных и частных коэффициентов корреляции должно помочь в выборе регрессоров для выполнения следующего этапа. Здесь следует учитывать возможность появления мультиколлинеарности. Явные признаки этого - коэффициенты корреляции между потенциальными регрессорами, по модулю большие, чем 0, 8. После составления набора объясняющих показателей, которые могут быть включены в модель, исследование продолжается с помощью регрессионного анализа. Рекомендуется использовать пошаговый регрессионный анализ по схеме последовательного включения в уравнение наиболее информативных объясняющих признаков. По матрице R по строке, соответствующей результативному признаку, выбирается наиболее коррелируемый с y-ом регрессор и строится МНК-уравнение на него. Проверяется его значимость.
Далее возвращаемся в корреляционный анализ и рассчитываем матрицу частных коэффициентов корреляции при фиксировании включенного в уравнение признака. И в этой матрице по строке, соответствующей результативному признаку, выбирается наиболее коррелированный показатель. Этот регрессор и вводится в модель. проверяется значимость уравнения и отдельных коэффициентов. Процесс прекращается, если введен незначимый регрессор.
При проведении интерпретации оценивается не только содержательный смысл модели, но и информативность, например, с помощью множественного коэффициента корреляции (детерминации) этого окончательного уравнения по сравнению с аналогичным, построенным по полному набору исходных объясняющих показателей. Потери информации (DR2) могут быть достаточно большими и тогда целесообразно перейти к регрессии на главные компоненты и общие факторы.
Методика факторного и компонентного анализов
Компонентный и факторный анализы проводятся с несколькими частными целями. Как методы снижения размерности они позволяют выявить закономерности, которые непосредственно не наблюдаются. Эта задача решается по матрице нагрузок, как и классификация признаков в пространстве главных компонент (или общих факторов). А индивидуальные значения используются для классификации объектов (не по исходным признакам, а по главным компонентам или общим факторам) и для построения уравнения регрессии на эти обобщенные показатели. Кроме того, диаграмма рассеяния объектов, построенная в плоскости, образованной двумя первыми, наиболее весомыми, главными компонентами (или общими факторами) может косвенно подтвердить или опровергнуть предположение о том, что исследуемые данные подчиняются многомерному нормальному закону. Форма облака должна напоминать эллипс, более густо объекты расположены в его центре и разреженно по мере удаления от него.
интерпретируются главные компоненты и общие факторы, которым соответствуют дисперсии больше 1, и которые имеют хотя бы одну весомую нагрузку. Выбор критической величины, при превышении которой элемент матрицы нагрузок признается весовым и оказывает влияние на интерпретацию главной компоненты или общего фактора, определяется по смыслу решаемой задачи и может варьировать в пределах от 0, 5 до 0, 9 в зависимости от получаемых промежуточных результатов. Формальные результаты должны хорошо интерпретироватьсЯ.
Факторный анализ - более мощный и сложный аппарат, чем метод главных компонент, поэтому он применяется в том случае, если результаты компонентного анализа не вполне устраивают. Но поскольку эти два метода решают одинаковые задачи, необходимо сравнить результаты компонентного и факторного анализов, т. е. матрицы нагрузок, а также уравнения регрессии на главные компоненты и общие факторы, прокомментировать сходство и различия результатов. Далее необходимо объединить результаты, полученные в корреляционном, регрессионном анализе, методе главных компонент и факторном анализе и сформулировать общие выводы и рекомендации.