logo search
Контрольная

Построение системы показателей

Анализ матрицы коэффициентов парной корреляции

Выбор факторов, влияющих на исследуемый показатель, произ­водится, прежде всего, исходя из содержательного анализа социаль­но-экономических явлений с использованием статистических и мате­матических критериев.

Для получения надежных оценок в модель не следует включать слишком много факторов. Их число не должно превышать одной тре­ти объема имеющихся данных n/3).

Для определения наиболее существенных факторов могут быть использованы коэффициенты линейной и множественной корреля­ции, детерминации частных коэффициентов корреляции.

Формирование базы исходных данных. Сначала на основании содержательного анализа составляется перечень показателей, кото­рые предполагается включить в модель. Затем производится сбор ста­тистической информации и предварительный анализ данных.

Значения переменных Y и X, содержащиеся в наблюдаемой сово­купности, записываются в таблицу исходных данных (табл. 3).

Таблица 3

№п/п

Y

Х1

Х2

Xт

1

y1

Х11

Х21

Xт

п

y2

Х1n

Х2n

Xт

Далее производятся сравнительная оценка и отсев части факторов путем анализа парных коэффициентов корреляции rXY

rXY=,

где

cov(x, у) =,,

, .

Значения коэффициентов парной корреляции лежат в интервале от -1 до +1. Их положительное значение свидетельствует о прямой связи (с ростом одной переменной, другая тоже увеличивается), от­рицательное - об обратной (с ростом одной переменной, другая уменьшается). Чем ближе его значение к 1, тем теснее связь. Связь считается достаточно сильной, если коэффициент корреляции по аб­солютной величине превышает 0,7, и слабой, если он меньше 0,4. При равенстве коэффициента корреляции нулю связь полностью отсутст­вует. Коэффициент корреляции дает объективную оценку тесноты связи лишь при линейной зависимости переменных.

Оценка значимости коэффициента корреляции проводится с по­мощью t-критерия Стьюдента (Приложение А). Фактическое значе­ние критерия tнабл определяется по формуле

tнабл=,

и сравнивается с критическим значением tкр, которое берется из таб­лицы значений t-критерия Стьюдента с учетом заданного уровня зна­чимости (например,  = 0,05) и числа степеней свободы (n - 2).

Если tнабл > tкр,, то полученное значение коэффициента корреля­ции признается значимым, т.е. нулевая гипотеза, утверждающая ра­венство нулю коэффициента корреляции, отвергается. Таким обра­зом, делается вывод о том, что между исследуемыми переменными есть тесная статистическая взаимосвязь.

В модель включают те факторы, связь которых с зависимой пе­ременной наиболее сильная.

Коллинеарность. Одним из условий регрессионной модели яв­ляется предположение о линейной независимости объясняющих пе­ременных, т.е. решение задачи возможно лишь тогда, когда столбцы и строки матрицы исходных данных линейно независимы. Для эко­номических показателей это условие выполняется не всегда.

Линейная или близкая к ней связь между двумя факторами назы­вается коллинеарностью и приводит к линейной зависимости нор­мальных уравнений, что делает вычисление параметров либо невоз­можным, либо затрудняет содержательную интерпретацию парамет­ров модели. Коллинеарность может возникать в силу разных причин. Например, несколько независимых переменных могут иметь общий временной тренд, относительно которого они совершают малые ко­лебания.

Считают явление коллинеарности в исходных данных установ­ленным, если коэффициент парной корреляции между двумя пере­менными больше 0,7. Чтобы избавиться от коллинеарности, из моде­ли исключают один из линейно связанных между собой факторов. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами.

С целью выявления факта коллинеарности факторов составляется матрица парных коэффициентов корреляции, измеряющих тесноту связи каждого из факторов-признаков с результативным фактором и между собой (табл. 4).

Таблица 4

Факторы

Y

Хх

Х2

Хт

Y

1

rYX1

rYX2

rXYm

Х1

rYX1

1

rX1X2

rX1Xm

Х2

rYX2

rX1X2

1

rX2Xm

Хт

rXYm

rX1Xm

rX2Xm

1

Наибольшие трудности при использовании аппарата множест­венной регрессии возникают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линей­ной зависимостью, т.е. имеет место совокупное воздействие факторов друг на друга. Наличие мультиколлинеарности означает, что некото­рые факторы будут действовать в унисон. В результате вариация в исходных данных перестает быть полностью независимой, и нельзя оценить воздействие каждого фактора в отдельности. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распре­деления суммы объясненной вариации по отдельным факторам с по­мощью МНК.