Решение типовых задач.


Пример 1. По 30 территориям России имеются данные, представленные табл. 3.1. Требуется:

1. Построить уравнение множественной регрессии в стандартизованной и естественной форме; рассчитать частные коэффициенты эластичности, сравнить их с b1 и b2, пояснить различия между ними.

2. Рассчитать линейные коэффициенты частной корреляции и коэффициент множественной корреляции, сравнить их с линейными коэффициентами парной корреляции, пояснить различия между ними.

3. Рассчитать общий и частные F-критерии Фишера.

Таблица 3.1

Признак Среднее значение Среднее квадратическое отклонение Линейный коэффициент парной корреляции
Среднедневной душевой доход, руб., y 86,8 11,44
Среднедневная заработная плата одного работающего, руб., x1 54,9 5,86
Средний возраст безработного, лет, x2 33,5 0,58

Решение:

1. Линейное уравнение множественной регрессии y от x1 и x2 имеет вид: y=a+b1x1+b2x2. Для расчета его параметров применим метод стандартизации переменных и построим искомое уравнение в стандартизованном масштабе: .

Расчет b-коэффициентов выполним по формулам:

;

.

Получим уравнение .

Для построения уравнения в естественной форме рассчитаем b1 и b2, используя формулы для перехода от bi к bi:

; ; ; .

Значение a определим из соотношения

,

тогда получим .

Для характеристики относительной силы влияния x1 и x2 на y рассчитаем средние коэффициенты эластичности:

; ; .

С увеличением средней заработной платы x1 на 1% от ее среднего уровня средний душевой доход y возрастает на 1,02% от своего среднего уровня; при повышении среднего возраста безработного x2 на 1% среднедушевой доход y снижается на 0,87% от своего среднего уровня. Очевидно, что сила влияния средней заработной платы x1 на средний душевой доход y оказалась большей, чем сила влияния среднего возраста безработного x2. К аналогичным выводам о силе связи приходим при сравнении модулей значений b1 и b2:

.

Различия в силе влияния фактора на результат, полученные при сравнении и bj, объясняются тем, что коэффициент эластичности исходит из соотношения средних отклонений , а b-коэффициент – из соотношения средних квадратических отклонений :

2. Линейные коэффициенты частной корреляции здесь рассчитываются по рекуррентной формуле:

;

;

.

Если сравнить значения коэффициентов парной и частной корреляции, то приходим к выводу, что из-за слабой межфакторной связи коэффициенты парной и частной корреляции отличаются незначительно: выводы о тесноте и направлении связи на основе коэффициентов парной и частной корреляции совпадают: ; ; ; ; ; .

Расчет линейного коэффициента множественной корреляции выполним с использованием коэффициентов и bj:

Зависимость y от x1 и x2 характеризуется как тесная, в которой 72% вариации среднего душевого дохода определяются вариацией учтенных в модели факторов: средней заработной платы и среднего возраста безработного. Прочие факторы, не включенные в модель, составляют соответственно 28% от общей вариации y.

3. Общий F-критерий проверяет гипотезу H0 о статистической значимости уравнения регрессии и показателя тесноты связи (R2=0):

;

Fтабл=3,4; a=0,05.

Сравнивая Fтабл и Fфакт, приходим к выводу о необходимости отклонить гипотезу H0, так как Fтабл=3,4<Fфакт=34,6. С вероятностью 1 – a = 0,95 делаем заключение о статистической значимости уравнения в целом и показателя тесноты связи , которые сформировались под неслучайным воздействием факторов x1 и x2 .

Частные F-критерии – и оценивают статистическую значимость присутствия факторов x1 и x2 в уравнении множественной регрессии, оценивают целесообразность включения в уравнение одного фактора после другого фактора, т.е. оценивает целесообразность включения в уравнение фактора x1 после того, как в него был включен фактор x2. Соответственно указывает на целесообразность включения в модель фактора x2 после фактора x1:

; Fтабл=4,21; a=0,05.

Сравнивая Fтабл и Fфакт, приходим к выводу о целесообразности включения в модель фактора x1 после фактора x2, так как . Гипотезу H0 о несущественности прироста за счет включения дополнительного фактора x1 отклоняем и приходим к выводу о статистически подтвержденной целесообразности включения фактора x1 после фактора.

Целесообразность включения в модель фактора x2 после фактора x1 проверяет :

.

Низкое значение (немногим больше 1) свидетельствует о статистической незначимости прироста за счет включения в модель фактора x2 после фактора x1. Следовательно, подтверждается нулевая гипотеза H0 о нецелесообразности включения в модель фактора x2 (средний возраст безработного). Это означает, что парная регрессионная модель зависимости среднего дохода от средней заработной платы является достаточно статистически значимой, надежной и что нет необходимости улучшать ее, включая дополнительный фактор x2 (средний возраст безработного).

 

Пример 2. По территориям России изучаются следующие данные (табл. 3.2): зависимость среднегодового душевого дохода y (тыс. руб.) от доли занятых тяжелым физическим трудом в общей численности занятых x1 (%) и от доли экономики активного населения в численности всего населения x2 (%).

Таблица 3.2

Признак Среднее значение Среднее квадратическое отклонение Характеристика тесноты связи Уравнение связи
y 112,76 31,58
x1 5,40 3,34
x2 50,88 1,74

Требуется:

1. Составить таблицу дисперсионного анализа для проверки при уровне значимости a=0,05 статистической значимости уравнения множественной регрессии и его показателя тесноты связи.

2. С помощью частных F-критериев Фишера оценить, насколько целесообразно включение в уравнение множественной регрессии фактора x1 после фактора x2 и насколько целесообразно включение x2 после x1.

3. Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов при переменных x1 и x2 множественного уравнения регрессии.

Решение:

1. Задача дисперсионного анализа состоит в проверке нулевой гипотезы H0 о статистической незначимости уравнения регрессии в целом и показателя тесноты связи.

Анализ выполняется при сравнении фактического и табличного (критического) значений F-критерия Фишера Fтабл и Fфакт. Fфакт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:

,

где n – число единиц совокупности;

m – число факторов в уравнении линейной регрессии;

– фактическое значение результативного признака;

– расчетное значение результативного признака.

Результаты дисперсионного анализа представлены в табл. 3.3:

Таблица 3.3

Вариация результата, y Число степеней свободы Сумма квадратов отклонений, S Дисперсия на одну степень свободы, s2 Fфакт Fтабл a=0,05 k1=2, k2=17
Общая df=n-1=19 19945,9
Факторная k1=m=2 11918,3 5959,15 12,62 3,59
Остаточная k2=n-m-1=17 8027,6 472,21

 

; ;

; .

Сравнивая Fтабл и Fфакт, приходим к выводу о необходимости отклонить гипотезу H0 и сделать вывод о статистической значимости уравнения регрессии в целом и значения , так как они статистически надежны и сформировались под систематическим действием неслучайных причин. Вероятность того, что допускаются ошибки при отклонении нулевой гипотезы, не превышает 5%, и это является достаточно малой величиной.

2. Частный F-критерий Фишера оценивает статистическую целесообразность включения фактора x1 в модель после того, как в нее включен фактор x2. Частный F-критерий Фишера строится как отношение прироста факторной дисперсии за счет дополнительно включенного фактора (на одну степень свободы) к остаточной дисперсии (на одну степень свободы), подсчитанной по модели с включенными факторами x1 и x2:

.

Результаты дисперсионного анализа представлены в табл. 3.4:

Таблица 3.4

Вариация результата, y Число степеней свободы Сумма квадратов отклонений, S Дисперсия на одну степень свободы, s2 Fфакт Fтабл a=0,05 k1=2, k2=17
Общая df=n-1=19 19945,9
Факторная В том числе: · за счет · за счет дополнительно включенного k1=m=2 11918,3 5127,1 6791,2 5959,15 5127,1 6791,2 12,62 10,86 14,38 3,59 4,45 4,45
Остаточная k2=n-m-1=17 8027,6 472,21

 

;

;

; ; .

Включение фактора x1 после фактора x2 оказалось статистически значимым и оправданным: прирост факторной дисперсии (в расчете на одну степень свободы) оказался существенным, т.е. следствием дополнительного включения в модель систематически действующего фактора x1, так как .

Аналогично проверим целесообразность включения в модель дополнительного фактора x2 после включенного ранее фактора x1. Расчет выполним с использованием показателей тесноты связи и :

.

В силу того что , приходим к выводу, что включение x2 после x1 оказалось бесполезным: прирост факторной дисперсии в расчете на одну степень свободы был несуществен, статистически незначим, т.е. влияние x2 не является устойчивым, систематическим. Вполне возможно было ограничиться построением линейного уравнения парной регрессии y от x1.

3. Оценка с помощью t-критерия Стьюдента значимости коэффициентов b1 и b2 связана с сопоставлением их значений с величиной их случайных ошибок: и . Расчет значений случайных ошибок достаточно сложен и трудоемок. Поэтому предлагается более простой способ: расчет значения t-критерия Стьюдента для коэффициентов регрессии линейного уравнения как квадратного корня из соответствующего частного F-критерия Фишера:

; .

Табличные (критические) значения t-критерия Стьюдента зависят от принятого уровня значимости a (обычно это 0,1; 0,05 или 0,01) и от числа степеней свободы (n-m-1), где n – число единиц совокупности, m – число факторов в уравнении.

В нашем примере при a=0,05; df=20-3=17; tтабл=2,10. Сравнивая tтабл и tфакт, приходим к выводу, что так как , коэффициент регрессии b1 является статистически значимым, надежным, на него можно опираться в анализе и в прогнозе. Так как , приходим к заключению, что величина b2 является статистически незначимой, ненадежной в силу того, что она формируется преимущественно под воздействием случайных факторов. Еще раз подтверждается статистическая значимость влияния x1 (доли занятых тяжелым физическим трудом) на y (среднедушевой доход) и ненадежность, незначимость влияния x2 (доли экономически активного населения в численности всего населения).



Дата добавления: 2022-02-05; просмотров: 119;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.014 сек.