Примеры постановки и решения прикладных задач
По теме «Многомерный корреляционно-регрессионный анализ»
Пример 4.1.Имеются данные потребления текстиля гражданами США (фактор Y) в зависимости от уровня доходов (фактор X1) и средних цен (фактор X2) в период с 1923 по 1939 годы [11].
Годы | X1 | X2 | Y |
96,7 | 99,2 | ||
100,1 | |||
104,9 | 90,6 | 111,6 | |
104,9 | 86,5 | 122,2 | |
109,5 | 89,7 | 117,6 | |
110,2 | 90,6 | 121,1 | |
112,3 | 82,8 | ||
109,3 | 70,1 | 154,2 | |
105,3 | 65,4 | 153,6 | |
101,7 | 61,3 | 158,5 | |
95,4 | 62,5 | 140,6 | |
96,4 | 63,6 | 136,2 | |
97,6 | 52,6 | ||
102,4 | 59,7 | 154,3 | |
101,6 | 59,5 | ||
103,8 | 61,3 | 165,5 |
Для решения целесообразно использовать процедуру «Регрессия» из пакета «Анализ данных» электронных таблиц Excel [18], описание которой приведено в приложении Б.
Вывод основных итогов решения по зависимости Y = f(X1) | |||
Регрессионная статистика | |||
Множественный R | 0,068181436 | ||
R-квадрат | 0,004648708 | ||
Нормированный R-квадрат | -0,06170804 | ||
Стандартная ошибка | 24,2938986 | ||
Наблюдения | |||
Дисперсионный анализ | |||
df | SS | MS | |
Регрессия | 41,34677044 | 41,34677044 | |
Остаток | 8852,902641 | 590,1935094 | |
Итого | 8894,249412 | ||
Коэффициенты | Стандартная ошибка | t-статистика | |
Y-пересечение | 103,004884 | 119,1604993 | 0,864421386 |
Переменная X1 | 0,306009699 | 1,156143147 | 0,264681497 |
F | Значимость F | ||
0,070056295 | 0,79485725 | ||
P-значение | Нижние 95% | Верхние 95% | |
0,400969134 | -150,9797081 | 356,9895 | |
0,79485725 | -2,158251087 | 2,77027 |
Анализ данных решения показывает отсутствие зависимости потребления текстиля от уровня доходов.
Вывод основных итогов решения по зависимости Y = f(X2) | |||
Регрессионная статистика | |||
Множественный R | 0,946637677 | ||
R-квадрат | 0,896122892 | ||
Нормированный R-квадрат | 0,889197752 | ||
Стандартная ошибка | 7,848179848 | ||
Наблюдения | |||
Дисперсионный анализ | |||
df | SS | MS | |
Регрессия | 7970,340508 | 7970,340508 | |
Остаток | 923,908904 | 61,59392693 | |
Итого | 8894,249412 | ||
Коэффициенты | Стандартная ошибка | t-статистика | |
Y-пересечение | 235,4897079 | 9,079104962 | 25,93754659 |
Переменная X 2 | -1,323306124 | 0,11632976 | 11,37547371 |
F | Значимость F | |
129,4014021 | 8,94249E-09 | |
P-значение | Нижние 95% | Верхние 95% |
7,09262E-14 | 216,1380538 | 254,8414 |
8,94249E-09 | -1,571257138 | -1,07536 |
Анализ данных решения показывает высокую зависимость потребления текстиля от уровня средних цен на данную продукцию.
Вывод итогов решения по зависимости Y = f(X1 , X2) | ||||||
Регрессионная статистика | ||||||
Множественный R | 0,975 | |||||
R-квадрат | 0,951 | |||||
Нормированный R-квадрат | 0,945 | |||||
Стандартная ошибка | 5,553 | |||||
Наблюдения | ||||||
Дисперсионный анализ | ||||||
df | SS | MS | F | |||
Регрессия | 8462,558 | 4231,279 | 137,223 | |||
Остаток | 431,691 | 30,835 | ||||
Итого | 8894,249 | |||||
Таблица 4.1 – Сводная таблица многомерного корреляционно-регрессионного анализа по данным примера 4.1
Коэффициенты уравнения регрессии | Значения коэффициентов | Нижние 95% | Верхние 95% |
a (Y-пересечение) | 129,544 | 71,025 | 188,063 |
b1 (переменная X1) | 1,072 | 0,497 | 1,647 |
b2 (переменная X2) | -1,381 | -1,560 | -1,202 |
Данные анализа решения задачи наглядно свидетельствуют о корректности применения процедур упрощения моделей множественной регрессии. Так, расчетное значение критерия Фишера (Fрасч) при двухфакторной форме модели имеет наивысшее значение (137,223), в то время как при исследовании однофакторной линейной зависимости Y = f(X1) Fрасч = 0,070056, указывая тем самым на слабую статистическую значимость фактора X1.
Дата добавления: 2018-05-10; просмотров: 726;