Додатковий або граничний внесок пояснювальної змінної


Повернемося до ілюстрованого прикладу. З (7.2.2) ми знаємо, що коефіцієнти при Х2 (дохід) і при Х3 (тренд) значущо відрізняються від нуля на основі роздільних t-тестів. Ми також бачили, що на підставі F-тестів (7.2.7) і (7.2.13) сама лінія регресії також значуща. Припустимо тепер, що ми вводимо X2 і X3 послідовно, тобто ми спочатку проводимо регресію Y за Х2 і оцінюємо її значущість, а потім додаємо до моделі Х3 і визначаємо, наскільки її внесок виявляється істотним (зрозуміло, що порядок, у якому змінні вводяться в модель, може бути змінений на протилежний). Під внеском ми розуміємо таке: Чи приводить додавання змінної до моделі до зростання ESS (і R2) значущо в порівнянні з RSS. Цей внесок можна назвати додатковим або граничним внеском пояснювальної змінної.

Дослідження питання про додатковий внесок змінної має важливе практичне значення. У більшості емпіричних досліджень може бути не зовсім зрозуміло, чи варто додавати до моделі змінну Х крім інших змінних, включених в модель. Не слід включати в модель змінну, внесок якої в ESS незначний, і виключати з моделі змінну, що має в ESS істотний внесок. Як же визначити, наскільки істотно змінна X зменшує RSS? Розвиток техніки аналізу дисперсій дозволяє легко відповісти на це питання.

Припустимо, що ми спочатку проводимо регресію Y (особисті витрати на споживання) за X2 (особистий дохід) і одержуємо таку регресію:

(4,6818) (0,0114) t = (2,7259) (77,2982) R2=0,9978, (7.2.14)

Згідно з нульовою гіпотезою , а отже t=77.2982. Очевидно, що значущо відрізняється від нуля як при 5%-му рівні значущості, так і при 1%-му рівні. Таким чином, Х2 значущо впливає на Y. Таблиця ANOVA регресії (7.2.14) подана нижче.

Таблиця 7.4

ANOVA-таблиця для регресії (7.2.14)

Джерело дисперсії SS DF MSS
ESS 65898,2353 65898,2353
RSS 144,0340 11,0800
Загальна 66042,2693  

Припускаючи нормальність закону розподілу збурень і нульову гіпотезу , ми маємо, що F=5947.494 згідно із законом F-розподілу з 1 і 13 степенями вільності.

Очевидно, що знайдене значення F свідчить про значущість при загальноприйнятих рівнях значущості. Таким чином, так як і раніше, ми можемо відхиляти гіпотезу про . Побіжно зазначимо, що T2=(77.2982)2=5947.494. Цей результат очікуваний, оскільки ми знаємо, що при однаковій нульовій гіпотезі й однаковому рівні значущості квадрат величини t з (n–2) степенями вільності рівний величині F з 1 і (n–2) степеням вільності.

Припустимо, що після отримання регресії (7.2.14) ми ви рішили додати до моделі змінну Х3 (тренд) і отримали множинну регресію (7.2.2). При цьому слід отримати відповіді на такі питання. Який додатковий внесок у модель змінної Х3 в порівнянні з моделлю (7.2.14)? Чи є отримана в порівнянні з моделлю (7.2.14), добавка статистично значущою? Який критерій для включення в модель додаткових змінних? Відповіді на ці питання можна отримати на підставі аналізу дисперсій. Для цього розглянемо табл. 7.5.

Таблиця 7.5

ANOVA-таблиця для оцінки додаткового внеску змінної.

Джерело дисперсії SS DF MSS
ESSунаслідок Х2 Q1/1
ESS унаслідок Х3 Q2=Q3Q1 Q2/1
ESS унаслідок Х2 і Х3 Q3/2
RSS Q4=Q5Q3 N–3 Q4/(N–3)
Загальна N–1  

Для даного прикладу одержуємо такі результати (табл. 7.6).

Таблиця 7.6

Джерело дисперсії SS DF MSS
ESS унаслідок Х2 Q1=65898,2353 65898,2353
ESS унаслідок Х3 Q2=66,8647 66,8647
ESS унаслідок Х2 і Х3 Q3=65965,100 32892,55
RSS Q4=77,1693 6,4302
Загальна Q5=66042,2693  

Для отримання оцінки додаткового внеску від X3 до вже врахованої змінної X2 підраховуємо

, (7.2.15)

де ESSн – оцінена сума квадратів нової моделі (тобто після додавання нових регресорів); ESSс – оцінена сума квадратів старої моделі (Q1); RSSн – сума квадратів залишків (Q4); m – кількість нових регресорів; k – кількість параметрів у новій моделі.

Для нашого прикладу одержуємо

F=10,3973. (7.2.16)

Тепер при звичайних припущеннях про нормальність і нульовій гіпотезі можна показати, що підрахована за (7.2.15) величина F підкоряється закону F-розподілуз 1 і 12 степенями вільності.

Побіжно відзначимо, що величину F з (7.2.15) можна подати тільки через значення R2, як це було зроблено в (7.2.13). Одержуємо вираз

. (7.2.17)

Для нашого прикладу, застосовуючи (7.2.2) і (7.2.14), отримуємо

.  

Отже,

F=10,973. (7.2.18)

Таким чином, на підставі будь-якого з F-тестів, ми можемо відкинути нульову гіпотезу і зробити висновок, що додавання в модель Х3 значущо підвищує ESS і, отже, R2. Висновок: змінну тренда Х3 слід додати в модель.

Пригадаємо, що в (7.2.2) ми отримали t=3,246для коефіцієнта при Х3 при гіпотезі . Зазначимо, що t2=10,973=F. Це співвідношення очевидне, якщо врахувати зв’язок між F і t2, згадуваний раніше.

Описана процедура F-теста дає формальний метод ухвалення рішення про те, чи варто включати додаткову змінну в модель регресії. Часто дослідники стикаються із задачею вибору найкращої з моделей, що мають однакову пояснювану змінну, але різні пояснювальні. Багато хто як критерій вибору використовує величину , тобто вибирають модель із найбільшим . Отже, включення змінної спричиняє зростання , вона зберігається в моделі, хоча й не зменшує RSS значущо в статистичному значенні. У такому разі виникає питання: коли зростає? Можна показати, що зростатиме, якщо величина t для коефіцієнта при новій доданій в модель змінній за абсолютною величиною більше 1, де t – статистика, підрахована при нульовій гіпотезі про рівність нулю відповідного коефіцієнта. Наведений критерій може бути сформульований й інакше. зростатиме з додаванням нової пояснювальної змінної, якщо F (=t2) цієї змінної більше 1.

За цим критерієм змінна тренда Х3 з t=3.2246 або F=10.3973повинна приводити до зростання , що насправді й відбувається. З її одаванням зростає з 0,9977 до 0,9986.

Чи можна поширити наведений критерій на групу коефіцієнтів, що додаються? Відповідь очевидна з (7.2.17). Якщо додавання до моделі групи змінних дає величину F більше 1, то при цьому зростає.

 



Дата добавления: 2016-07-27; просмотров: 1471;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.008 сек.