Додатковий або граничний внесок пояснювальної змінної

Повернемося до ілюстрованого прикладу. З (7.2.2) ми знаємо, що коефіцієнти при Х₂ (дохід) і при Х₃ (тренд) значущо відрізняються від нуля на основі роздільних t-тестів. Ми також бачили, що на підставі F-тестів (7.2.7) і (7.2.13) сама лінія регресії також значуща. Припустимо тепер, що ми вводимо X₂ і X₃ послідовно, тобто ми спочатку проводимо регресію Y за Х₂ і оцінюємо її значущість, а потім додаємо до моделі Х₃ і визначаємо, наскільки її внесок виявляється істотним (зрозуміло, що порядок, у якому змінні вводяться в модель, може бути змінений на протилежний). Під внеском ми розуміємо таке: Чи приводить додавання змінної до моделі до зростання ESS (і R²) значущо в порівнянні з RSS. Цей внесок можна назвати додатковим або граничним внеском пояснювальної змінної.

Дослідження питання про додатковий внесок змінної має важливе практичне значення. У більшості емпіричних досліджень може бути не зовсім зрозуміло, чи варто додавати до моделі змінну Х крім інших змінних, включених в модель. Не слід включати в модель змінну, внесок якої в ESS незначний, і виключати з моделі змінну, що має в ESS істотний внесок. Як же визначити, наскільки істотно змінна X зменшує RSS? Розвиток техніки аналізу дисперсій дозволяє легко відповісти на це питання.

Припустимо, що ми спочатку проводимо регресію Y (особисті витрати на споживання) за X₂ (особистий дохід) і одержуємо таку регресію:

(4,6818) (0,0114) t = (2,7259) (77,2982) R²=0,9978,

(7.2.14)

Згідно з нульовою гіпотезою , а отже t=77.2982. Очевидно, що значущо відрізняється від нуля як при 5%-му рівні значущості, так і при 1%-му рівні. Таким чином, Х₂ значущо впливає на Y. Таблиця ANOVA регресії (7.2.14) подана нижче.

Таблиця 7.4

ANOVA-таблиця для регресії (7.2.14)

Джерело дисперсії	SS	DF	MSS
ESS	65898,2353		65898,2353
RSS	144,0340		11,0800
Загальна	66042,2693

Припускаючи нормальність закону розподілу збурень і нульову гіпотезу , ми маємо, що F=5947.494 згідно із законом F-розподілу з 1 і 13 степенями вільності.

Очевидно, що знайдене значення F свідчить про значущість при загальноприйнятих рівнях значущості. Таким чином, так як і раніше, ми можемо відхиляти гіпотезу про . Побіжно зазначимо, що T²=(77.2982)²=5947.494. Цей результат очікуваний, оскільки ми знаємо, що при однаковій нульовій гіпотезі й однаковому рівні значущості квадрат величини t з (n–2) степенями вільності рівний величині F з 1 і (n–2) степеням вільності.

Припустимо, що після отримання регресії (7.2.14) ми ви рішили додати до моделі змінну Х3 (тренд) і отримали множинну регресію (7.2.2). При цьому слід отримати відповіді на такі питання. Який додатковий внесок у модель змінної Х₃ в порівнянні з моделлю (7.2.14)? Чи є отримана в порівнянні з моделлю (7.2.14), добавка статистично значущою? Який критерій для включення в модель додаткових змінних? Відповіді на ці питання можна отримати на підставі аналізу дисперсій. Для цього розглянемо табл. 7.5.

Таблиця 7.5

ANOVA-таблиця для оцінки додаткового внеску змінної.

Джерело дисперсії	SS	DF	MSS
ESSунаслідок Х₂			Q₁/1
ESS унаслідок Х₃	Q₂=Q₃–Q₁		Q₂/1
ESS унаслідок Х₂ і Х₃			Q₃/2
RSS	Q₄=Q₅–Q₃	N–3	Q₄/(N–3)
Загальна		N–1

Для даного прикладу одержуємо такі результати (табл. 7.6).

Таблиця 7.6

Джерело дисперсії	SS	DF	MSS
ESS унаслідок Х₂	Q₁=65898,2353		65898,2353
ESS унаслідок Х₃	Q₂=66,8647		66,8647
ESS унаслідок Х₂ і Х₃	Q₃=65965,100		32892,55
RSS	Q₄=77,1693		6,4302
Загальна	Q₅=66042,2693

Для отримання оцінки додаткового внеску від X₃ до вже врахованої змінної X₂ підраховуємо

(7.2.15)

де ESS_н – оцінена сума квадратів нової моделі (тобто після додавання нових регресорів); ESS_с – оцінена сума квадратів старої моделі (Q₁); RSS_н – сума квадратів залишків (Q₄); m – кількість нових регресорів; k – кількість параметрів у новій моделі.

Для нашого прикладу одержуємо

F=10,3973.

(7.2.16)

Тепер при звичайних припущеннях про нормальність і нульовій гіпотезі можна показати, що підрахована за (7.2.15) величина F підкоряється закону F-розподілуз 1 і 12 степенями вільності.

Побіжно відзначимо, що величину F з (7.2.15) можна подати тільки через значення R², як це було зроблено в (7.2.13). Одержуємо вираз

(7.2.17)

Для нашого прикладу, застосовуючи (7.2.2) і (7.2.14), отримуємо

Отже,

F=10,973.

(7.2.18)

Таким чином, на підставі будь-якого з F-тестів, ми можемо відкинути нульову гіпотезу і зробити висновок, що додавання в модель Х₃ значущо підвищує ESS і, отже, R². Висновок: змінну тренда Х₃ слід додати в модель.

Пригадаємо, що в (7.2.2) ми отримали t=3,246для коефіцієнта при Х₃ при гіпотезі . Зазначимо, що t²=10,973=F. Це співвідношення очевидне, якщо врахувати зв’язок між F і t², згадуваний раніше.

Описана процедура F-теста дає формальний метод ухвалення рішення про те, чи варто включати додаткову змінну в модель регресії. Часто дослідники стикаються із задачею вибору найкращої з моделей, що мають однакову пояснювану змінну, але різні пояснювальні. Багато хто як критерій вибору використовує величину , тобто вибирають модель із найбільшим . Отже, включення змінної спричиняє зростання , вона зберігається в моделі, хоча й не зменшує RSS значущо в статистичному значенні. У такому разі виникає питання: коли зростає? Можна показати, що зростатиме, якщо величина t для коефіцієнта при новій доданій в модель змінній за абсолютною величиною більше 1, де t – статистика, підрахована при нульовій гіпотезі про рівність нулю відповідного коефіцієнта. Наведений критерій може бути сформульований й інакше. зростатиме з додаванням нової пояснювальної змінної, якщо F (=t²) цієї змінної більше 1.

За цим критерієм змінна тренда Х₃ з t=3.2246 або F=10.3973повинна приводити до зростання , що насправді й відбувається. З її одаванням зростає з 0,9977 до 0,9986.

Чи можна поширити наведений критерій на групу коефіцієнтів, що додаються? Відповідь очевидна з (7.2.17). Якщо додавання до моделі групи змінних дає величину F більше 1, то при цьому зростає.

<49 50 515253 54 55 >

Дата добавления: 2016-07-27; просмотров: 1751;

Поиск по сайту

Узнать еще

Публикации по технике и механике

Публикации по биологии

Публикации по информатике

Публикации по строительству

Публикации по физике

Публикации по химии

Публикации по электронике

Публикации по искусству

Публикации по географии

Публикации по медицине

Публикации по педагогике

Разделы публикаций