Точність або стандартна похибка оцінювачів за МНК
З рівнянь (2.1.15), (2.1.16) зрозуміло, що оцінювачі і за МНК - функція від даних вибірки. Але оскільки дані можуть змінюватися від вибірки до вибірки, то змінюватимуться й значення оцінювачів. Отже, необхідна міра «достовірності» або точності обчислення оцінювачів і . У статистиці точність оцінювача вимірюється його стандартною похибкою. Як зазначено раніше при прийнятих гіпотезах оцінювачі за МНК мають такі значення дисперсій і стандартної похибки:
; | (2.3.1) |
, | (2.3.2) |
; | (2.3.3) |
; | (2.3.4) |
де - дисперсія . Усі величини, що входять у (2.3.1)–(2.3.4), за виключенням , можна підрахувати за даними вибірки. Для самої ж величини справедлива формула
, | (2.3.5) |
де - оцінка за МНК істинного значення . Величина (N–2) має назву кількості степенів вільності (df, number degrees freedom). - сума квадратів залишків RSS (residual sum squares).
Оскільки відома, то може бути легко обчислений. Сама величина може бути обчислена за формулою
або
. | (2.3.6) |
Зауважимо, що формула (2.3.6) простіша в застосуванні порівняно з (2.1.2), тому що не вимагає обчислення для кожного i, хоча саме таке обчислення виявляється корисним.
Оскільки
, |
з (2.3.6) можна отримати ще один вираз для підрахунку :
. | (2.3.7) |
Позитивний квадратний корінь з
(2.3.8) |
називається стандартною похибкою оцінювача. Вона є стандартним відхиленням величин Y від оціненої лінії регресії і часто застосовується як сумарна міра “якості підгонки” оціненої лінії регресії.
Відзначимо такі властивості дисперсії (а отже, і стандартної похибки) коефіцієнтів і .
1. Дисперсія коефіцієнта прямо пропорційна , але обернено пропорційна . Тобто для даного , чим більша область зміни величин Х, тим менша дисперсія і, отже, вища точність, з якою може бути оцінений . Коротше кажучи, при значній зміні величин Х коефіцієнт може бути виміряний більш точно, ніж при незначній зміні величин Х. Крімтого, для даної величини чим більше , тим більша дисперсія . Зауважимо, що зі збільшенням обсягу вибірки N, кількість членів у зростатиме. Тому зі зростанням N точність оцінки коефіцієнта збільшуватиметься.
2. Дисперсія коефіцієнта прямо пропорційна і , але обернено пропорційна і розміру вибірки N.
3. Оскільки і є оцінками, вони будуть не тільки змінюватися від вибірки до вибірки, але й будуть взаємно залежними в межах однієї вибірки. Ця залежність вимірюється коваріацією між ними. Пізніше буде показано, що
. | (2.3.9) |
Оскільки завжди позитивна, коваріація між і залежить від знака . Якщо , тоді, як бачимо з формули (2.3.9), коваріація буде негативна. Так, якщо кутовий коефіцієнт оцінений із завищенням (тобто лінія регресії підіймається із завищеною крутістю) коефіцієнт перетину матиме занижене значення (перетин матиме менше значення).
Дата добавления: 2016-07-27; просмотров: 1782;