Точність або стандартна похибка оцінювачів за МНК

З рівнянь (2.1.15), (2.1.16) зрозуміло, що оцінювачі і за МНК - функція від даних вибірки. Але оскільки дані можуть змінюватися від вибірки до вибірки, то змінюватимуться й значення оцінювачів. Отже, необхідна міра «достовірності» або точності обчислення оцінювачів і . У статистиці точність оцінювача вимірюється його стандартною похибкою. Як зазначено раніше при прийнятих гіпотезах оцінювачі за МНК мають такі значення дисперсій і стандартної похибки:

;	(2.3.1)
,	(2.3.2)
;	(2.3.3)
;	(2.3.4)

де - дисперсія . Усі величини, що входять у (2.3.1)–(2.3.4), за виключенням , можна підрахувати за даними вибірки. Для самої ж величини справедлива формула

(2.3.5)

де - оцінка за МНК істинного значення . Величина (N–2) має назву кількості степенів вільності (df, number degrees freedom). - сума квадратів залишків RSS (residual sum squares).

Оскільки відома, то може бути легко обчислений. Сама величина може бути обчислена за формулою

або

(2.3.6)

Зауважимо, що формула (2.3.6) простіша в застосуванні порівняно з (2.1.2), тому що не вимагає обчислення для кожного i, хоча саме таке обчислення виявляється корисним.

Оскільки

з (2.3.6) можна отримати ще один вираз для підрахунку :

(2.3.7)

Позитивний квадратний корінь з

(2.3.8)

називається стандартною похибкою оцінювача. Вона є стандартним відхиленням величин Y від оціненої лінії регресії і часто застосовується як сумарна міра “якості підгонки” оціненої лінії регресії.

Відзначимо такі властивості дисперсії (а отже, і стандартної похибки) коефіцієнтів і .

1. Дисперсія коефіцієнта прямо пропорційна , але обернено пропорційна . Тобто для даного , чим більша область зміни величин Х, тим менша дисперсія і, отже, вища точність, з якою може бути оцінений . Коротше кажучи, при значній зміні величин Х коефіцієнт може бути виміряний більш точно, ніж при незначній зміні величин Х. Крімтого, для даної величини чим більше , тим більша дисперсія . Зауважимо, що зі збільшенням обсягу вибірки N, кількість членів у зростатиме. Тому зі зростанням N точність оцінки коефіцієнта збільшуватиметься.

2. Дисперсія коефіцієнта прямо пропорційна і , але обернено пропорційна і розміру вибірки N.

3. Оскільки і є оцінками, вони будуть не тільки змінюватися від вибірки до вибірки, але й будуть взаємно залежними в межах однієї вибірки. Ця залежність вимірюється коваріацією між ними. Пізніше буде показано, що

(2.3.9)

Оскільки завжди позитивна, коваріація між і залежить від знака . Якщо , тоді, як бачимо з формули (2.3.9), коваріація буде негативна. Так, якщо кутовий коефіцієнт оцінений із завищенням (тобто лінія регресії підіймається із завищеною крутістю) коефіцієнт перетину матиме занижене значення (перетин матиме менше значення).

<11 12 131415 16 17 >

Дата добавления: 2016-07-27; просмотров: 2080;

Поиск по сайту

Узнать еще

Публикации по технике и механике

Публикации по биологии

Публикации по информатике

Публикации по строительству

Публикации по физике

Публикации по химии

Публикации по электронике

Публикации по искусству

Публикации по географии

Публикации по медицине

Публикации по педагогике

Разделы публикаций