Розрахунок коефіцієнта кореляції
Якісне оцінювання ступеня зв'язку випадкових величин може бути виконане з використанням коефіцієнта детермінації за шкалою Чеддока:
0,1...0,3 — незначний; 0,7 ... 0,9 — високий;
0,3...0,5 — помірний; 0,9 ... 0,99 — дуже високий;
0,5... 0,7 — істотний; 1,0 — функціональний. Якщо коефіцієнт детермінації R2 > 0,7, то варіація залежної змінної в основному обумовлена впливом факторів, і для прогнозування можна використовувати одержані регресійні моделі.
Якщо аналізується невелика сукупність даних (п < < 30), то для визначення їх довірчого інтервалу використовується t-критерій Стьюдента. Розраховане значення t-критерію t для коефіцієнта кореляції порівнюється з критичним з урахуванням прийнятого рівня значущості, а також кількості ступенів вільності та вважається типовим, якщо tp > tк. Аналогічне оцінюється значущість факторів х на основі t-критерій:
параметрів моделі ;
Табличний редактор Excel дає змогу використати різні інструменти Анализа данных (Корреляция, Ковариация, Регрессия) для одержання параметрів лінійної парної та множинної регресій, а також оцінки ступеня зв'язку.
Аналіз правових даних є досить складною задачею, тому під час проведення кореляпійно-регресійного аналізу слід дотримуватись наступних вимог до вхідних даних для одержання вірогідного результату:
• статистична сукупність даних має включати достатню кількість спостережень або однорідних об'єктів (не менше п’яти) — чим більша кількість спостережень, тим точнішими будуть результати одержаних рівнянь залежності;
• статистичні дані мають бути відібрані за однакові періоди часу (місяць, квартал, рік) або для однорідних об'єктів;
• при проведенні множинної регресії кількість факторів має бути меншою (хоча б на два), ніж кількість спостережень.
Розглянемо процедуру проведення багатофакторного кореляційного аналізу із застосуванням засобу Анализ данных Excel.
Етап 1. Визначаємо фактори, що впливають на результативний показник, і відбираємо найістотніші них. Основні правила відбору факторів:
• результативним фактором, як правило, визначається якісний показник ефективності певної сфери діяльності підприємства (прибуток, рентабельність, дохідність, обсяг реалізації, собівартість тощо);
• слід ураховувати наявність причинно-наслідковог' зв'язку між показниками, що дає змогу розкрити сутність явищ, які досліджуються;
•треба відбирати найбільш значущі фактори, ос кільки охопити всі умови та обставини впливу на результативний показник неможливо;
• усі фактори мають бути кількісними з одиницями виміру;
• не рекомендується включати в кореляційну модель взаємопов'язані фактори, для чого їх слід перевірити на мультиколінеарність;
• не можна включати в кореляційну модель фактори, зв'язок яких з результативним показником ма функціональний характер.
Перевірка на мультиколінеарність передбачає оцінювання взаємозв'язку між окремими факторами-ознаками. За наявності лінійної залежності між факторам] система нормальних рівнянь не матиме однозначною розв'язку, внаслідок чого коефіцієнти регресії та інші оцінки будуть нестійкими. Крім того, наявність взаємозв'язку факторів утруднює економічну інтерпретацію рівняння зв'язку, оскільки зміна одного фактор, спричиняє, як правило, зміну іншого, який з ним пов'язаний.
Існує кілька методів виключення мультиколінеарності, проте найчастіше застосовується метод оцінювання парних коефіцієнтів кореляції. Критерієм мультиколінеарності вважається виконання двох нерівностей:
rxjy >rxjxk; rxky>rxjxk
Якщо ці нерівності або хоча б одна з них не виконується, то виключається той фактор х, зв'язок якого результативним показником у буде менш тісним.
Для оцінювання парного кореляційного зв'язку між факторами можна використати інструментКорреляция з Анализа данных або статистичну функцію КОРРЕЛ. У першому випадку дістанемо таблицю парних коефіцієнтів кореляції для кількох факторів одночасно (але без зворотного зв'язку з вхідними даними) у другому випадку можемо виконати обчислення лише для двох масивів.
Розглянемо спочатку процедуру застосування інструментаКорреляция. Показники, відібрані для про ведення аналізу, оформляємо у вигляді таблиці-спис ку, дані якої можуть бути розміщені по рядкам або ш стовпцям; першим рядком (стовпцем) списку є рядої назв показників. Після подачі командиАнализ данних.../Корреляция з менюСервис на екрані монітора з'явиться діалогове вікно, в якому потрібно вказати такі параметри:
• вхідний інтервал — посилання на діапазон аналізованих даних;
• групування — визначення послідовності розміщення даних (по рядках або по стовпцях);
• мітки — параметр для автоматичного формування рядка (стовпця) назв показників;
•вихідний діапазон — посилання на ліву верхню клітинку вихідного діапазону активного робочого листка, нового робочого листка або нової робочої книги. При цьому можна задати ім'я нового робочого листка, де вихідний діапазон почнеться з клітинки А1.
• множина регресії включатиме аналіз впливу трьох факторів — виробітку одного робітника, матеріаловіддачі та витрат на 1 грн. реалізації.
Одержати парні коефіцієнти кореляції можна такої за допомогою статистичної функціїКОРРЕЛ. Для цього поетапно розраховуємо кожну пару коефіцієнтів, копіюванні формули фіксуємо посилання на адреси першого масиву відповідної пари (абсолютна адресація) В результаті дістанемо таку матрицю коефіцієнтів:
уу ух1 ух2 ..... ухт
ух1 х1х1 х1х2 ..... х1хт
ух2 х2х1 х2х2 ..... х2хт
..... ..... ...... .... ......
ухт х1хт х2хт .... хтхт
Дата добавления: 2020-10-14; просмотров: 419;