Дисперсионный анализ


Наряду с изучением вариации по всей совокупности в целом можно изучить количественные изменения по группам, на которые разделяется совокупность, и между группами. Для этого выделяют три вида дисперсии: общую, межгрупповую и внутригрупповую.

Общая дисперсия(дисперсия признака по всей изучаемой совокупности) характеризует вариацию признака как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности и может быть рассчитана по формуле:

 


Вариацию, обусловленную влиянием фактора, положенного в основу группировки, характеризуетмежгрупповая дисперсия , которая является мерой колеблемости групповых средних вокруг общей средней и исчисляется по формуле:

 

где m - число групп;

- число единиц в группе ;


- частная средняя по группе;


- общая средняя по всей совокупности единиц.

 

Вариацию, обусловленную влиянием прочих факторов, характеризует в каждой группегрупповая (внутригрупповая) дисперсия:

 

 


По совокупности в целом вариация значений признака под влиянием прочихфакторов характеризуется средней из групповых дисперсий:

 

 


Существует закон, связывающий три вида дисперсий. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий

Данное соотношение называется правилом сложения дисперсий и используется в ряде методов статистики, в частности при расчете ошибок выборочного наблюдения (Тема 1.1) и при измерении тесноты связи между признаками (тема 2.1). Теоретический и практический интерес к этому правилу заключается , во-первых, в том что, зная две величины, на основе приведенного равенства всегда можно определить третью величину, во-вторых, важное значение состоит в том что, зная общую дисперсию и дисперсию групповых средних, можно оценить силу влияния группировочного признака с помощью эмпирического коэффициента детерминации и эмпирического корреляционного отношения.

Эмпирический коэффициент детерминации равен отношению межгрупповой и общей дисперсии и рассчитывается по формуле:

 


Он показывает, какая часть (доля) общей вариации изучаемого признака обусловлена вариацией группировочного признака.

Эмпирическое корреляционное отношение (ή) представляет собой корень квадратный из эмпирического коэффициента детерминации и рассчитывается следующим образом:

 

 


Оно характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака (изменяется в пределах от 0 до 1. Если ή = 0, то признак не оказывает влияния на результативный. Если ή = 1, то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих признаков равно нулю. Промежуточные значения оцениваются в зависимости от их близости к предельным значениям.

 

КОНТРОЛЬНЫЕ ВОПРОСЫ И ЗАДАНИЯ

 

1. Что такое размах вариации и в чем его особенности как показателя вариации?

2. Назовите показатели, являющиеся абсолютными характеристиками степени вариации.

3. Что такое размах вариации и в чем его особенности как показателя вариации?

4. Назовите показатели, являющиеся абсолютными характеристиками степени вариации.

5. В чем состоят особенности расчета показателей вариации по сгруппированным данным?

6. Какое аналитическое значение имеет коэффициент вариации?

7. Что представляет собой дисперсия альтернативного признака?

8. Назовите показатели, относящиеся к квантилям распределения.

9. Как определяется внутригрупповая дисперсия?

10. Что представляет собой правило сложения дисперсий?

11. Что характеризует межгрупповая дисперсия, формула ее расчета?

12. Что называется эмпирическим корреляционным отношением, и как оно интерпретируется?

13. В чем состоит значение проверки гипотезы о форме распределения?

14. Каковы особенности кривых нормального распределения? Их использование в анализе фактических данных.

15. Какие критерии согласия используются наиболее часто?

 

ТЕСТЫ

1. Средняя себестоимость выпускаемой продукции в двух группах предприятий одинаковая. В первой группе предприятий индивидуальные уровни себестоимости составляют: 23; 52; 30; 28; 37. Во второй группе: 30; 55; 20; 46; 19. Вариация себестоимости больше:

1) в первой группе предприятий;

2) во второй группе предприятий;

3) одинакова;

4) сравнить вариации себестоимости нельзя.

 

2. Среднее значение признака в двух совокупностях одинаково. Может ли быть различной вариация признака в этих совокупностях?

а) да;б) нет.

3. Средние значения признака в двух совокупностях неодинаковы. Может ли быть одинаковой вариация признака в этих совокупностях?

в) да; г) нет.

 

4. Средняя выработка токарей в двух бригадах по 28 деталей за смену. В первой бригаде индивидуальная выработка рабочих составляет: 32; 25; 29; 28; 26. Во второй бригаде: 30; 25; 22; 36; 27. Вариация сменной выработки больше:

1) в первой бригаде;

2) во второй бригаде;

3) одинакова;

4) сравнить вариации сменной выработки нельзя.

 

5. Средний суточный объем производства продукции на двух промышленных предприятиях района за отчетный месяц одинаковый - по 140 млн. д. ед. По декадам месяца он распределяется следующим образом:

Декады
Предприятие № 1
Предприятие № 2

Укажите, пользуясь показателями вариации, какое из предприятий работало более ритмично:

1) предприятие № 1;

2) предприятие № 2;

3) ритмичность работы на обоих предприятиях одинакова;
4) сравнить ритмичность работы предприятий нельзя.

 

6. Какая из приведенных формул используется для расчета среднего квадратического отклонения?

1) ;

2) ;

3) ;

4) .

 

 

7. Какая из приведенных формул используется для расчета дисперсии?

1) ;

2) ;

3) ;

4) .

 

 

8. Какая из приведенных формул используется для расчета размаха вариации?

1) ;

2) ;

3) ;

4) .

 

9. Какая из приведенных формул используется для расчета среднего линейного отклонения?

1) ;

2) ;

3) ; 4)

.

 

10. Вариацию признака, обусловленную влиянием признака-фактора, положенного в основу группировки, характеризует:

1) межгрупповая дисперсия;

2) частная (внутригрупповая) дисперсия;

3) средняя из частных (внутригрупповых) дисперсий;

4) общая дисперсия.

 

11. Вариацию признака под влиянием прочих факторов (помимо признака-фактора, положенного в основу группировки), действующих в совокупности, характеризует:

1) межгрупповая дисперсия;

2) частная (внутригрупповая) дисперсия;

3) средняя из частных (внутригрупповых) дисперсий;

4) общая дисперсия.

 

12. Вариацию признака, обусловленную влиянием всех факторов, действующих в совокупности, характеризует:

1) межгрупповая дисперсия;

2) частная (внутригрупповая) дисперсия;

3) средняя из частных (внутригрупповых) дисперсий;

Общая дисперсия.

 

13. Вариацию признака только за счёт условий и причин, действующих внутри одной из групп, выделенных в составе совокупности, отражает:

1) межгрупповая дисперсия;

2) частная (внутригрупповая) дисперсия;

3) средняя из частных (внутригрупповых) дисперсий;

4) общая дисперсия.

 

14. Для определения эмпирического корреляционного отношения, которое характеризует тесноту связи между результативным и факторным признаком, используется формула:

1) ;

2) ;

3) ;

4) .

 

15. Закон (правило) сложения дисперсий выражается следующей формулой:

1) ;

2) ;

3) ;

4) .

 

16. Для определения коэффициента вариации, который характеризует однородность совокупности и типичность средней величины, используется формула:

1) ;

2) ;

3) ;

4) .

 

17. Для определения коэффициента детерминации, который характеризует долю вариации результативного признака, обусловленную признаком-фактором, положенным в основу группировки, в общей вариации признака, используется формула:

1) ;

2) ;

3) ;

4) .

 

Открытого типа

 

18. По данным ряда распределения студентов по уровню успеваемости определите средний уровень успеваемости в группе (округлить до 0,1).

Экзаменационный балл
Число студентов, чел.

(2*3 +3*7 + 4*13 +5*7 )/5 =3.8 (4)

 

19. По данным задания 108 определите медиану и первый квартиль экзаменационного балла.

Ме =4, кВ= 3

 

20. По данным задания 108 определите среднее линейное отклонение экзаменационного балла студентов в группе от среднего.

Д = (2*3 + 1*7 +1*7) :30 =0.67

 

21. По данным ряда распределения рабочих по уровню заработной платы определите средний уровень зарплаты рабочих цеха (округлить до 0,1).

Заработная плата, тыс. руб. 3,5 4,0 4,5 5,0 2,5 6,0
Число рабочих, чел.

(3.5 +4*3 +4.5*6 +5*10+ 2.5*2 +6*2):24 =4.5625(4.6)

 

22. По данным задания 110 определите моду и второй квартиль заработной платы.

Мо = 5 Q2= 4.5

 

23. По данным задания 110 определите среднее квадратическое отклонение заработной платы рабочих цеха от среднего ее уровня.

(1.1*1.1+3*0.6*0.6 +6*0.1*0.1 + 10*0.4*0.4 +2.1*2.1*2+1.4*1.4* 2) =1.21+1.08+0.06+1.6+8.82+3.92 =16.69

√16.69/24 =√0.69 =0.83

 

24. По данным ряда распределения рабочих по уровню квалификации (по тарифному разряду) определите средний уровень квалификации рабочих предприятия (округлить до 0,1).

Тарифный разряд
Число рабочих, чел.

 

(2+2*3 +3*25+4*70 +5*10+6*5): 115=443:115 =3.85 (3.8)

 

25. По данным задания 112 определите медиану и первый дециль тарифного разряда.

Ме= 4 Д= 3


Раздел 2.1



Дата добавления: 2020-10-25; просмотров: 544;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.027 сек.