Метод наименьших квадратов.
Этот метод преследует ту же цель, что и описанные выше три метода: устранить влияние временно действующих факторов и выявить тенденцию развития, вызванную только действием длительно действующих причин. Тенденцию развития лучше всего можно выразить линией, наиболее близкой к фактическим данным, это достигается методом наименьших квадратов, называемым так потому, что сумма возведенных в квадрат разностей фактических чисел - Y и теоретически ожидаемых - Yt - наименее велика, т.е. å(Y-Yt)2®0. Этому условию в каждом конкретном случае отвечает только одна линия, поэтому метод наименьших квадратов можно считать наиболее объективным способом выявления тенденции развития и рекомендовать его для широкого применения.
Для того, чтобы применить способ наименьших квадратов, следует проделать следующие этапы работы.
Сначала, после соответствующей оценки характера развития и изменений изучаемых явлений, производят выбор подходящего вида и характера линий, наиболее соответствующей тенденции развития. Например, если тенденция развития прямолинейна, то точнее всего ее представить при помощи прямой линии, уравнение которой: Yt=a+bx. Если тенденция криволинейна, вначале восходящая, а затем нисходящая, то ее можно представить в виде параболы второй степени с уравнением: Yt=a+bx+cx2.
На следующем этапе для получения числовых значений параметров a, b, c, d и т.д. составляют систему уравнений. При решении системы уравнений получают конкретные числовые значения параметров. Если в уравнении линии, соответствующей по своему характеру тенденции развития, имеется два неизвестных параметра, применяется система двух уравнений. Например, для прямой Yt=a+bx применяется система двух уравнений, для параболы второй степени система трех уравнений и т.д.
В зависимости от того, сколько параметров имеет линия, выражающая основную тенденцию развития, столько уравнений требуется решить.
На третьем этапе работы после решения системы уравнений и получения конкретных числовых значений параметров, определяющих место соответствующей линии в системе координат, путем ряда последовательных подстановок в уравнения полученных величин X (условно принята нумерация периодов) получают теоретически ожидаемые величины Yt. Истолкование результатов при этом аналогично описанному при других способах выравнивания динамических рядов. Разность фактических наблюдаемых величин - Y и теоретически ожидаемых - Yt указывает количественно влияние временно действующих - случайных причин.
Давайте технику применения метода наименьших квадратов при использовании разных видов линий, выявляющих тенденцию развития, проиллюстрируем следующими примерами.
Прямолинейное выравнивание - несокращенный метод.О многих явлениях, являющихся объектом изучения науки можно сказать, что изменения в них с течением времени протекают прямолинейно, т.е. их развитие можно представить в виде прямой, уравнение которой: Yt=a+bx.
Например, рассмотренный нами пример по праву можно отнести к нисходящим прямолинейным. Это позволяет выразить тенденцию развития популяции в виде прямой. Система уравнений при помощи которых определяются параметры, следующая:
SY=Na+bSX
SXY=aSX+bSX2
где Y - фактические числовые величины изучаемого явления за каждый из периодов.
X - условная нумерация периодов. Эта нумерация обычно начинается с нуля и идет в естественном порядке чисел - 0,1,2,3,4, и т.д.
N - численность изучаемых периодов.
Используя приведенные ранее данные, получаем следующее.
Год | Y | X | XY | X2 | Yt=a+bx |
105.2 | |||||
100.4 | |||||
95.6 | |||||
90.8 | |||||
81.2 | |||||
76.4 | |||||
71.6 | |||||
66.8 | |||||
Для того, чтобы найти параметры a и b, необходимо составить систему двух уравнений.
892=10a+45b
3615=45a+285b
Решая эти уравнения получаем a=110, b=-4.8
Yt=a+bx=110-4.8x
Замещая x в этом уравнении соответствующими числовыми величинами, определяющими порядковый номер изучаемых периодов, получаем выровненные величины - Y, те, которые были бы получены, если бы на популяцию действовали только длительно действующие факторы.
Параметр b обозначает снижение или увеличение теоретически ожидаемых величин в течение одного из периодов и называется коэффициентом регрессии. Наименование это дал Гальтон, изучавший корреляцию роста родителей и их потомства. Так как Гальтон выявил нисходящую тенденцию в изменении роста высоких родителей и их потомства (коэффициент b с отрицательным знаком), то назвал он его коэффициентом регрессии. Это наименование остается за коэффициентом b и тогда, когда он имеет положительное значение.
Прямолинейное выравнивание - сокращенный способ - нечетное количество периодов. В нашем примере, иллюстрировавшим применение метода наименьших квадратов, были использованы абсолютные числа. Гораздо более познавательное значение имеют производные статистические показатели - относительные величины, средние величины и т.п. Например, если вы изучаете действие каких-то веществ на организм, то на абсолютные величины количества, допустим умерших животных, оказывает влияние количество животных, подвергнутых воздействию. Поэтому, в таких случаях удобнее пользоваться относительными величинами, выраженными в процентах.
Давайте разберем применение сокращенного способа выравнивания динамических рядов. Этот способ применяется тогда, когда ряд имеет нечетное количество периодов. Особенность его в том, что за начальный год X=0 принимается не первый год, а центральный. Нумерация остальных годов идет в естественном порядке чисел 1, 2, 3 и т.д., но номера более ранних лет до центрального имеют отрицательный знак, а после него положительный. Вследствие этого упрощается система уравнений:
SY=Na
SXY=bSX2
отсюда параметры a и b принимают значения (см. по формуле), что освобождает от необходимости решать систему уравнений.
Имеются следующие данные о заболеваемости гриппом за 1986-1994г.
Год | Y | X | XY | X2 | Yt |
4,7 | -4 | -18,8 | 8,22 | ||
29,4 | -3 | -88,2 | 36,15 | ||
-2 | -122 | 64,08 | |||
79,1 | -1 | -79,1 | 92,01 | ||
152,1 | 119,94 | ||||
161,3 | 161,3 | 147,87 | |||
166,5 | 175,81 | ||||
211,8 | 635,5 | 203,74 | |||
213,6 | 854,4 | 231,68 | |||
1079,5 | 1676,1 | 1079,5 |
a=119.94 b=27.93
Прямолинейное выравнивание - сокращенный способ - четное число периодов.Приведенный способ наименьших квадратов при четном числе периодов встречает затруднение из-за отсутствия центрального периода, который можно было бы принять за начальный. В этом случае начальным моментом считают тот, который находится между двумя центральными, так как данные динамического ряда относятся к середине периода. Если мы имеем интервалы в годах, то для того, чтобы работать с целыми числами эти интервалы переводят в полугодовые.
Не всегда можно представить тенденцию развития явлений при помощи прямой, так как тенденция развития в ряде случаев криволинейна и прямая линия не подходит для ее характеристики. В таких случаях пользуются различными кривыми: параболами, гиперболами, экспоненциальными и т.д.
Парабола - одна из элементарных кривых. Параболой первой степени является прямая линия. Парабола второй степени имеет следующее уравнение: Yt=a+bx+cx2
а параболы третьей степени: Yt=a+bx+cx2+dx3.
Для решения этих уравнений надо найти значения a, b, c, d и т.д. Для этого надо решить соответствующую систему уравнений:
SY=Na+bSX+cSX2
SXY=aSX+bSX2+cSX3
SX2Y=aSX2+bSX3+cSX4
Техника решения подобных уравнений и построения графика принципиально ничем не отличается от разобранных ранее примеров. Аналогично можно применять сокращенные способы для четного количества периодов и нечетного количества периодов.
В случаях, когда количество интервалов велико можно прибегать к сглаживанию по трем, пяти, семи, девяти и т.д. точкам.
Например, сглаживание по 5 точкам выглядит так:
Yt=Xn-2+2Xn-1+3Xn+2Xn+1+Xn+2
по 9 точкам:
Yt=Xn-4+2Xn-3+3Xn-2+4Xn-1+5Xn+4Xn+1+3Xn+2+2Xn+3+Xn+4
Следует отметить, что данный метод можно применять не зная какие факторы оказывают длительное, а какие временное воздействие. Однако, можно заметить, что при таком способе сглаживания теряются начальные и конечные периоды.
Дата добавления: 2020-10-01; просмотров: 402;