Какое нелинейное сглаживание (уравнение)?
Нередко возможные уравнения подбирают на основании сравнения эмпирического графика с известными образцами кривых.
Обычно проверяют на ПК несколько возможных функций, для которых оценивается и так называемая среднеквадратичная ошибка аппроксимации.
Предпочтение отдается той функции, которая обнаруживает явно меньшую ошибку аппроксимации.
Выбор функции - наука, но в некоторой степени и искусство.
Если коэффициент корреляции велик и высоко значим, а принята, например, периодическая функция, говорят о значимой линейной компоненте изменчивости, на которую наложена циклическая изменчивость. Возможно наложение одних функций на другие.
Пример.
Анализ временного ряда
Исследуется уже приводившийся ряд данных: урожайность озимой пшеницы в Луганской области по годам с 1945 г. по 2004 г. (за 60 лет). Данные облстата.
Здесь на рис. 6 Х – годы, Y – урожайность озимой пшеницы в ц/га.
Рис. 6. Сглаживание временного ряда прямой линией
Корреляция годы – урожайность максимально значимая (r=0.541***, r2=0.293). Линейная компонента изменчивости очевидна (рис. 6).
Уравнение линейной регрессии y=12.18+0.2748x. Угловой коэффициент 0.2748, т.е. на данном 60-и летнем временном интервале происходил рост урожайности в среднем на ~ 0.275 ц/га (на ~ 1 ц/га за 4 года).
Среднеквадратичная погрешность аппроксимации прямой линией Е=47.55.
На глаз кажется, что в последние 10-15 лет урожайность перестала расти и даже несколько снизилась (рис. 6). Это требует проверки посредством сглаживания криволинейными функциями.
Парабола
Уравнение квадратичной параболы y=1.29+1.1651x-0.0137x2. На глаз видно, что аналитическое сглаживание параболой лучше, чем прямой линией (сравните рис. 6 и 7).
Рис. 7. Сглаживание временного ряда параболой и параболой с наложением периодической компоненты
Об этом же свидетельствует и ошибка аппроксимации параболой Е=37.32, в том время как такая ошибка при сглаживании прямой Е=47.55.
Еще в Библии описан 14-летний цикл изменения урожайности: 7 урожайных лет сменяются семью менее урожайными (голодными), а потом цикл повторяется.
Проверяли также периодическую функцию. По программе REGAN получено тригонометрическое уравнение регрессии, описывающее циклические колебания урожайности с периодом в 14 лет. Оно лучше, чем одна парабола, описывает динамику урожайности (рис. 7). Ошибка аппроксимации в этом случае минимальная (Е=31.50).
Можно использовать еще один способ оценки того, сколь хорошо согласуются фактические значения урожайности и полученные по уравнениям линий регрессии – вычисление коэффициента корреляции пар значений: наблюдавшиеся-ожидавшиеся. Получены результаты: прямая линия r=0.541, парабола r=0.667; библейские (14-летние) циклы, наложенные на параболу r=0.730. Чем выше r, тем лучше совпадение. Очевидно, что лучшие результаты дал третий способ аналитического сглаживания.
Итак, сглаживание прямой линией наиболее грубое (Е=47.55), сглаживание параболой значительно лучше (Е=37.32), но самые лучшие результаты дает криволинейная функция, полученная при наложении на параболу периодической компоненты изменчивости (Е=31.50).
Выводы
1. В исследованный период времени средний ход урожайности такой: вначале рост – потом понижение (парабола).
2. На средний ход наложены периодические колебания урожайности (период 14 лет).
Дата добавления: 2021-01-26; просмотров: 412;