Проверка лингвистических гипотез с помощью параметрических критериев
При рассмотрении лексикологических, фонологических проблем, связанных с сопоставлением различных языков, подъязыков и функциональных стилей, приходится сравнивать частоты употребления лингвистических единиц в разных стилях, подъязыках, художественных произведениях. Эти сопоставления осуществляются путём проверки гипотезы о существенности расхождения между соответствующими параметрами распределений интересующей исследователя лингвистической единицы.
Пример. Может ли средняя длина словоформы быть статистической характеристикой стиля и языка? Доказано, что распределение средних длин словоформ близко к нормальному, т.е. расхождения между средними длинами словоформ языков мира не является существенным. Но значит ли это, что такая несущетвеность расхождения будет наблюдаться и при сравнении средних длин словоформ одного функционального стиля?
Рассмотрим расхождения между средней длиной словоформы в научно-технической и деловой речи 6 славянских языков
и средней длиной словоформы в указанных стилях всех языков мира (
).
Сформируем гипотезы H0:
; Н1: 
Для проверки гипотез можно использовать t-критерий Стьюдента или Z-критерий нормального распределения.
t-критерий Стьюдента.Чаще всего при лингвистических исследованиях величина σ неизвестна, поэтому в качестве статистической характеристики выбирается величина
, имеющая распределение Стьюдента с v=n-1 степенями свободы. Примем уровень значимости α=0,05
а) найдём по таблице Стьюдента
, где ν = 6-1=5, α=0,05,
2,57;
б) вычислим по формуле
статистическое значение критерия, где
=6,13;
=7, S=0,43;
;
в) так как
, то гипотеза H0 отвергается и принимается альтернативная гипотеза Н1: 
Z-критерий.Пусть в данной задаче величина σ известна: σ=S=0,43.
а) определим при α=0,05 по таблице Z-распределения: Zα=1,96;
б) найдём статистическое значение Z-критерия
;
= -4,95; в) сравним Zα и Z.
Так как
, то гипотеза Н0 отвергается, принимается гипотеза Н1.
Следовательно, расхождения между
и средней длиной словоформ во всех языках мира являются существенными.
Это связано с тем, что славянские языки используют флективно-аналитическую технику оформления именных форм, которые составляют значительную часть деловых и научно-технических текстов во всех языках. Такую технику отличает небольшое удлинение основы.
Дата добавления: 2016-06-05; просмотров: 1773;











