Качественные параметры измерения
Релевантность переменных и понятие квазипогрешности согласования. Надежность как вероятность отклонения эмпирического значения от истинного. Три техники косвенного оценивания надежности: тест-ретест, параллельные измерения, деление шкалы. Понятие правильности измерения как вероятность систематической инструментальной погрешности. Точность измерения и градуировка переменных. Устойчивость — воспроизводимость результатов при неоднократных замерах. Валидность. Предикативная валидность. «Метод известной группы» и контроль валидности. Конструктная валидность — соотнесение измерений со структурой теории.
Переменные представляют собой различного вида «линейки», которые «прикладываются» к объектам. В этих линейках — различное число градаций, расстояния между градациями могут быть равными, неравными и вообще неизвестными. Кроме того, сами «линейки» могут претерпевать изменения под влиянием внешних обстоятельств. Коротко говоря, средства измерения могут быть хорошими и плохими. Все это создает в совокупности проблему качества социологического инструментария. Инструмент должен отвечать требованиям релевантности, валидности, надежности, точности и устойчивости.
Релевантность — это обоснование применимости измерителя к измеряемому признаку. Проблема релевантности связана с тем обстоятельством, что «наблюдаемая реальность», если таковая вообще существует, представляет или скрывает некую «подлинную» реальность, соответствующую своему понятию. Ошибки релевантности возникают до процедуры измерения, и, даже если инструмент обладает высокой степенью совершенства, он может быть нерелевантен для определенного признака. Иногда ошибки релевантности называют ошибками обоснованности (В.А. Ядов), или квазипогрешностями согласования (Б.З. Докторов). «Измерительная процедура приводит к истинному определению величины, если она правильна, точна и построена на
определению величины, если она правильна, точна и построена на основе модели, адекватно отражающей феномен, — пишет Б.З. Докторов. — Только правильность и точность не гарантируют истинности. Точная и правильная в указанном смысле стрельба на практике может оказаться лишь отличной стрельбой по неверно найденной мишени»4. Например, продолжительность просмотра телепередач можно фиксировать со слов респондента, однако в данном случае измеритель может содержать значительную ошибку релевантности. Более релевантны в данном случае небольшие технические устройства, вмонтированные в телеприемники и регистрирующие время их работы на различных каналах. Такой метод используется, в частности, Институтом демоскопии в Алленсбахе (Германия).
Когда инструмент создан, возникает вопрос о возможном отклонении результата измерения от истинного значения. Надежность — это вероятность отклонения приписываемого объекту значения от истинной его характеристики. Надежность является интегральной характеристикой инструмента, включающей правильность, точность и устойчивость и валидность.
Как оценивается уровень надежности? Ведь вариация истинных и ошибочных замеров на самом деле неизвестна. Для решения этой задачи используются три техники косвенного оценивания: «тестретест», параллельные измерения и деление шкалы.
«Тест-ретест» показывает вероятность возникновения различных результатов при двух замерах одного и того же объекта одинаковым инструментом, но не дает никаких сведений об источнике ошибки. В частности, при повторном интервьюировании очень велика вероятность влияния первого замера на второй и последующие. Нормы морали предписывают держать свое слово, и те, у кого семь пятниц на неделе, не одобряются. Поэтому респондент склонен давать сходный ответ, если он запомнил его при первом опросе. В итоге оценка надежности инструмента будет явно завышена. На самом деле социологические признаки (особенно мнения и оценки) меняются. Если изменения будут зафиксированы, «тест-ретест» в данном случае покажет заниженную надежность.
Параллельные измерения избавлены от погрешностей, присущих «тест-ретесту». Измерительный инструмент применяется в двух формах одновременно. Например, для измерения установки можно использовать два разных тест-вопросника. Если полученные два ряда коррелиру
4 Докторов Б.З. О надежности измерения в социологическом исследовании. Л.: Наука, 1979. С. 12.
ют, инструмент принимается. В данном случае остается неясным, какая форма основная, а какая параллельная. Выбор обычно осуществляется на основе произвольных критериев. Кроме того, разработка параллельных инструментов — дело довольно трудоемкое и, как правило, не оправдывает себя.
Деление шкалы заключается в интерпретации двух частей континуума и более как отдельных шкал. Предположим, измерительным инструментом является совокупность вопросов. Она делится на две группы, например, на вопросы с четной и нечетной нумерацией. По каждой группе подсчитываются средние значения переменной. Затем вычисляется коэффициент корреляции — мера надежности шкалы.
Отклонение результата измерения от истинного значения признака может быть обусловлено систематической ошибкой. В данном случае речь идет о правильности. Инструмент создает систематическую ошибку, например, в тех случаях, когда шкалы несбалансированы, респонденты неверно понимают вопросы, сказывается влияние интервьюера и т. п. Смещения шкалы, как правило, возникают при ранжировании объектов по списку. Позиции, стоящие в начале списка, обычно отмечаются чаще, чем последние. Такой инструмент является неправильным. Правильным будет предъявлять респондентам карточки с наименованием объектов оценивания, не забывая их перемешивать.
Точность измерения — это количество градаций переменной, которое может быть изменено в зависимости от задач исследования. Возраст принято исчислять годами, но для младших дошкольников разница в несколько месяцев не менее важна, чем разница в несколько лет для взрослых. Расстояние от дома до работы может быть подсчитано с точностью до ста метров, однако такая точность вряд ли понадобится. Чем больше градаций, тем более точные данные получает исследователь. При этом вероятность отклонения результатов от истинных значений признака возрастает — надежность снижается. Если укрупнить шкалу, надежность, конечно, повысится. Например, разделив возрастную шкалу на три класса—до 30 лет, 31 —60, старше 60 лет — мы будем ожидать отклонений лишь в пограничных зонах: 29 лет — 31 г., 59 лет — 61 г. Зато в один интервал попадут восемнадцатилетние и двадцатидевятилетние, которые значительно отличаются по возрасту.
Количество делений шкалы — результат разумного компромисса между стремлением к точности и требованиями надежности. Более точный инструмент, как правило, больше подвержен всякого рода неприятностям. Но надежность грубого инструмента не компенсирует грубости результатов. Как правило, при многократном повторении
замеров и при отсутствии систематической ошибки их средняя приближается к истинному значению признака.
Устойчивость — это воспроизводимость результатов при многократных замерах. Дело в том, что меняться может не только характеристика объекта, но и сам измерительный инструмент. Он может быть точным и правильным, но неустойчивым. В отличие от правильности устойчивость нарушается по причине случайных ошибок. Устойчивость обратно пропорциональна точности. Чем чувствительнее инструмент, тем больше вариация получаемых данных. В технике устойчивость измерительного прибора в большинстве случаев можно уверенно контролировать. В социологии же, особенно при измерении установок, вторичный замер соотносится уже не со «старым» признаком, а с тем, к которому уже было применено воздействие инструмента. Возникает ситуация, аналогичная смещению замера при использовании техники «тест-ретест». Г.И. Саганенко, детально изучавшая устойчивость измерения, называет такую ошибку «эффектом первого замера»5.
Валидность инструмента связана с отношением между измерительным инструментом и результатами измерения. Предполагается, что если инструмент валидный, то существуют определенные эмпирические отношения между результатами его применения и другими свойствами или переменными. Эти отношения лежат в основе предикативной валидности — корреляции между результатами измерения и внешними критериями. Например, можно валидизировать тест интеллектуального развития студентов с помощью системы баллов за решение задач, а затем измерить корреляцию этого признака и оценками студентов за год. Такого рода корреляции часто интерпретируются как мера валидности. Надо только быть уверенным, что измерение валидно и релевантно по отношению к концепту. Но если так, то возникает вопрос: зачем нужно использовать тестовые баллы и тому подобные сомнительные операции, когда есть надежный объективный критерий? Иногда объективные замеры получить трудно, а иногда им должны предшествовать предварительные пробы. Например, экзамены — своеобразный тест — нужно выдержать до того, как выпускник университета получит возможность продемонстрировать свою профессиональную подготовку на деле.
Наиболее распространенный критерий валидности связан с мето
5 Саганенко Г.И. Социологическая информация: статистическая оценка надежности исходных данных социологического исследования. Л.: Наука, 1979. С. 66.
дом «известной группы». Предположим, надо оценить валидность тествопросника для измерения политического консерватизма. В качестве внешнего критерия можно избрать социально-экономический статус. Мотивы такого выбора обусловлены теоретическим выводом, что консервативные установки более представлены в среднем классе, чем в среди бедных.
Если же обнаружится, что в среднем и низшем классах примерно одинаковое количество консервативно настроенных, предикативная валидность инструмента становится сомнительной. Высокая корреляция между социально-экономическим статусом и консервативной установкой, измеренной определенным образом, не валидизирует инструмент, а только не отвергает его. Это связано с тем, что независимый критерий может не иметь никакого отношения к консерватизму.
Конструктная валидность связывает измерительный инструмент со структурой теории. Она основывается на следующем рассуждении. Во-первых, предполагается, что инструмент измеряет определенное свойство; во-вторых, это предположение интерпретируется в терминах теории; в-третьих, устанавливается круг свойств, связанных или не связанных с инструментом; в-четвертых, предполагаемые отношения подтверждаются либо не подтверждаются эмпирическими данными, Если предсказание подтверждается, то инструмент считается валидным. В случае неподтверждения допустимы три версии: 1) инструмент не измеряет предполагаемое свойство; 2) ошибочна теоретическая модель, лежащая в основе предсказания; 3) неверно измерены критерии проверки предсказания.
В 1960 г. Милтон Рокичпредложил шкалу, измеряющую уровень догматизма. Этот инструмент представляет собой систему суждений, соотносящихся с «закрытостью» мышления безотносительно к содержанию какой-либо идеологии. Рокич полагал, что идеологические ориентации связаны с личностными характеристиками, стилями мышления и поведения. В частности, он использовал метод «известной группы», предложив профессорам и преподавателям назвать своих знакомых, которые, по их мнению, обладают «открытым» либо «закрытым» мышлением. Изучая религиозные группы, Рокич установил, что студенты-католики более догматичны, чем протестанты. Аналогичная зависимость наблюдалась между догматизмом и коммунистическими убеждениями. Либералы же, как ни странно, оказались менее догматичными6. Возможная критика шкалы Рокича связана с сомнением в ее релевантности: скорее всего, мышление общительных, коммуникабельных людей считается «открытым», а
6 Rokeach М. The open and closed mind. New York: Basic Books, I960.
общительных, коммуникабельных людей считается «открытым», а сдержанных и молчаливых — «закрытым», но эти характеристики вряд ли соответствуют идеологическим ориентациям.
Шкалы
Понятие шкалирования. Основные ошибки при построении шкал. Типы шкал. Шкала наименований. Требования к построению шкал. Упорядоченная шкала: ранги и баллы. Интервальная шкала и шкала отношений. Метрические или абсолютные шкалы. Вербальная, графическая и числовая интерпретации шкал.
Измерение — отображение эмпирической системы в числовую систему, сохраняющую порядок отношений между объектами. Классическая концепция измерения различает два способа приписывания объектам значений переменных. Первый способ называется оцениванием. Отображение свойства объекта на шкалу осуществляется здесь в условных единицах. Например, можно с той или иной степенью точности определить место человека на шкале «консерватизма». Никакой единицы консерватизма в распоряжении исследователя не имеется, градации могут меняться произвольно.
Собственно измерение требует определения единицы — эталона шкалы. В этом случае измерению поддаются лишь пространственные и временные признаки, а также численность — аддитивные величины. Однако в социальных и поведенческих науках получил признание более широкий взгляд на измерение как на приписывание объектам значений в соответствии с заданной системой отношений на различных уровнях.
Переменная — не то же самое, что реальные признак или свойство. Это своего рода линейка — совокупность норм и операций, которые необходимы и достаточны для квалификации события, свойства, отношения, словом, всего того, что принято понимать под фактами. Для линейки не очень важно, нанесены ли ее деления на деревянную, пластмассовую либо металлическую пластинку. Гораздо важнее градуировка шкалы, а также умение пользователя правильно производить замеры. Аналогичным образом обстоит дело и при измерении поведения, только «линейка» в данном случае имеет вид вопросника (или бланка наблюдения), а «прикладывание» их к объекту есть не что иное, как операциональное определение.
Как измерительный инструмент переменная конструируется исследователем путем установления континуума значений (градаций). Minimum minimorum континуума, как мы уже знаем, — дихотомия: «да» и «нет», плюс и минус, утверждение и отрицание. Фактически
же мы почти всегда имеем дело с трихотомиями, поскольку в составе любой переменной положена градация «нет ответа» (или «нет данных»).
Таким образом, переменная содержит три компонента: 1) некоторую не всегда отчетливо сформулированную концепцию измеряемого признака, например, «электоральные предпочтения», «стабильность семьи», «образование» и т. п.; 2) шкалу — совокупность значений, задающих критерии классификации объектов; 3) операциональное определение — совокупность инструкций, регламентирующих процесс идентификации объекта по установленной шкале значений.
Элементарный уровень измерения — номинальный. Этому уровню соответствует шкала наименований, которая состоит из значений признаков, не упорядоченных по степени возрастания или убывания. Типичные примеры шкалы наименований: национальность, профессия, политические убеждения. Значения шкалы наименований конструируются в соответствии с логическими правилами классификации. Первое из них — правило непротиворечия. Оно гласит: «Объект может быть отнесен к одному и только одному классу, предусмотренному значением переменной». Иными словами, исследователь обязан называть вещи своими именами и избегать диалектики, при которой объект одновременно оказывается и тем, и другим. Сделать это не так легко, как кажется, — назвать вещь своим именем. Реакционеры иногда кажутся либералами, глупые — умными, женщины — мужчинами. Но даже в самых затруднительных ситуациях аналитик обязан дать однозначную квалификацию объекту. Здесь многое позволено. Единственное, что запрещено, — это квалифицировать объект как белый и черный одновременно.
Следствием данного правила является стопроцентная сумма частот всех градаций переменной. Если сумма частот превышает стопроцентную отметку, значит, по крайней мере некоторые единицы попали одновременно в два класса и посчитаны неоднократно. Так бывает, когда в вопроснике задают шкалу-ассорти, где можно выбрать и то, и другое, и третье. Например, спрашивается: «Что вы больше всего любите?» с вариантами ответов: мацу, шашлык, либерально-демократические свободы... Здесь можно предпочесть все подсказки вопросника, и стопроцентной суммы не получится, если хотя бы один из респондентов попал в классы любящих одновременно мацу и либерально-демократические свободы. Причина искажения в том, что приведенные позиции не составляют переменную, напротив, каждая из них — являет собой «обрезанную» версию переменной. Полноценная версия предполагает ответы «Да», «Нет» и «Не могу сказать».
Правильно построенная переменная представляет собой одномерный континуум. В отличие от многосоставных измерений он не требует агрегации. Отсюда второе правило — правило единого основания классификации. Нельзя разделять людей на умных и рыжих, потому что и рыжие иногда оказываются умными. Нельзя смешивать две разные переменные в одном вопросе. Нельзя не учитывать и изменение смысла переменной при ее перемещении в иной контекст. Например, вопрос об отношении к интеллигентам, заданный в Москве и Чикаго, окажется двумя разными вопросами, потому что в русской традиции принято приписывать интеллигенту роль носителя нравственного начала, тогда как житель Чикаго не сразу догадается, кто имеется в виду под «интеллигентом».
Третье правило — правило полноты. В изучаемой совокупности не должно быть ни одного объекта, не поддающегося идентификации по заданным значениям. Иными словами, объект должен быть распределен на континууме переменной и получить полагающееся ему место в одном из классов. Если же этого не происходит, процесс измерения «зависает» — линейку приложить просто не к чему и не к кому. Заметим, что позиция «Нет данных» решает проблему полноты, когда шкала не охватывает весь диапазон значений. Например, отказ респондента сообщить свой возраст не означает, что шкала возраста не имеет отношения к данному объекту. Примеры шкал, которые не имеют отношения к объекту, иначе говоря, не релевантны ему, многочисленны. Социологи часто пытаются осуществить замеры мнений, установок, других личностных характеристик, предполагая, что изучаемое свойство имеется у всех. Например, вопрос: «Как вы относитесь к Бурбулису?», задававшийся некоторыми центрами изучения общественного мнения в 1992 г., основывался на убеждении, что свойство «Отношение к Бурбулису» имеется у всех, кто попал в выборку. Исключалась сама возможность того, что у человека нет ни положительного, ни отрицательного отношения к Бурбулису. Позиция «Не могу сказать», казалось бы, включает в себя такого рода респондентов, однако сюда попадают не только не имеющие мнения, но и не имеющие самого признака.
В социологических измерениях нередко возникает разновидность искусственно созданных эмерджентных переменных — переменных, порожденных самой процедурой. Люди, не имевшие до момента интервьюирования никакого отношения к изучаемому признаку, конструируют это отношение в процессе межличностной коммуникации с интервьюером, отвечая «положительно», «отрицательно» или чаще всего «нейтрально». Причины эмерджентных переменных связаны больше всего с влиянием интервьюера.
Таблица 3.2
Мнения о том: кто из работников имеет наибольший шанс на продвижение, %
Кто, по вашему мнению, имеет наибольших шанс на продвижение? | Миссии | ||
весь | Самостоя-тельных ответов | ответов с подсказкой | |
Тот, кто является хорошим специалистом | |||
Тот, кто старается угодить руководству | |||
Иные ответы |
В книге Г. А. Погосяна, изучавшего порождения новых значений в процессе «полевой» коммуникации, рассказывается о типичных обстоятельствах, при которых переменные описывают не столько самостоятельное речевое поведение респондента, сколько ситуацию сбора данных. В частности, Погосян показал, что подсказка ответа существенно изменяет частотное распределение (табл. 3.2).
Из таблицы видно, что «подсказка» существенно увеличивает количество считающих, что хорошие специалисты имеют наиболее благоприятные шансы на продвижение по службе, и почти настолько же снижает количество указавших на угодливость. Если предположить, что открытые вопросы дают большую возможность для выражения самостоятельного мнения, подсказка приводит к артефакту: 62% выбрали соответствующую версию ответа, а не выразили свое мнение7.
Проектируя переменные, социолог стремится обеспечить их соответствие фактическому поведению объекта. В то же время он обязан организовать их в логическом отношении, пренебрегая тем обстоятельством, что «жизнь» часто бывает нелогичной и многозначной. Здесь намечается дилемма: либо описывать жизнь во всей противоречивости, либо конструировать схемы. В первом случае
7 Погосян Г.А. Метод интервью и достоверность социологической информации. Ереван: Изд-во АН Армянской ССР, 1985. С. 123 — 129.
социологу лучше избрать для себя карьеру писателя, во втором случае необходимо постараться, чтобы логическая схема соответствовала действительности.
Требования взаимооднозначного соответствия и единого основания содержат в себе определенное насилие над «человеческой» реальностью. В жизни «да» часто переходит в «нет», «демократы» называют себя коммунистами, а плюс оказывается минусом. Лучше всего работать с номиналиями, которые, как предполагается, в наибольшей степени соответствуют языку социального взаимодействия и поведения. Номинальные измерения в социологических и социально-экономических исследованиях расцениваются как фундаментальные для понимания самой природы социальной реальности. С.В. Чесноков основывает такой вывод на предположении, что номинальные переменные являются конечным итогом процедур эмпирической верификации теоретических понятий всегда, когда объектом исследований в той или иной мере являются люди, их сознание и поведение. «Это обусловлено тем, — пишет С.В. Чесноков, — что и социолог-исследователь, и люди, выразившие добрую волю контактировать с социологом в роли респондентов, выражают свои реакции, формируют и описывают социальное в образах и понятиях, знаками которых являются слова, а не числа»8. Отсюда следует предположение об ограниченных возможностях числового анализа данных. Гуманитарным измерением С.В. Чесноков называет любое именование, а детерминационным анализом — установление следования «если а, то b», где аи b — имена9.
Вне сомнения номинальные переменные, фиксирующие конкретные значения, лежат в фундаменте социологического словаря. Однако эта их особенность коренится не столько в «живом языке» социального общения, сколько в эквивалентности значений переменных протокольным фактофиксирующим высказываниям. Такого рода номинальные «протоколы» вне зависимости от их содержания лежат в фундаменте любых научных описаний. Собственно шкалы (континуумы) представляют собой способы организации номинальных значений в идеализированных метриках, но в любом случае должно соблюдаться требование взаимооднозначного соответствия единицы и значения переменной.
8 Чесноков С.В. Детерминационый анализ социологических данных в режиме диалога: Препринт/Всесоюзный научно-исследовательский институт системных исследований. М.: ВНИИСИ, 1980. С. 45.
9 Чесноков С.В. Основы гуманитарных измерений: Препринт / Всесоюзный научно-исследовательский институт системных исследований. М.: ВНИИСИ, 1985. С. 5, 17.
6-365
Требования, предъявляемые к номинальным измерениям (идентификациям), должны выполняться и для шкал более высокого уровня: упорядоченных, интервальных и метрических.
Упорядоченная шкала отличается от номинальной тем, что ее градации располагаются в определенном порядке относительно возрастания либо убывания интенсивности свойства.
К классу упорядоченных относятся оценочные шкалы, установки и предпочтения. В социологии используются два вида упорядоченных шкал: ранги (рейтинги) и баллы. Ранги устанавливаются путем приписывания объекту места таким образом, что количество мест в точности равно количеству объектов. Например, можно распределить студентов по уровню подготовки и приписать каждому его место, начиная от первого и кончая последним. Иначе говоря, мы ранжируем их, зная, что вне зависимости от уровня знаний в группе должны быть первые и последние. Аналогичную систему производственного стимулирования, основанную на идее поощрения первых за счет последних, применил в 1960-е гг. В.М. Якушев, экспериментируя в одном из конструкторских бюро, — эксперимент получил известность под названием «Пульсар». Поскольку в любом случае кто-то окажется последним, группа ставится в условия конкуренции и борьбы за выживание.
Рейтинг как тип социального оценивания является нормой определенного типа культуры, основанной на приоритете индивидуального интереса перед интересами коллективными. Жизненный и профессиональный успех осмысливается здесь как победа над другими. В такого рода игре считается глупым и даже аморальным дать товарищу по классу списать контрольную работу — ведь это означает уступить ему в соревновании. В конечном счете загнанных лошадей пристреливают, не так ли? Все это происходит не только в учебе, но и в бизнесе, семье, общении, религии. Теория рационального выбора основана как раз на идее оптимизации индивидуального поведения при ограниченных ресурсах.
Балльные шкалы оперируют не местами, а школьными значениями. Эти значения не зависят друг от друга. В некотором смысле балльная шкала имеет эгалитарное происхождение. Все студенты, включая первого и последнего, могут получить тройки и быть счастливы в соответствии с теорией относительной депривации. Однако надежность такого рода шкал очень сомнительна, особенно в случаях, когда для означивания меток используются цифры. Расстояние от 4 до 5 — не то же самое, что расстояние от 2 до 3. У каждого преподавателя есть собственные предпочтения относительно участка континуума, на котором он распределяет студентов. Один ставит 2 и 3, другой 4 и 5. Как сравнивать их? Больших затруднений здесь не
возникает, поскольку индивидуальные значения можно нормировать относительно среднего балла либо стандартного отклонения баллов у каждого преподавателя.
Упорядоченные шкалы оценивания предполагают логическое балансирование позиций относительно нейтрального центра. Это требование отражает более общее правило построения шкал: каждая категория шкалы должна характеризоваться равной вероятностью «попадания» объекта при условии случайного распределения. Иными словами, количество градаций справа от центра должно быть равно количеству градаций слева, Часто в качестве «центра» шкалы используется значение «Не могу сказать». Так создается очевидная двусмысленность в интерпретации данных. «Не могу сказать» означает, что респондент не может выбрать ни одну из предложенных позиций; но если «Не могу сказать» стоит в центре сбалансированной шкалы, имеется в виду «Затрудняюсь предпочесть что-либо».
Когда значения упорядоченной шкалы оценивания не имеют четко определенных границ, шкала превращается в полуупорядоченную. Фактически в социологических и психологических исследованиях чаще всего используются полуупорядоченные шкалы.
Интервальные шкалы основаны на процедурах, обеспечивающих равные или примерно равные расстояния между градациями переменной. В данном случае сравниваются не значения переменных, а расстояния между значениями. Иными словами, любые два измерения данной эмпирической системы, осуществленные по шкале интервалов, переводятся друг в друга с помощью линейной функции.
Если по номинальной шкале последовательность объектов устанавливается без особых затруднений, интервальная шкала предполагает решение проблемы сравнения расстояний между объектами10. Это свойство линейных преобразований, характерное для интервальных шкал, демонстрируется числовым примером: 5 — 2 / 2 — 1 = 24 — 15 / 15 — 12 = 3. Отношение разностей между шкальными значениями является в данном случае постоянным». Если один из объектов интервальной шкалы отображается в ноль, можно говорить о шкале отношений — частном случае интервальной шкалы. В данном случае фиксируется начало отсчета12.
10 Саганенко Г.И. Социологическая информация: статистическая оценка надежности исходных данных социологического исследования. Л.: Наука, 1979. С. 14.
11 Клигер С.А., Косолапое М.С., Толстова Ю.Н. Шкалирование при сборе и анализе социологической информации, М,: Наука, 1977. С. 20.
12 Там же. С. 22.
б*
Построить интервальную шкалу можно с помощью парных сравнений либо используя, как это делал Л. Терстоун, судейские процедуры. Сначала создается массив релевантных суждений, описывающих измеряемый признак, например отношение, установку либо оценку. Затем экспертам предлагается расположить суждения по категориям от наибольшей интенсивности признака до наименьшей. Предполагается, что распределение судейских оценок вокруг шкальных значений подчинено нормальному закону. Отбираются те суждения, которые получил и согласованные оценки судей. Таков метод построения «интервалов, кажущихся равными». Наиболее известные методы построения шкал интервалов разработаны Л. Терстоуном, Р. Ликертом, Л. Гуттманом. Однако в современной социологии они используются редко.
Метрические, или абсолютные, шкалы соответствуют всем требованиям, предъявляемым к шкалам более низких классов, они имеют не только нулевую метку отсчета, но и единицу измерения времени, расстояния либо численности единиц. Здесь допустимы все преобразования с числами.
Приписывание значений объектам осуществляется в трех формах: вербальной, графической и числовой. Вербальная интерпретация переменных наиболее распространена в массовых опросах. В качестве элементов шкалы здесь выступают суждения, свидетельствующие о мнениях, ценностях, состояниях. Насколько адекватно это свидетельство — особая проблема. Ясно одно: сами суждения не более чем свидетельство о реальности, которая стоит за ними. Поэтому вербальная интерпретация шкалы выполняет в языке повседневности роль своеобразного зонда. Ее принципиальное отличие от обыденной речи заключается в четкой концептуальной структуре, адаптированной к многообразным речевым ситуациям и контекстам. Даже открытый вопрос, казалось бы, максимально ориентированный на лексику респондента, работает только при условии однозначного концептуального кодирования.
Вербально интерпретированные позиции шкалы воспринимаются достаточно отчетливо, если их немного. Но уже при выборе из пяти градаций начинаются затруднения. Например, категории «доволен» и «скорее доволен, чем недоволен» различаются со значительной степенью условности. В семипунктовой шкале возможности вербальной интерпретации оказываются исчерпанными. Здесь предпочтительнее графическое оформление шкалы, создающее возможность стандартного прочтения. Графическая интерпретация шкалы применяется в так называемых кросс-культурных исследованиях, где лексика инструмента требует перевода на язык респондента. Предполагается, что визуализация переменной в рисунке создает универсальный «паттерн»
шкалы. Аналогичным образом используются жесты в межнациональном общении. Один из примеров инструмента, выполненного в графическом ключе, — картинки теста тематической апперцепции. Часто шкалы изображаются в виде линеек и пиктограмм. Хэрви Кэнтрил разработал «лестницу счастья»: на рисунке лестницы респондент должен отмечать свое нынешнее положение относительно наилучшего (верх лестницы) и наихудшего (низ лестницы) стечения обстоятельств, а затем указывать направление своего предполагаемого движения по «лестнице счастья». В одной из ранних версий шкалы установки Л. Терстоуном предлагался одиннадцатипунктовый континуум, выполненный в виде термометра.
Числовая интерпретация иногда ошибочно отождествляется с вербальной. Использование цифр в качестве имен числительных не означает введения метрики. Например, в целях кодирования мужчин можно обозначить цифрой 1, а женщин — цифрой 2. В данном случае применены метки, но не числа. Числа предполагают осуществление операций аддитивности, арифметических действий. Круг числовых шкал ограничен интервальным и метрическим уровнями измерения, где установлены единицы интенсивности свойства.
Дата добавления: 2016-07-27; просмотров: 1958;