Ранжирование и оценка
При решении многих практических задач часто оказывается, что факторы, определяющие конечные результаты, не поддаются непосредственному измерению. Расположение этих факторов в порядке возрастания (или убывания) какого-либо присущего им свойства называется ранжированием. Ранжирование позволяет выбрать из исследуемой совокупности факторов наиболее существенный.
Бывает, что явления имеют различную природу и вследствие этого несоизмеримы, т. е. у них нет общего эталона сравнения. И в этих случаях установление относительной значимости с помощью экспертов облегчает выбор наиболее предпочтительного.
Ранжирование может применяться в следующих ситуациях:
1) когда необходимо упорядочить какие-либо явления (объекты) во времени или пространстве. Это ситуация, когда интересуются не сравнением степени выраженности какого-либо их качества, а лишь взаимным пространственным или временным расположением этих явлений (объектов).
2) когда нужно упорядочить объекты в соответствии с каким-либо качеством, но при этом не требуется производить его точное измерение.
3) когда какое-либо качество в принципе измеримо, однако в настоящий момент не может быть измерено по причинам практического или теоретического характера.
Рассмотрим существо процедуры ранжирования подробнее. При ранжировании эксперт должен расположить объекты (альтернативы) в порядке, который представляется ему наиболее рациональным, и приписать каждому из них числа натурального ряда — ранги. При этом ранг 1 получает наиболее предпочтительная альтернатива, а ранг N — наименее предпочтительная.
Следовательно, порядковая шкала, получаемая в результате ранжирования, должна удовлетворять условию равенства числа рангов N числу ранжируемых объектов п.
Бывает так, что эксперт не в состоянии указать порядок следования для двух или нескольких объектов либо он присваивает разным объектам один и тот же ранг, и в результате число рангов N оказывается не равным числу ранжируемых объектов п. В таких случаях объектам приписывают так называемые стандартизированные ранги. С этой целью общее число стандартизированных рангов полагают равным n, а объектам, имеющим одинаковые ранги, присваивают стандартизированный ранг, значение которого представляет среднее суммы мест, поделенных между собой объектами с одинаковыми рангами.
Когда ранжирование производится несколькими (т) экспертами, обычно сначала для каждого объекта подсчитывают сумму рангов, полученную от всех экспертов, а затем, исходя из этой величины, устанавливают результирующий ранг для каждого объекта. Наивысший (первый) ранг присваивают объекту, получившему наименьшую сумму рангов, и, наоборот, объекту, получившему наибольшую сумму рангов, присваивают самый низкий ранг N. Остальные объекты упорядочивают в соответствии со значением суммы рангов относительно объекта, которому присваивается первый ранг.
Точность и надежность процедуры ранжирования в значительной степени зависят от количества объектов. В принципе, чем таких объектов меньше, тем выше их «различимость» с точки зрения эксперта, а следовательно, тем более надежно можно установить ранг объекта. Во всяком случае количество ранжируемых объектов п не должно быть больше 20, а наиболее надежна эта процедура, когда n<10.
Метод ранжирования редко используется «в чистом виде». Чаще всего он сочетается с другими методами, обеспечивающими более четкое различие между факторами. Одним из них является метод непосредственной оценки и некоторые его модификации.
3.3. Метод непосред ственной оценки
Метод непосредственной оценки состоит в том, что диапазон изменения какой-либо качественной переменной разбивается на несколько интервалов, каждому из которых присваивается определенная оценка (балл), например от 0 до 10. Шкала оценок может быть не только положительной, а, например, включать в себя диапазон с интервалом оценок от —3 до +3. Задача эксперта заключается в помещении каждого из рассматриваемых объектов (факторов) в определенный оценочный интервал, либо в соответствии со степенью обладания тем или иным свойством; либо в соответствии с предположениями эксперта об их значимости. Заметим, что число интервалов, на которые разбивается весь диапазон изменения качества, не обязательно должно быть одинаково для каждого эксперта. Кроме того, каждому эксперту разрешается давать одну и ту же оценку двум (или нескольким) качественно различным факторам.
В некоторых случаях оказывается удобнее для выбора наиболее предпочтительного фактора сначала произвести оценку, а затем — ранжирование.
В ряде случаев суммарные оценки рангов нормируются. Нормирование любой меры означает, что представляющее ее число для всего множества в целом принимается равным единице. Нормирование позволяет установить более тесную связь между оценками, приписанными экспертами отдельным объектам. С этой целью оценки по всем объектам суммируются, а затем каждая из них делится на полученную сумму. Рассчитанные таким образом нормированные оценки могут быть вновь проранжированы.
Когда в экспертизе участвует несколько экспертов, обычно стремятся получить усредненную оценку (вес) для каждого объекта. Для этого нормированные оценки каждого объекта суммируются, а затем полученная сумма делится на число экспертов.
При наличии нескольких факторов, по которым следует оценить каждый из объектов, средняя оценка (вес) каждого объекта может быть рассчитана по формуле
, (2)
где wij – вес i-го объекта, подсчитанный по оценкам всех экспертов.
, (3)
где xij – оценка фактора i, данная экспертом j;
n – число факторов;
m – число экспертов.
Другой способ установления зависимости между оценками факторов (объектов, характеристик) состоит в том, что важнейшему (с точки зрения экспертов) фактору назначается оценка (вес), равная наперед заданному числу (обычно 1 или 10), а оценка следующих друг за другом по важности факторов определяется последовательно как доля более важного. Полученные таким образом значения нормируются. Основное достоинство такого способа заключается в том, что он облегчает процесс выбора оценок, поскольку эксперту не нужно каждый раз сопоставлять весь их ряд, а лишь учитывать значение первой и предыдущей по важности оценок. Оценки, полученные от группы экспертов, могут быть усреднены для каждого фактора путем расчета средней арифметической.
В случаях, когда группа, состоящая из нескольких экспертов, оценивает ряд факторов, причем у каждого из экспертов имеется своя шкала предпочтений, для нахождения усредненной оценки каждого фактора может быть рекомендована следующая методика:
1) составляется матрица «эксперты — факторы», в которой проставляются полученные от каждого эксперта оценки факторов по шкале от 0 до 10.
2) рассчитывается относительная значимость (Wij) всех факторов в отдельности для каждого эксперта. С этой целью оценки, полученные от каждого эксперта, суммируются (по горизонтали), а затем нормируются.
3) вычисляется усредненная оценка, данная всеми экспертами каждому фактору. Для этого нормированные оценки, полученные в предыдущем шаге, суммируются (по вертикали), а затем рассчитывается средняя арифметическая для каждого фактора.
В случае большого числа факторов могут возникнуть трудности при оценке экспертами большого числа факторов. В этом случае рекомендуется применять двухэтапный метод ранжирования.
На первом этапе осуществляется ранжирование предварительно сформированных групп факторов.
На втором этапе факторы ранжируются внутри отдельных групп.
Задачей следующего этапа является получение на основе синтеза группового и внутригруппового ранжирования единой системы расположения всех факторов. Для решения этой задачи могут быть применены несколько способов.
1. Простое ранжирование. Оно заключается в том, что все факторы располагаются в последовательности, соответствующей значимости отдельных групп и значимости факторов внутри групп.
Преимуществом этого способа является простота и лёгкость получения единой классификации факторов. Но установленная подобным образом общая ранжировка очень огрубленная. При таком способе ранжировки совершенно игнорируется возможность ситуации, когда факторы, стоящие на первых местах в следующей по значению группе, могут быть более важны, нежели стоящие на последних местах в предыдущей группе.
2. Ранжирование по сумме оценок. В основе ранжирования по этому способу лежит величина, получаемая при сложении оценок места группы и места фактора внутри группы. В качестве оценки в обоих случаях использовалось значение средневзвешенного места. Ранжирование по сумме оценок более объективно, поскольку учитывает степень различия в оценках мест групп и факторов внутри групп. Однако при этом способе возможно и механическое суммирование в связи с тем, что оценки мест групп и факторов могут быть даны в разных шкалах. Получается, что каждый раз с величиной, измеренной в одном масштабе, складываются величины, выраженные в других масштабах. Этот дефект можно устранить, если проводить ранжирование по третьему способу.
3. Ранжирование по сравнимой шкале. Чтобы выразить ценность места внутри группы в той же системе измерения, которая принята для групп, используется следующий прием. Оценки факторов внутри каждой группы суммируются, и на эту сумму делится оценка группы. Полученная при этом величина представляет вес единицы внутригрупповой шкалы, выраженный в единицах другой шкалы. Умножая на этот коэффициент место каждого фактора, получаем скорректированные средневзвешенные значения, по которым производится ранжирование.
Недостатком третьего способа является то, что величина корректировочного коэффициента в сильной мере зависит от числа факторов, вошедших в группy. Для его устранения было предложено комбинирование второго и третьего способов (способ 4).
4. Ранжирование комбинированным способом. За оценку места фактора принималась сумма: оценка группы плюс, скорректированная оценка фактора в группе.
Дальнейшее ранжирование состоит в упорядочении их расположения по величине полученной оценки.
Метод непосредственной оценки может быть использован в самых различных ситуациях, характеризующихся отсутствием полной информации, например для оценки трудоемкости научно-исследовательских работ, когда нет сходных отчетно-статистических данных. В таких случаях оценка трудоемкости может производиться специалистами лишь примерно, на основе имеющейся у них информации. Эта информация имеет некоторую долю неопределенности, величина которой зависит от опыта и знаний специалистов-экспертов.
3.4. Метод последовательных сравнений
Общим дефектом показателей, получаемых на основе суммирования оценок, является то, что недостаток качества по одному из факторов можно компенсировать за счёт другого, получая один и тот же результат при разной значимости факторов. Поэтому для повышения надёжности подобных оценок весьма важное значение имеет выявление связей и установление зависимостей (по возможности количественных) между всеми значимыми факторами.
Как было показано ранее, аддитивность оценок присуща шкале отношений и при некоторых условиях — шкале интервалов. Поэтому суммирование баллов, расчет результирующих рангов и оценок должны быть основаны не только на их упорядочении, но и еще на некоторых логических допущениях о зависимостях, используя которые можно обоснованно приписывать качественно различным факторам веса в одинаковых единицах по общей шкале измерения.
Основные из этих допущений заключаются в следующем:
1) каждому результату (событию, фактору) соответствует действительное неотрицательное число vj, рассматриваемое как оценка истинной значимости (ценности)Qj;
2) если результат Qj, более важен, чем Qk, то vj>vk,.И если Qj равноценен Qk, то vj=vk;
3) если оценки vj и vk соответствуют результатам Qj и Qk, то оценка vj + vk соответствует общему результату Qj и Qk.
Последнее допущение и является допущением об адаптивности оценок. Это допущение выполняется, когда результаты дискретны, непротиворечивы и взаимно независимы.
Следствиями допущения об аддитивности являются:
1) если результат Qj, предпочтительнее Qk, a Qk предпочтительнее Qi;, то совместный результат Qj, и Qk предпочтительнее Qi;
2) значимость общего результата Qj, и Qk эквивалентна значимости общего результата, Qk и Qj;
3) если общий результат Qj, и Qk эквивалентен Qk, то vj=0. Отсюда, если существует результат Qj, удовлетворяющий данному условию, то существует и нулевая точка определенной шкалы, инвариантная к любым преобразованиям шкалы оценок v.
Процедура последовательных сравнений состоит в следующем. Эксперту предоставляется перечень факторов, которые необходимо оценить по их относительной важности и ранжировать. Наиболее важному фактору придается оценка v1=l, а остальным факторам - оценки у, между 0 и 1 в порядке их относительной важности.
Затем эксперт устанавливает, является ли фактор с оценкой 1 более важным, чем комбинация остальных факторов. Если это так, то он увеличивает оценку v1, чтобы она была больше, чем сумма всех остальных.
Если нет, то он корректирует оценку v1 (если необходимо) так, чтобы она была меньше суммы всех остальных.
Далее определяется, является ли второй наиболее важный фактор с оценкой v2 более важным, чем все остальные факторы, получившие более низкие оценки; и повторяется та же процедура, что и для v1. Процедура последовательных сравнений продолжается вплоть до (п - 1)-го фактора.
Таким образом, используемая здесь процедура состоит в систематической проверке оценок на базе их последовательного сравнения.
сформулируем общую процедуру метода оценки весов на основе последовательных сравнений так:
1) Упорядочить результаты в соответствии с их важностью с точки зрения эксперта.
2) Приписать вес 1,00 результату Q1 (т. е. v1=l,00) и другие веса — всем остальным результатам.
3) Сравнить Q1 с Q2+ Q3+;...+ Qm:
а) если Q1, предпочтительнее Q2+ Q3+;...+ Qm, изменить (в случае необходимости) - значение v1 так, чтобы выполнялось неравенство v1>v2+v3+ ... +vm. При этой корректировке, так же как и при всех остальных, следует стремиться к тому, чтобы веса набора (v2, vз и т. д.) остались без изменений. Далее следует перейти к шагу 4;
б) если Q1 и Q2+ Q3+;...+ Qm равноценны, то изменить (в случае необходимости) значение v1, так, чтобы выполнялось равенство v1= v2+v3+ ... +vm, и затем перейти к шагу 4;
в) если результат Q1 менее предпочтителен, чем Q2+ Q3+;...+ Qm, то изменить (в случае необходимости) значение v1 так, чтобы выполнялось неравенство v1< v2+v3+ ... +vm. Далее сравнить Q1 с Q2+ Q3+;...+ Qm-1 и повторить описанную процедуру до тех пор, пока Q1 будет или предпочтительнее, или равноценен всем остальным результатам.
4) Сравнить Q2 с Q3+ Q4+;...+ Qm и выполнить весь шаг 3.
5) Продолжить шаг 4 до тех пор, пока не будет выполнено сравнение Qm-2 c Qm-1-+ Qm.
6) Преобразовать каждое полученное значение vj в нормированное v'j.
Описанный метод становится громоздким, когда число результатов равно или более семи. В этом случае может быть использована следующая процедура:
1) Упорядочить все множество, учитывая предпочтения эксперта (экспертов) и не ставя им в соответствие числовых значений.
2) Выбрать случайным образом любой результат из множества, допустим Qq.
3) Разбить случайным образом оставшиеся результаты на подмножества так, чтобы каждое из них содержало не более 6 результатов.
4) Включить в каждое из подмножеств результат, выбранный в шаге 1.
5) Применить процедуру, описанную выше, к каждому подмножеству результатов в отдельности, приписав предварительно некоторое число v, результату Qq (например, 1, 10 или 100). При этом, корректируя значения оценок остальных результатов vj, значение vs оставляем без изменений.
6) Сравнить оценки vj, с предпочтениями, полученными в шаге 1. Если в итоге получены непротиворечивые результаты, следует пронормировать оценки. Об обнаруженных противоречиях надо сообщить эксперту, который (в случае необходимости) меняет значения оценок.
Основой описанного подхода является введение в каждое подмножество результатов некоторой стандартной меры или базиса сравнения. Надежность полученных оценок можно проверить, образуя новые подмножества и используя другие базисные оценки.
Таким образом, применение метода последовательных сравнений основано на предположении о том, что если задан некоторый интервал действительного переменного, скажем от 0 до 1, то эксперт, основываясь на имеющейся у него информации, может установить предварительные оценки для каждого события, а затем уточнить их на основе сравнения с помощью определенной логической процедуры.
Поскольку множества, содержащие 7 и более элементов (результатов), трудно упорядочить с помощью метода последовательных сравнений (процедура становится громоздкой), целесообразно разбивать такие множества на несколько подмножеств, каждое из которых включает, в себя не более 6 результатов.
Квантификация (сведение качественных характеристик к количественным) предпочтений в сложных и комплексных проблемах с помощью метода последовательных сравнений при наличии большого числа факторов становится затруднительной. В таких случаях следует попытаться разделить проблему на ряд более простых «подпроблем» и задач, для которых сравнительно просто выявить предпочтения, либо, если это оказывается невозможным, использовать метод парных сравнений.
3.5. Метод парных сравнений
Трудности использования ранжирования, непосредственной оценки и метода последовательных сравнений при выявлении предпочтений для большого числа факторов можно в определенной степени уменьшить, если предложить экспертам произвести сравнение этих факторов попарно, с тем чтобы установить в каждой паре наиболее важный.
В методе парных сравнений объекты сопоставляются попарно экспертом (экспертами), а затем выбирается один из них. Будем говорить, что в этом случае эксперт предпочитает данный объект, хотя выбор не обязательно будет выражать его предпочтение. В общем случае эксперт может установить равенство объектов или зафиксировать свои предпочтения на некоторой шкале.
Основной элементарный акт — сравнение двух объектов А и В одним экспертом — можно распространить на случай, когда несколько экспертов рассматривают более чем два объекта. Производить парное сравнение удобно не только тогда, когда число объектов велико, но и в тех случаях, когда различия между объектами настолько малы, что непосредственное ранжирование или оценка не обеспечивают их разумного упорядочения. Таким образом, метод парных сравнений имеет некоторое преимущество перед другими методами упорядочения в случаях, когда объектов много и (или) они трудно различимы.
Чаще всего при парном сравнении двух объектов ограничиваются простой констатацией того, что один из них предпочтительнее другого. В отдельных случаях, когда степень предпочтения можно выявить, используются специальные шкалы, где каждой степени предпочтения присваивается определенная оценка. Однако простейшая форма парных сравнений, когда устанавливается, что объект А «лучше» в некотором отношении объектa В, наиболее удобна, поскольку она уменьшает область возможной несогласованности между экспертами до минимума. Практика показывает, что даже допущение о возможности равенства объектов создает трудности при сборе и обработке информации, полученной от экспертов. Установлено, например, что одни эксперты объявляют объекты равными более охотно, чем другие.
Рассмотрим случай, когда сравниваются попарно три объекта А, В и С. Пусть суждение каждого эксперта состоит из простого предпочтения того или иного объекта, причем .«ничьи» не допускаются. Тогда для каждого из трех сравнений (А с В), (А с С), (В с С) возможны два исхода. Общее число исходов — 8, причем 6 из них типа: A ->B, A -> C, B->C (стрелка означает «предпочтительнее, чем»). Результаты сравнения в таком случае удобно представить в виде тройки чисел [2, 1, 0], которые указывают, что один объект (не обязательно A) «выигрывает» два раза, другой - один раз, а третий — ни разу. Два оставшихся результата
A ->В, В->С, С->А,
А<-В, В<-С, С<-А
могут быть представлены как [1, 1, 1] или же как [13] и названы циклическими триадами. Ясно, что циклическая триада означает непоследовательность в суждениях части экспертов, причем вероятность возникновения циклической триады равна 1/4, когда объекты идентичны.
Причины возникновения циклических триад могут состоять в недостаточной компетентности эксперта или же в том, что объекты нельзя сравнивать по одной линейной шкале, поскольку имеется несколько признаков, по которым они различаются.
Важным свойством парных сравнений является возможность выявления таких противоречий, а, следовательно, установления некоторых критериев предпочтения.
4. Проверка согласованности экспертных оценок
Групповая оценка может считаться достаточно надежной только при условии хорошей согласованности ответов опрашиваемых специалистов. Поэтому статистическая обработка информации, полученной от экспертов, должна включать в себя оценку степени согласованности мнений экспертов и выявление причин их неоднородности.
Оценки, полученные от экспертов, могут рассматриваться как случайная переменная, распределение которой отражает суждения специалистов о вероятности того или иного исхода события (признака). Поэтому для анализа разброса и согласованности оценок, полученных от экспертов, применяются обобщенные статистические характеристики — средние и меры разброса.
Существуют два основных метода измерения разброса: рассматриваются либо расстояния между двумя упорядоченными исходами событий, либо средние расстояния результатов отдельных наблюдений от некоторого центрального значения. Показатели первого типа называют вариационным размахом, а второго — средними отклонениями.
Для оценки вариационного размаха (амплитуды колебаний) R чаще всего используется следующая пара величин — (Xmin, Хтах). По существу, именно эти величины (или расстояние между ними) имеют в виду, когда говорят о размахе вариации. Чтобы, определить любой другой тип вариационного размаха, необходимо добавить ещё какие-то определения. К примеру, вариационный размах между квартилями равен разности между третьтьим и первым квартилями Q3—Q1. В этом случае для сравнительного изучения вариаций может быть вычислен коэффициент интерквартильной вариации:
, (4)
где q – коэффициент интерквартильной вариации;
Q3 – граница третьего квартиля;
Q1 – граница первого квартиля;
Ме – медиана.
Или приблизительно
, (5)
Коэффициент интерквартильной вариации колеблется между —1 и +1 и приближается к нулю в случае симметричного распределения с очень малой вариацией.
Хорошими характеристиками разброса оценок являются средние отклонения. Среднее абсолютное отклонение представляет среднюю арифметическую абсолютных величин разностей между каждой оценкой и выборочной средней. В практике статистической обработки оценок, полученных от экспертов, чаще используют не среднее абсолютное отклонение, а среднее квадратическое (стандартное) отклонение и дисперсию.
Среднее квадратическое отклонение есть корень квадратный из среднего квадрата отклонений отдельных значений признака от средней арифметической:
, (6)
где σ – среднее квадратическое отклонение;
х — варианты (оценки);
хср — средняя арифметическая;
m — число оценок.
Если число оценок не превышает 30, что характерно для большинства -экспертиз, то для расчета среднего квадратического отклонения применяется формула несмещённого среднего квадратического отклонения:
, (7)
Нередко за показатель разброса удобнее принимать не среднее квадратическое отклонение, а его квадрат (σ2). Эта величина называется дисперсией и обладает среди прочих тем свойством, что при увеличении (уменьшении) оценок в k раз, увеличивается (уменьшается) в k2раз.
При анализе согласованности оценок экспертов нередко используется коэффициент вариации V, характеризующий вариабельность, рассчитываемую в виде отношения среднего квадратического отклонения к средней арифметической. Обычно он выражается в процентах:
, (8)
Меры рассеяния являются важными характеристиками распределения оценок, полученных от экспертов. Однако при анализе согласованности оценок недостаточно знать величину вариабельности признака, необходимо также полнее выявить факторы, влияющие на эту изменчивость по каждому признаку. С этой целью применяются специальные характеристики и показатели.
Нередко при анализе согласованности ответов экспертов необходимо оценить связь между альтернативными признаками. Это делается с помощью коэффициентов ассоциации (связи) и коэффициентов контингенции (сопряженности) .
Связь считается более тесной в том случае, когда каждому значению одного признака соответствуют близкие друг другу, тесно расположенные около своей средней величины значения другого признака; связь менее тесная, если эти значения сильно отклоняются от своей средней, т. е. сильно варьируют. Тип, форма и плотность связи обычно выявляются с помощью таких статистических характеристик, как коэффициент корреляций, корреляционное отношение, коэффициент регрессии и некоторых других.
Большинство статистических методов измерения связей основано либо на принципе взаимной сопряженности, либо на принципе ковариации. О взаимной сопряженности признаков говорят в случаях, когда интересуются связью какого-либо выделенного признака с другими признаками при осуществлении, определенного события, причем градация значений признаков по интенсивности для исследователя безразлична. При обнаружении такой связи предполагается, что существует зависимость между данными признаками.
Основанием для заключения о наличии связи между количественными признаками служит параллельное и одновременное изменение их численных значений. Подобный вывод о наличии связи между признаками основан на принципе ковариации. В математическом отношении задача сводится к вычислению величины ковариации, т. е. сопутствующего изменения численных значений признаков, и последующему нормированию ее с помощью различных приемов.
При оценке связи между признаками используется много самых различных корреляционных показателей, разнообразие которых объясняется стремлением отразить реально существующее разнообразие типов связей в природе и обществе. Поскольку и степень точности расчетов, и вид зависимости между переменными, в конечном счете, выявляются на основе качественного анализа, выбор показателя связи определяется задачами исследования. В некоторых ситуациях в одинаковой степени пригодными для исследования могут оказаться несколько коэффициентов. Решающее значение в этом случае приобретают цели анализа, природа данных (качественные или количественные признаки), требуемая точность расчетов, удобство при вычислении, сравнительная простота интерпретации, а также личный опыт исследователя.
В общем случае статистический анализ согласованности оценок экспертов и получение групповой оценки включает:
1) группировку, агрегирование признаков;
2) оценку степени согласованности ответов экспертов каждому признаку в отдельности и в целом по всему набору;
3) выделение групп экспертов с «близким» мнением относительно порядка признаков в случае наличия существенных расхождений в ответах;
4) выявление причин разброса мнений, определение влияния компетентности и других качеств экспертов на содержание ответов;
5) оценку качества экспертных оценок и компетентности экспертов;
6) формирование группового решения.
Рассмотрим подробнее каждый из этапов анализа.
Необходимость в группировке и агрегировании признаков обусловлена рядом обстоятельств. Во-первых, опыт показывает, что отдельные признаки могут быть по-разному истолкованы. Вместе с тем группы признаков, в некотором смысле объективно близкие, истолковываются экспертами более определенно. Следовательно, объединяя признаки в группы, можно «извлечь» их однозначный смысл и получить более точную и согласованную оценку. Во-вторых, сама оценка значимости (степени влияния) группового фактора более точна и достоверна, чем оценка отдельных признаков. Это объясняется тем, что в групповых оценках устраняются случайные ошибки измерения отдельных признаков при естественном предположении, что ошибка оценки одного признака не коррелирует с ошибкой оценки другого. И, наконец, в процессе ранжирования часто возникают ситуации, когда два или несколько признаков имеют близкие оценки, и эксперты не различают их по информативности. В этом случае группировка позволяет определить рациональную степень агрегирования признаков.
Основой решения задачи группировки признаков является матрица их взаимосвязи, формализующая понятие близости между признаками, В качестве мер взаимосвязи в зависимости от характера идеализации балльных оценок могут выступать коэффициенты корреляции (сильное предположение о метрической шкале), коэффициенты взаимной сопряженности (упрощающее предположение о качественном характере оценок), коэффициенты ранговой корреляции (предположение о порядковой шкале), коэффициенты близости двух разбиений и др. При проведении исследования полезно использовать разные (две-три) меры связи и оценить степень устойчивости полученных группировок.
Для оценки согласованности ответов по каждому Признаку данные опроса удобно представить в виде таблицы вариационных рядов ответов (таблица 2).
Таблица 2
Таблица вариационных рядов ответа
Признак | Число мнений о ранге признака | Общее число ответов | |||||
… | i | … | k | ||||
x1 | f11 | f21 | … | fi1 | … | fk1 | |
x2 | f12 | f22 | … | fi2 | … | fk2 | |
… | … | … | … | … | … | … | |
xj | f1j | f2j | … | fij | … | fkj | |
… | … | … | … | … | … | … | |
xn | f1n | f2n | … | fin | … | fkn |
Здесь fij — число ответов о присвоении i-ro места j-му признаку. Если все эксперты дали ответы по всем признакам, то итоги строк будут равными.
На основе приведенной таблицы могут быть рассчитаны меры согласованности ответов экспертов по каждому признаку xj. Оценка степени согласованности ответов - задача, обратная оценке уровня вариации. Если обозначить некоторый показатель вариации j-го признака через μi , то мера согласованности по этому признаку будет 1- μi . Для расчета величины μi могут быть применены общеизвестные статистические приемы оценки вариации в рядах распределения:
а) измерение области, содержащей основную часть ответов;
б) измерение отклонений переменных от центрального значения (средней, медианы);
в) измерение степени однородности качественных переменных.
Исходя из природы балльных оценок наиболее приемлемы первый и третий приемы.
При первом из них, наиболее простом и приближенном, в качестве меры согласованности ответов может быть, например, использован коэффициент, равный отношению числа ответов, совпадающих с медианой и двумя соседними с ней местами, к общему числу ответов.
Третий прием расчета меры согласованности основан на вычислении коэффициентов вариации качественных переменных. Для этого фактическое число различимых (по определенному значению признака) пар событий сравнивается с максимально возможным числом пар. Подобная мера вариации качественных признаков представляет аналог дисперсии.
На основе таблицы 2 величина коэффициента вариации для j-го признака вычисляется по формуле:
, (9)
где mj - коэффициент вариации для j-го признака;
k — число градаций (число мест) j-го признака;
fij — число ответов о присвоении i-ro места j-му признаку.
Величина μi, меняется в пределах 0≤ μi ≤1.
Коэффициент μi приспособлен к анализу вариации качественных признаков. При расчете его величины не учитывается информация о последовательности мест; расхождение в ответах на одно место имеет такой же вес, как и расхождение в несколько мест. С целью устранения этого недостатка для ранговых признаков, А. В. Беккером предложена другая мера вариации ответов:
, (10)
Преимуществом коэффициента вариации этого вида является учет расстояния между отдельными ответами, недостатком - оперирование разностями рангов.
Расчет подобного рода коэффициентов весьма полезен на последующих стадиях анализа - при формировании признаковых пространств и выделении однородных групп экспертов. При разбиении экспертов в первую очередь следует учитывать признаки с большой вариацией ответов по ним.
Для оценки меры сходства мнений каждой пары экспертов могут быть использованы различные методы.
Наиболее грубый подход основан на расчете так называемых коэффициентов ассоциации, с помощью которых учитывается лишь число совпадающих или несовпадающих ответов и не учитывается их последовательность. В статистической литературе описано большое число видов таких коэффициентов. Приведем один из них — информационную меру близости ответов двух экспертов:
, (11)
где Sij - информационная мера близости двух ответов;
тij — количество признаков, одинаково оцененных i-м. и j-м специалистами;
ti — количество признаков, оцененных i-м специалистом;
tj — количество признаков, оцененных /-м специалистом.
Величина Sij меняется в пределах от 1 до 0, причем Sij =1 указывает на полное совпадение мнений опрашиваемых, a Sij=0 — на полное различие мнений.
Покажем некоторые из статистических способов анализа согласованности оценок, полученных от группы экспертов, на примере прогнозирования технических характеристик си
Дата добавления: 2021-11-16; просмотров: 480;