Критерий Манна-Уитни

Критерий Манна-Уитни
где Tx - наибольшая сумма рангов, nx - наибольшая из объемов выборок n1 и n2.

Назначение сервиса. С помощью данного онлайн-калькулятора производится расчет U критерия Манна-Уитни.

Инструкция. Укажите количество данных (количество строк). Полученное решение сохраняется в файле Word (см. пример).
Количество строк (исходных данных)

Назначение критерия

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n1, n2 ≥ 3 или n1=2, n2 ≥ 5. В каждой выборке должно быть не более 60 наблюдений.
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Положим, что первым рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а вторым рядом - тот, где они предположительно ниже.
Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок.
Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше Uэмп, тем более вероятно, что различия достоверны.

Гипотезы
H0: Уровень признака в группе 2 не ниже уровня признака в группе 1.
H1: Уровень признака в группе 2 ниже уровня признака в группе 1.

Алгоритм расчета критерия Манна-Уитни

  1. Объединить все данные в единый ряд, пометив данные, принадлежащие разным выборкам.
  2. Проранжировать значения, приписывая меньшему значению меньший ранг. Всего рангов получится (n1 + n2).
  3. Подсчитать сумму рангов отдельно для каждой выборки.
  4. Определить большую из двух ранговых сумм.
  5. Определить значение U по формуле:
    U = n1·n2 + nx·(nx + 1)/2 – Tx,
    где n1 – объем выборки №1; n2 – объем выборки №2; Tx – большая из двух ранговых сумм; nx – объем максимальной выборки: nx= max(n1, n2).
  6. Определить критические значения Uкр по таблице. Если Uэмп > Uкр(0,05). H0 принимается. Если Uэмп ≤ Uкр(0,05) H0 отвергается. Чем меньше значения U, тем достоверность различий выше.

Пример. У предполагаемых участников психологического эксперимента был измерен уровень вербального и невербального интеллекта с помощью методики Д. Векслера. Было обследовано две группы юношей в возрасте от 18 до 24 лет студентов физического факультета и психологического факультета. Показатели вербального интеллекта представлены в таблице. Можно ли утверждать, что одна из групп превосходит другую по уровню вербального интеллекта?

ФП
135130
130129
131121
128129
127119
137124
126125
137129
131129
137130
137131
127123
133 
125 

Сравнение результатов показывает, что значения выборки X несколько выше, чем выборки Y, поэтому первой считаем выборку X.
Таким образом, нам требуется определить, можно ли считать имеющуюся разницу между баллами существенной.
Решение.
Проранжируем представленную таблицу. При ранжировании объединяем две выборки в одну. Ранги присваиваются в порядке возрастания значения измеряемой величины, т.е. наименьшему рангу соответствует наименьший балл. Заметим, что в случае совпадения баллов для нескольких учеников ранг такого балла следует считать, как среднее арифметическое тех позиций, которые занимают данные баллы при их расположении в порядке возрастания.
Так как в матрице имеются связанные ранги (одинаковый ранговый номер) 1-го ряда, произведем их переформирование. Переформирование рангов производиться без изменения важности ранга, то есть между ранговыми номерами должны сохраниться соответствующие соотношения (больше, меньше или равно). Также не рекомендуется ставить ранг выше 1 и ниже значения равного количеству параметров (в данном случае n = 26). Переформирование рангов производится в табл.
Номера мест в упорядоченном ряду Расположение факторов по оценке эксперта Новые ранги
1 119 1
2 121 2
3 123 3
4 124 4
5 125 5.5
6 125 5.5
7 126 7
8 127 8.5
9 127 8.5
10 128 10
11 129 12.5
12 129 12.5
13 129 12.5
14 129 12.5
15 130 16
16 130 16
17 130 16
18 131 19
19 131 19
20 131 19
21 133 21
22 135 22
23 137 24.5
24 137 24.5
25 137 24.5
26 137 24.5

Используя предложенный принцип ранжирования, получим таблицу рангов.
X Ранг X Y Ранг Y
125 5.5 119 1
126 7 121 2
127 8.5 123 3
127 8.5 124 4
128 10 125 5.5
130 16 129 12.5
131 19 129 12.5
131 19 129 12.5
133 21 129 12.5
135 22 130 16
137 24.5 130 16
137 24.5 131 19
137 24.5
137 24.5
Сумма 234.5 Сумма 116.5

Этих данных достаточно, чтобы воспользоваться формулой расчёта эмпирического значения критерия:

Гипотеза H0 о незначительности различий между выборками принимается, если Uкр < uэмп. В противном случае H0 отвергается и различие определяется как существенное.
где Ukp - критическая точка, которую находят по таблице Манна-Уитни.
Найдем критическую точку Ukp
По таблице находим Ukp(0.05) = 45
Так как Ukp > uэмп — принимаем альтернативную гипотезу H1; различия в уровнях выборок можно считать существенными.
загрузка...