Определитель матрицы ▦ Производная функции dydx График 3D Упростить выражение Графический метод решения задач нелинейного программирования ⇲
Примеры решений Коэффициент Спирмена Коэффициент Кендалла Коэффициент конкордации Коэффициент контингенции Группировка данных ▩ Показатели вариации Доверительный интервал ⟷ Различие средних

Коэффициент ранговой корреляции Спирмена

Назначение сервиса. С помощью данного онлайн-калькулятора производится:
Количество строк (исходных данных)
Здесь будет отображаться решение.
Инструкция. Укажите количество данных (количество строк), нажмите Далее. Полученное решение сохраняется в файле Word (см пример нахождения коэффициента ранговой корреляции Спирмена). Также создается шаблон решения в Excel.

Коэффициент ранговой корреляции Спирмена - это количественная оценка статистического изучения связи между явлениями, используемая в непараметрических методах.

коэффициент ранговой корреляции Спирмена: формула
Показатель показывает, как отличается полученная при наблюдении сумма квадратов разностей между рангами от случая отсутствия связи.

Коэффициент ранговой корреляции Спирмена относится к показателям оценки тесноты связи. Качественную характеристику тесноты связи коэффициента ранговой корреляции, как и других коэффициентов корреляции, можно оценить по шкале Чеддока.

Расчет коэффициента состоит из следующих этапов:

  1. Ранжирование признаков по возрастанию. Ранг – это порядковый номер. Если встречаются два одинаковых значения, им присваивают одинаковое значение ранга, равное среднему арифметическому рангов этих значений.
  2. Определение разности рангов каждой пары сопоставляемых значений, d = dx - dy.
  3. Возведение в квадрат разность di и нахождение общей суммы, ∑d2.
  4. Вычисление коэффициента корреляции рангов по формуле:
    коэффициент ранговой корреляции Спирмена: формула
    где d2 – квадратов разностей между рангами; N – количество признаков, участвовавших в ранжировании.

Свойства коэффициента ранговой корреляции Спирмена

  1. Нормируемость. Коэффициент корреляции рангов может принимать значения от -1 до +1. p = 1 свидетельствует о возможном наличии прямой связи, p =-1 свидетельствует о возможном наличии обратной связи.
  2. Ограниченность. Для оценки данных необходима выборка от 5 до 40 наблюдений по каждой переменной. При большом количестве одинаковых рангов по сопоставляемым переменным коэффициент дает приближенные значения. При совпадении значений вносится поправка на одинаковые ранги. В этом случае формула имеет вид:
    коэффициент ранговой корреляции с поправкой на связанные ранги
    Для более точного расчета применяют формулу:
    коэффициент ранговой корреляции с поправкой на связанные ранги
    где d2 – квадратов разностей между рангами; tx, ty – поправки на одинаковые ранги; n – количество признаков, участвовавших в ранжировании.
    ,
    где a - количество повторяющихся элементов в X, b - количество повторяющихся элементов в Y.
    Если связанных рангов очень много (более 25% всех данных), на практике рекомендуют использовать коэффициент Кендалла, так как он лучше справляется с «узлами» в данных.
  3. Независимость. Чтобы получить адекватный результат, необязательно наличие нормального закона распределения коррелируемых рядов.

Область применения. Коэффициент корреляции рангов используется для оценки качества связи между двумя совокупностями. Кроме этого, его статистическая значимость применяется при анализе данных на гетероскедастичность.

Пример №1. По выборке данных наблюдаемых переменных X и Y:

  1. составить ранговую таблицу;
  2. найти коэффициент ранговой корреляции Спирмена и проверить его значимость на уровне 2a
  3. оценить характер зависимости
Решение. Присвоим ранги признаку Y и фактору X.
X Y ранг X, dx ранг Y, dy
28 21 1 1
30 25 2 2
36 29 4 3
40 31 5 4
30 32 3 5
46 34 6 6
56 35 8 7
54 38 7 8
60 39 10 9
56 41 9 10
60 42 11 11
68 44 12 12
70 46 13 13
76 50 14 14

Матрица рангов.
ранг X, dx ранг Y, dy (dx - dy)2
1 1 0
2 2 0
4 3 1
5 4 1
3 5 4
6 6 0
8 7 1
7 8 1
10 9 1
9 10 1
11 11 0
12 12 0
13 13 0
14 14 0
105 105 10

Проверка правильности составления матрицы на основе исчисления контрольной суммы:

Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно.
По формуле вычислим коэффициент ранговой корреляции Спирмена.


Связь между признаком Y и фактором X сильная и прямая
Значимость коэффициента ранговой корреляции Спирмена
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Спирмена при конкурирующей гипотезе Hi. p ≠ 0, надо вычислить критическую точку:

где n - объем выборки; ρ - выборочный коэффициент ранговой корреляции Спирмена: t(α, к) - критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента, по уровню значимости α и числу степеней свободы k = n-2.
Если |p| < Тkp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| > Tkp - нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь.
По таблице Стьюдента находим t(α/2, k) = (0.1/2;12) = 1.782

Поскольку Tkp < ρ, то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

Пример нахождения коэффициента ранговой корреляции Спирмена

На практике для определения тесноты связи двух признаков часто применяется коэффициент ранговой корреляции Спирмена (Р). Значения каждого признака ранжируются по степени возрастания (от 1 до n), затем определяется разница (d) между рангами, соответствующими одному наблюдению.

Пример №2. Зависимость между объемом промышленной продукции и инвестициями в основной капитал по 10 областям одного из федеральных округов РФ в 2003 году характеризуется следующими данными.
Вычислите ранговые коэффициенты корреляции Спирмена и Кендэла. Проверить их значимость при α=0,05. Сформулируйте вывод о зависимости между объемом промышленной продукции и инвестициями в основной капитал по рассматриваемым областям РФ.

Присвоим ранги признаку Y и фактору X. Найдем сумму разности квадратов d2.
Используя калькулятор, вычислим коэффициент ранговой корреляции Спирмена: коэффициент ранговой корреляции Спирмена

X Y ранг X, dx ранг Y, dy (dx - dy)2
1.3 300 1 2 1
1.8 1335 2 12 100
2.4 250 3 1 4
3.4 946 4 8 16
4.8 670 5 7 4
5.1 400 6 4 4
6.3 380 7 3 16
7.5 450 8 5 9
7.8 500 9 6 9
17.5 1582 10 16 36
18.3 1216 11 9 4
22.5 1435 12 14 4
24.9 1445 13 15 4
25.8 1820 14 19 25
28.5 1246 15 10 25
33.4 1435 16 14 4
42.4 1800 17 18 1
45 1360 18 13 25
50.4 1256 19 11 64
54.8 1700 20 17 9
        364

Связь между признаком Y фактором X  сильная и прямая.

Оценка коэффициента ранговой корреляции Спирмена

Значимость коэффициента ранговой корреляции Спирмена
Значимость коэффициента ранговой корреляции Спирмена
По таблице Стьюдента находим Tтабл.
Tтабл = (18;0.05) = 1.734
Поскольку Tнабл > Tтабл , то отклоняем гипотезу о равенстве нулю коэффициента ранговой корреляции. Другими словами, коэффициента ранговой корреляции Спирмена статистически - значим.

Интервальная оценка для коэффициента ранговой корреляции (доверительный интервал)


Доверительный интервал для коэффициента ранговой корреляции Спирмена: p(0.5431;0.9095).

Пример №2. Исходные данные.

54
34
13
31
66
22
Так как в матрице имеются связанные ранги (одинаковый ранговый номер) 1-го ряда, произведем их переформирование. Переформирование рангов производиться без изменения важности ранга, то есть между ранговыми номерами должны сохраниться соответствующие соотношения (больше, меньше или равно). Также не рекомендуется ставить ранг выше 1 и ниже значения равного количеству параметров (в данном случае n = 6). Переформирование рангов производится в табл.
Номера мест в упорядоченном рядуРасположение факторов по оценке экспертаНовые ранги
111
222
333.5
433.5
555
666
Так как в матрице имеются связанные ранги 2-го ряда, произведем их переформирование. Переформирование рангов производится в табл.
Номера мест в упорядоченном рядуРасположение факторов по оценке экспертаНовые ранги
111
222
333
444.5
544.5
666
Матрица рангов.
ранг X, dxранг Y, dy(dx - dy)2
54.50.25
3.54.51
134
3.516.25
660
220
212111.5
Поскольку среди значений признаков х и у встречается несколько одинаковых, т.е. образуются связанные ранги, то в таком случае коэффициент Спирмена вычисляется как:
коэффициент Спирмена при связанных рангах
где


j - номера связок по порядку для признака х;
Аj - число одинаковых рангов в j-й связке по х;
k - номера связок по порядку для признака у;
Вk - число одинаковых рангов в k-й связке по у.
A = [(23-2)]/12 = 0.5
B = [(23-2)]/12 = 0.5
D = A + B = 0.5 + 0.5 = 1

Связь между признаком Y и фактором X умеренная и прямая.

Задание №1. Определите тесноту связи с помощью коэффициента корреляции рангов Спирмена между X и Y.
Скачать решение

Задание №2. С помощью коэффициента ранговой корреляции Спирмена определите, между мнениями каких политических деятелей по вопросу приоритетов мероприятий региональной политики в России наблюдается наибольшее совпадение.
Пример №2