Коэффициент ранговой корреляции Спирмена
Назначение сервиса. С помощью данного онлайн-калькулятора производится:- расчет коэффициента ранговой корреляции Спирмена;
- вычисление доверительного интервала для коэффициента и оценка его значимости;
Коэффициент ранговой корреляции Спирмена - это количественная оценка статистического изучения связи между явлениями, используемая в непараметрических методах.
Коэффициент ранговой корреляции Спирмена относится к показателям оценки тесноты связи. Качественную характеристику тесноты связи коэффициента ранговой корреляции, как и других коэффициентов корреляции, можно оценить по шкале Чеддока.
Расчет коэффициента состоит из следующих этапов:
- Ранжирование признаков по возрастанию. Ранг – это порядковый номер. Если встречаются два одинаковых значения, им присваивают одинаковое значение ранга, равное среднему арифметическому рангов этих значений.
- Определение разности рангов каждой пары сопоставляемых значений, d = dx - dy.
- Возведение в квадрат разность di и нахождение общей суммы, ∑d2.
- Вычисление коэффициента корреляции рангов по формуле:
где d2 – квадратов разностей между рангами; N – количество признаков, участвовавших в ранжировании.

Свойства коэффициента ранговой корреляции Спирмена
- Нормируемость. Коэффициент корреляции рангов может принимать значения от -1 до +1.
p = 1свидетельствует о возможном наличии прямой связи,p =-1свидетельствует о возможном наличии обратной связи. - Ограниченность. Для оценки данных необходима выборка от 5 до 40 наблюдений по каждой переменной. При большом количестве одинаковых рангов по сопоставляемым переменным коэффициент дает приближенные значения. При совпадении значений вносится поправка на одинаковые ранги. В этом случае формула имеет вид:
Для более точного расчета применяют формулу:
где d2 – квадратов разностей между рангами; tx, ty – поправки на одинаковые ранги; n – количество признаков, участвовавших в ранжировании.
,
где a - количество повторяющихся элементов в X, b - количество повторяющихся элементов в Y.
Если связанных рангов очень много (более 25% всех данных), на практике рекомендуют использовать коэффициент Кендалла, так как он лучше справляется с «узлами» в данных. - Независимость. Чтобы получить адекватный результат, необязательно наличие нормального закона распределения коррелируемых рядов.
Область применения. Коэффициент корреляции рангов используется для оценки качества связи между двумя совокупностями. Кроме этого, его статистическая значимость применяется при анализе данных на гетероскедастичность.
Пример №1. По выборке данных наблюдаемых переменных X и Y:
- составить ранговую таблицу;
- найти коэффициент ранговой корреляции Спирмена и проверить его значимость на уровне 2a
- оценить характер зависимости
| X | Y | ранг X, dx | ранг Y, dy |
| 28 | 21 | 1 | 1 |
| 30 | 25 | 2 | 2 |
| 36 | 29 | 4 | 3 |
| 40 | 31 | 5 | 4 |
| 30 | 32 | 3 | 5 |
| 46 | 34 | 6 | 6 |
| 56 | 35 | 8 | 7 |
| 54 | 38 | 7 | 8 |
| 60 | 39 | 10 | 9 |
| 56 | 41 | 9 | 10 |
| 60 | 42 | 11 | 11 |
| 68 | 44 | 12 | 12 |
| 70 | 46 | 13 | 13 |
| 76 | 50 | 14 | 14 |
Матрица рангов.
| ранг X, dx | ранг Y, dy | (dx - dy)2 |
| 1 | 1 | 0 |
| 2 | 2 | 0 |
| 4 | 3 | 1 |
| 5 | 4 | 1 |
| 3 | 5 | 4 |
| 6 | 6 | 0 |
| 8 | 7 | 1 |
| 7 | 8 | 1 |
| 10 | 9 | 1 |
| 9 | 10 | 1 |
| 11 | 11 | 0 |
| 12 | 12 | 0 |
| 13 | 13 | 0 |
| 14 | 14 | 0 |
| 105 | 105 | 10 |
Проверка правильности составления матрицы на основе исчисления контрольной суммы:
Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно.
По формуле вычислим коэффициент ранговой корреляции Спирмена.
Связь между признаком Y и фактором X сильная и прямая
Значимость коэффициента ранговой корреляции Спирмена
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Спирмена при конкурирующей гипотезе Hi. p ≠ 0, надо вычислить критическую точку:
где n - объем выборки; ρ - выборочный коэффициент ранговой корреляции Спирмена: t(α, к) - критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента, по уровню значимости α и числу степеней свободы k = n-2.
Если |p| < Тkp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| > Tkp - нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь.
По таблице Стьюдента находим t(α/2, k) = (0.1/2;12) = 1.782
Поскольку Tkp < ρ, то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.
Пример нахождения коэффициента ранговой корреляции Спирмена
На практике для определения тесноты связи двух признаков часто применяется коэффициент ранговой корреляции Спирмена (Р). Значения каждого признака ранжируются по степени возрастания (от 1 до n), затем определяется разница (d) между рангами, соответствующими одному наблюдению.Пример №2. Зависимость между объемом промышленной продукции и инвестициями в основной капитал по 10 областям одного из федеральных округов РФ в 2003 году характеризуется следующими данными.
Вычислите ранговые коэффициенты корреляции Спирмена и Кендэла. Проверить их значимость при α=0,05. Сформулируйте вывод о зависимости между объемом промышленной продукции и инвестициями в основной капитал по рассматриваемым областям РФ.
Присвоим ранги признаку Y и фактору X. Найдем сумму разности квадратов d2.
Используя калькулятор, вычислим коэффициент ранговой корреляции Спирмена:
| X | Y | ранг X, dx | ранг Y, dy | (dx - dy)2 |
| 1.3 | 300 | 1 | 2 | 1 |
| 1.8 | 1335 | 2 | 12 | 100 |
| 2.4 | 250 | 3 | 1 | 4 |
| 3.4 | 946 | 4 | 8 | 16 |
| 4.8 | 670 | 5 | 7 | 4 |
| 5.1 | 400 | 6 | 4 | 4 |
| 6.3 | 380 | 7 | 3 | 16 |
| 7.5 | 450 | 8 | 5 | 9 |
| 7.8 | 500 | 9 | 6 | 9 |
| 17.5 | 1582 | 10 | 16 | 36 |
| 18.3 | 1216 | 11 | 9 | 4 |
| 22.5 | 1435 | 12 | 14 | 4 |
| 24.9 | 1445 | 13 | 15 | 4 |
| 25.8 | 1820 | 14 | 19 | 25 |
| 28.5 | 1246 | 15 | 10 | 25 |
| 33.4 | 1435 | 16 | 14 | 4 |
| 42.4 | 1800 | 17 | 18 | 1 |
| 45 | 1360 | 18 | 13 | 25 |
| 50.4 | 1256 | 19 | 11 | 64 |
| 54.8 | 1700 | 20 | 17 | 9 |
| 364 |
Связь между признаком Y фактором X сильная и прямая.
Оценка коэффициента ранговой корреляции Спирмена
Значимость коэффициента ранговой корреляции Спирмена
По таблице Стьюдента находим Tтабл.
Tтабл = (18;0.05) = 1.734
Поскольку Tнабл > Tтабл , то отклоняем гипотезу о равенстве нулю коэффициента ранговой корреляции. Другими словами, коэффициента ранговой корреляции Спирмена статистически - значим.
Интервальная оценка для коэффициента ранговой корреляции (доверительный интервал)

Доверительный интервал для коэффициента ранговой корреляции Спирмена: p(0.5431;0.9095).
Пример №2. Исходные данные.
| 5 | 4 |
| 3 | 4 |
| 1 | 3 |
| 3 | 1 |
| 6 | 6 |
| 2 | 2 |
| Номера мест в упорядоченном ряду | Расположение факторов по оценке эксперта | Новые ранги |
| 1 | 1 | 1 |
| 2 | 2 | 2 |
| 3 | 3 | 3.5 |
| 4 | 3 | 3.5 |
| 5 | 5 | 5 |
| 6 | 6 | 6 |
| Номера мест в упорядоченном ряду | Расположение факторов по оценке эксперта | Новые ранги |
| 1 | 1 | 1 |
| 2 | 2 | 2 |
| 3 | 3 | 3 |
| 4 | 4 | 4.5 |
| 5 | 4 | 4.5 |
| 6 | 6 | 6 |
| ранг X, dx | ранг Y, dy | (dx - dy)2 |
| 5 | 4.5 | 0.25 |
| 3.5 | 4.5 | 1 |
| 1 | 3 | 4 |
| 3.5 | 1 | 6.25 |
| 6 | 6 | 0 |
| 2 | 2 | 0 |
| 21 | 21 | 11.5 |

где


j - номера связок по порядку для признака х;
Аj - число одинаковых рангов в j-й связке по х;
k - номера связок по порядку для признака у;
Вk - число одинаковых рангов в k-й связке по у.
A = [(23-2)]/12 = 0.5
B = [(23-2)]/12 = 0.5
D = A + B = 0.5 + 0.5 = 1

Связь между признаком Y и фактором X умеренная и прямая.
Задание №1. Определите тесноту связи с помощью коэффициента корреляции рангов Спирмена между X и Y.
Скачать решение
Задание №2. С помощью коэффициента ранговой корреляции Спирмена определите, между мнениями каких политических деятелей по вопросу приоритетов мероприятий региональной политики в России наблюдается наибольшее совпадение.
Пример №2