Matlab  |  Mathematica  |  Mathcad  |  Maple  |  Statistica  |  Tabula  |  Другие пакеты Поиск по сайту
Internet-класс  |  Примеры  |  Методики  |  Банк задач  |  Форум  |  Download  |  Ссылки  |  Конкурсы


 
Модифицированный коэффициент конкордации и его использование в нечисловой статистике.
выполнил: А.В. Кузнецов,
аспирант кафедры прикладных информационных технологий Саратовского Государственного Технического Университета

archive.gif (75 bytes) Архив разработки (18.2 Кб, WinRAR)


В нечисловой статистике часто возникает необходимость установления степени взаимосвязи (корреляции), или сходства двух, или более объектов. При этом традиционные подходы, основанные на формулах Пирсона, Спирмена и ранговой конкордации Кендалла, часто не дают нужного результата при недостаточной согласованности объектов по одному из измерений и малом объеме исходной выборки (см., например, [1] и [2]). Кроме того, данные формулы требуют предварительной обработки при равенстве рангов объектов.


Для решения данной проблемы предлагается использовать модифицированный коэффициент конкордации:



где

n - объем выборки,
ki - количество признаков по i-му элементу выборки. В случае, когда вид (1) упрощается:



Формула (2) является аналогом коэффициента конкордации Кендалла:



но не имеет ограничений, налагаемых на формулу (3). Например, для определения корреляции между результатами, полученными студентами при сдаче экзамена в традиционной форме и в форме компьютерного теста (см. таблицу 1), формула Кендалла требует рангового преобразования пятибалльной (фактически, четырехбалльной, так как оценка 1 не ставится) шкалы оценок с последующим усреднением показателей для равных рангов (см. таблицу 2).


Исходные данные. (Таблица 1).
Студенты 1 2 3 4 5 6 7 8 9 10
Тест 2 3 3 3 4 4 4 4 5 5
Экзамен 4 3 3 3 3 4 4 4 5 5


Входные данные для формул Спирмена и Кендалла. (Таблица 1).
Студенты 1 2 3 4 5 6 7 8 9 10
Тест 1 3 3 3 6,5 6,5 6,5 6,5 9,5 9,5
Экзамен 6,5 3,5 3,5 3,5 3,5 6,5 6,5 6,5 9,5 9,5

Подобные преобразования требуют дополнительных временных затрат, как за счет собственно затрат на преобразования, так и за счет перевода исходных данных в вещественное представление.


Модифицированный коэффициент конкордации (1) может работать непосредственно по исходным данным. При этом необходимо либо уменьшить все значения в таблице 1 на единицу, так как мы имеем дело с четырехбалльной шкалой, либо привести (1) к виду:



где

n - объем выборки,
k - максимально возможное значение признака (в нашем случае k=5),
m - минимально возможное значение признака (в нашем случае m=2).


При этом выполняется интуитивно понятное требование, по которому значение коэффициента конкордации должно быть не меньше, чем 0.8, так как в исходной таблице различаются значения только в двух столбцах из десяти - в первом и пятом (модифицированный коэффициент конкордации, рассчитанный по формуле (4) будет равен 0.9). В то же время, коэффициент конкордации Кендалла, рассчитанный по таблице 2 и формуле (3), будет приблизительно равен 0.64, что, с точки зрения статистики, является достаточно плохим результатом, практически говорящим об отсутствии связи между данными, полученными с помощью тестирования и экзамена.


Выводы


В данной статье предлагается к рассмотрению модифицированный коэффициент конкордации, который может использоваться как альтернатива стандартным подходам. Его применение позволяет упростить вычисления при наличии в выборке одинаковых рангов. В прилагаемом MathCad файле приведены программы расчета упоминаемых в статье коэффициентов, что может оказаться полезным исследователям, занимающимся вопросами нечисловой статистики.


Литература


  1. Красильников В.В. Статистика объектов нечисловой природы. Набережные Челны, изд-во Камского политехнического института, 2001 г., 144 с.
  2. Орлов А.И. Нечисловая статистика. М.: "МЗ-Пресс", 2004 г., 516 с.
Карта сайта | На первую страницу | Поиск | О проекте | Сотрудничество | e-mail
Корпоративная почта | ActiveCloud | Антивирус Касперского | Matlab | Подписка на MSDN для вузов | ИТ-ПРОРЫВ

Исправляем ошибки: Нашли опечатку? Выделите ее мышкой и нажмите Ctrl+Enter

Наши баннеры


Copyright © 1993-2014. Компания Softline. Все права защищены.

Дата последнего обновления информации на сайте: 14.10.14
Сайт начал работу 01.09.00

Softline – программное обеспечение, IT-консалтинг, лицензирование, обучение

подарки – подарочные сертификаты

 

            Rambler's Top100