Понятие о критериях согласия. Критерий согласия пирсона. Что будем делать с полученным материалом

Определение 51. Критерии, которые позволяют судить, согласуются ли значения х 1 , х 2 ,…, х n случайной величины Х с гипотезой относительно ее функции распределения, называются критериями согласия.

Идея применения критериев согласия

Пусть на основании данного статистического материала предстоит проверить гипотезу Н , состоящую в том, что СВ Х подчиняется некоторому определенному закону распределения. Этот закон может быть задан либо в виде функция распределения F (x ), либо в виде плотности распределения f (x ), или же в виде совокупности вероятностей p i . Так как из всех этих форм функция распределения F (x ) является наиболее общей (существует и для ДСВ и для НСВ) и определяет собой любую другую, будем формулировать гипотезу Н , как состоящую в том, что величина Х имеет функцию распределения F (x ).

Для того, чтобы принять или опровергнуть гипотезу Н , рассмотрим некоторую величину U , характеризующую степень расхождения (отклонения) теоретического и статистического распределений. Величина U может быть выбрана различными способами : 1) сумма квадратов отклонений теоретических вероятностей p i от соответствующих частот , 2) сумма тех же квадратов с некоторыми коэффициентами (весами), 3) максимальное отклонение статистической (эмпирической) функции распределения от теоретической F (x ).

Пусть величина U выбрана тем или иным способом. Очевидно, что это есть некоторая случайная величина. Закон распределения U зависит от закона распределения случайной величины Х , над которой производились опыты, и от числа опытов n . Если гипотеза Н верна, то закон распределения величины U определяется законом распределения величины Х (функцией F (x )) и числом n .

Допустим, что этот закон распределения известен. В результате данной серии опытов обнаружено, что выбранная мера расхождения U приняла некоторое значение u . Вопрос: можно ли объяснить это случайными причинами или же это расхождение слишком велико и указывает на наличие существенной разницы между теоретическим и статистическим (эмпирическим) распределениями и, следовательно, на непригодность гипотезы Н ? Для ответа на этот вопрос предположим, что гипотеза Н верна, и вычислим в этом предположении вероятность того, что за счет случайных причин, связанных с недостаточным объемом опытного материала, мера расхождения U окажется не меньше, чем наблюдаемое в опыте значение u , то есть вычислим вероятность события: .

Если эта вероятность мала, то гипотезу Н следует отвергнуть как мало правдоподобную, если же эта вероятность значительна, то делаем вывод, что экспериментальные данные не противоречат гипотезе Н .

Возникает вопрос: каким же способом следует выбирать меру расхождения (отклонения) U ? Оказывается, что при некоторых способах ее выбора закон распределения величины U обладает весьма простыми свойствами и при достаточно большом n практически не зависит от функции F (x ). Именно такими мерами расхождения и пользуются в математической статистике в качестве критериев согласия.

Определение 51 / . Критерием согласия называется критерий проверки гипотезы о предполагаемом законе неизвестного распределения.

Для количественных данных при распределениях, близких к нормальным, используют параметрические методы, основанные на таких показателях, как математическое ожидание и стандартное отклонение. В частности, для определения достоверности разницы средних для двух выборок применяют метод (критерий) Стьюдента, а для того чтобы судить о различиях между тремя или большим числом выборок, - тест F , или дисперсионный анализ. Если же имеем дело с неколичественными данными или выборки слишком малы для уверенности в том, что популяции, из которых они взяты, подчиняются нормальному распределению, тогда используют непараметрические методы - критерий χ 2 (хи-квадрат) или Пирсона для качественных данных и критерии знаков, рангов, Манна-Уитни, Вилкоксона и др. для порядковых данных.

Кроме того, выбор статистического метода зависит от того, являются ли те выборки, средние которых сравниваются, независимыми (т. е., например, взятыми из двух разных групп испытуемых) или зависимыми (т. е. отражающими результаты одной и той же группы испытуемых до и после воздействия или после двух различных воздействий).

Пп. 1. Критерий Пирсона (- хи-квадрат)

Пусть произведено n независимых опытов, в каждом из которых случайная величина Х приняла определенное значение, то есть дана выборка наблюдений случайной величины Х (генеральной совокупности) объема n . Рассмотрим задачу по проверке близости теоретической и эмпирической функций распределения для дискретного распределения, то есть требуется проверить, согласуются ли экспериментальные данные с гипотезой Н 0 , утверждающей, что случайная величина Х имеет закон распределения F (x ) при уровне значимости α . Назовем этот закон «теоретическим».

При получении критерия согласия для проверки гипотезы определяют меру D отклонения эмпирической функции распределения данной выборки от предполагаемой (теоретической) функции распределения F (x ).

Наиболее употребительной является мера, введенная Пирсоном. Рассмотрим эту меру. Разобьем множество значений случайной величины Х на r множеств - групп S 1 , S 2 ,…, S r , без общих точек. Практически такое разбиение осуществляется с помощью (r - 1) чисел c 1 < c 2 < … < c r -1 . При этом конец каждого интервала исключают из соответствующего множества, а левый – включают.

S 1 S 2 S 3 …. S r -1 S r

c 1 c 2 c 3 c r -1

Пусть p i , , - вероятность того, что СВ Х принадлежит множеству S i (очевидно ). Пусть n i , , - количество величин (вариант) из числа наблюдаемых, принадлежащих множеству S i (эмпирические частоты). Тогда относительная частота попадания СВ Х во множество S i при n наблюдениях. Очевидно, что , .

Для разбиения, приведенного выше, p i есть приращение F (x ) на множестве S i , а приращение на этом же множестве. Cведем результаты опытов в таблицу в виде группированного статистического ряда.

Границы группы Относительная частота
S 1: x 1 – x 2
S 2: x 2 – x 3
S r : x r x r +1

Зная теоретический закон распределения, можно найти теоретические вероятности попадания случайной величины в каждую группу: р 1 , р 2 , …, p r . Проверяя согласованность теоретического и эмпирического (статистического) распределений, будем исходить из расхождений между теоретическими вероятностями p i и наблюдаемыми частотами .

За меру D расхождения (отклонения) эмпирической функции распределения от теоретической принимают сумму квадратов отклонений теоретических вероятностей p i от соответствующих частот , взятых с некоторыми «весами» c i : .

Коэффициенты c i вводятся потому, что в общем случае отклонения, относящиеся к разным группам, нельзя считать равноправными по значимости: одно и то же по абсолютной величине отклонение может быть мало значительным, если сама вероятность p i велика, и очень заметным, если она мала. Поэтому естественно «веса» c i взять обратно пропорциональным вероятностям. Как выбрать этот коэффициент?

К.Пирсон показал, что если положить , то при больших n закон распределения величины U обладает весьма простыми свойствами: он практически не зависит от функции распределения F (x ) и от числа опытов n , а зависит только от количества групп r , а именно, этот закон при увеличении n приближается к так называемому распределению «хи-квадрат» .

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Была рассмотрена в гл. 5 здесь мы применим данный метод к проектам капиталовложений. Ограничения и условия, при которых используется этот метод, будут обсуждены в гл. 15, где мы рассмотрим критерий согласия для рисковых инвестиций. Наша цель здесь - только показать, как измеряется риск для комбинаций рисковых инвестиций, допуская, что такой критерий необходим.  

Следующий этап связан с использованием высших производных (формула Тейлора), и завершается этот этап обзором метода в целом.Далее рассматриваются некоторые вопросы численной характеристики функций - численных методов (приложение дифференциального исчисления к приближенным вычислениям). На этом этапе устанавливается погрешность уклонения ломаных из секущих, ломаной из касательной, кусочных кривых из парабол Тейлора более высоких степеней от данной функции в зависимости от ее дифференциальных свойств, и сравнивается погрешность. Для простоты рассматривается случай равноотстоящих узлов. Тем самым, устанавливаются границы применимости метода дифференциального исчисления. В качестве дальнейшего развития этого этапа можно рассматривать и другие приближающие модели, конструирование их, руководствуясь, например, следующей схемой 1.Какие узлы мы мы будем использовать 2. Какой класс приближающих функции будем использовать 3. Какой критерий согласия мы применим 4. Какую точность мы хотим  

В данном анализе при оценке степени согласованности эмпирического и теоретического распределения использовался основанный на критерии Пирсона критерий согласия В. И. Романовского  

Результаты расчетов параметров кривых распределения приведены в табл. 10. Расчетные частоты вычислялись по формулам 10, 11, 12. Объективной оценкой степени совпадения эмпирических и теоретических частостей является критерий согласия (в данном исследовании использовался критерий согласия В. И. Романовского ). Проверка показала, что исследуемые эмпирические интервальные ряды распределения времени пролеживания предметов труда в переходящих заделах достаточно точно описываются найденными кривыми функции плотности р (х).  

Число единиц в выборке, N Величина интервала, Н Показатель асимметрии ряда, гл Показатель эксцесса , Ех Дисперсия, а Среднее значение , X Критерий согласия, К  

Полученное эмпирическое распределение будет аппроксимировано непрерывной аналитической функцией , то есть будет идентифицирован закон распределения случайной величины . Также рассмотрено использование критериев согласия при идентификации закона распределения.  

Использование критериев согласия при идентификации закона распределения случайной величины.  

При использовании критерия согласия Пирсона необходимо вычислить величину  

Следует особо подчеркнуть, что при проверке модели по критерию согласия определенным является лишь отрицательный ответ, то есть отклонение модели.  

Положительный ответ означает лишь то, что модель не противоречит эмпирическим данным. Это вовсе не означает, что именно этой моделью данные описываются на самом деле, что это наилучшая модель, что нельзя подобрать другую модель для описания данных и т.д. Фактически, положительный ответ при проверке по критерию согласия следует понимать как "возможно эти данные описываются такой-то моделью", и не более того.  

Полученная гистограмма проверяется на соответствие нормальному распределению с помощью критерия согласия Пирсона.  

Во многих реальных задачах основной трудностью оказывается то, что нейронная сеть не может достаточно ясно показать причинно-следственные связи и выдает какое-то решение по принципу черного ящика . При этом в финансовом анализе для оценки состояния дел предприятий уже давно используются специально подобранные комбинаций различных показателей, а качество модели оценивается с помощью критериев согласия без учета структуры модели . По существу, все сводится к выбору показателя (или комбинации показателей), соответствующего решающему правилу, которое позволяет включить (или не включать) данное предприятие в ту или иную группу (жизнеспособные, быстро растущие, высокоприбыльные).  

По данным задачи 21 проведите выравнивание ряда распределения населения по размеру среднедушевых денежных доходов по кривой нормального распределения . Постройте графики эмпирического и теоретического распределений. Оцените близость эмпирического и теоретического распределений, используя критерии согласия [Пирсона (хи-квадрат), Колмогорова или др.]  

Независимо от вида используемого критерия согласия в про-  

Для С.п.г. используются разные критерии. В частности, когда проверяется согласие между выборочным и гипотетическим распределениями, используется критерий согласия, напр., т.н. критерий Пирсона "хи-квадрат". См. также Ошибка.  

Заменяя в формуле (2.15) М[Н(х) и D уравнениями (2.3), выводим окончательную формулу информационного критерия согласия  

В табл. 2.3 приведены значения энтропийных параметров наиболее часто встречающихся в технических приложениях законов распределения . Таблица энтропийных параметров различных законов распределения предоставляет возможность при применении информационного критерия согласия проверить одновременно несколько гипотез, что по существующим методикам сделать без дополнительных расчетов нельзя.  

Поскольку наиболее распространенным является критерий согласия Пирсона, проведем сравнение информационного критерия J с критерием %2.  

При выравнивании эмпирического распределения нулевая гипотеза принимается, если при применении информационного критерия согласия  

ГОСТ 8.532-85 предлагает с помощью критериев согласия не менее чем при 10 %-ном уровне значимости при и>50 и при 15 нормального распределения - с помощью критерия Вилкоксона для разностей пар - для проверки симметричности распределения) относить массив результатов аттестации СО к одному из классов распределений нормальному , симметричному, несимметричному. Для каждого класса распределений значения основных метрологических характеристик СО определяют различными способами.  

Для определения степени согласованности эмпирического и теоретического распределений предложены различные критерии согласия. Так, известны критерий согласия Пирсона, Романовского, Колмогорова, Ястремского. Критерий согласия Пирсона сводится к исчислению по распределению Пирсона вероятности достижения л 2 данного значения Р = х2. При этом х2 рассчитывается по формуле (9.3)  

В отсутствие каких-либо готовых схем для оптимального выбора модели исследователь должен опробовать различные статистические критерии согласия. Так, Утанс и Муди оценивали риск предсказания, полученный при различных архитектурах сети, а Каяма и др. находили общее число дублирующих друг друга элементов в скрытом слое. Мы же просто сравнивали величины квадратного корня из среднеквадратичной ошибки (RMSE) на тестовом множестве, состоящем из 60 наблюдений, относящихся к последним 5 годам интервала наблюдений (1981-85 гг.). Для дальнейшей работы была взята та архитектура сети, которая давала наименьшее RMSE.  

Эти критерии согласия позволяют провести проверку гипоте-  

При оценивании энтропии н.с.в. встает вопрос о выборе количества интервалов разбиения экспериментальных данных. Эта задача аналогична типичным задачам математической статистики определение закона распределения , расчет оценок эмпирических распределений, вычисление критериев согласия. А. Хальд показал, что существует оптимальное число интервалов группирования, когда ступенчатая огибающая гистограмма наиболее близка к плавной кривой распределения генеральной совокупности . Можно сформулировать ряд критериев такой близости, используя показатели в виде эксцесса, критерия %2 и т. д. . Различные критерии дают несколько различающиеся значения оптимального числа интервалов группирования. Однако сам факт существования оптимума не зависит от выбора критерия близости, так как при группировании данных в слишком большое число мелких интервалов некоторые из них окажутся пустыми или мало заполненными. Гистограмма будет отличаться от плавной кривой распределения вследствие изрезанности многими всплесками и провалами.  

Шторм Р. рекомендует для определения оптимального числа интервалов формулу Брукса и Каррузера k = 5 lg п. В работе рекомендуется соотношение k = 4п. В работе приводится таблица, согласно которой числа интервалов назначаются от 7 до 22 в зависимости от объема выборки от 40 до 10000. Сравнение указанных рекомендаций, приведенное на рис. 2.2, указывает на близость рекомендаций при п - 100 с последующим увеличивающимся расхождением их по мере увеличения объема выборки. Отдельную группу составляют рекомендации по использованию критерия согласия %2. Применение критерия %2 к интервалам постоянной длины неэффективно . Исходная посылка всех работ по эффективности критерия х2 - рассмотрение интервалов с равной вероятностью. Однако практически эти рекомендации не используются из-за сложности их применения. Учитывая разнородность перечисленных рекомендаций, возникает необходимость отдельного исследования влияния числа интервалов при использовании информационных методов анализа технологических процессов.  

Можно выбрать 6 или 7 интервалов. Определяем зону рассеяния размеров R. Устанавливаем максимальное значение размера х = 0,126 и минимальное хт а= - 0,149, размах R = дгтах - xmin = 0,275 мм. Выбираем 7 интервалов и определяем их цену деления С = RI k 0,04 мм. Подсчитаем число отклонений размеров, попавших в соответствующий интервал. Результаты (табл. 2.5) позволяют выдвинуть гипотезу о распределении исследуемых погрешностей по закону Гаусса. Для проверки гипотезы необходимо подготовить данные, входящие в состав

Критерии согласия (соответствия)

Для проверки гипотезы о соответствии эмпирического распределения теоретическому закону распределения используются особые статистические показатели - критерии согласия (или критерии соответствия). К ним относятся критерии Пирсона, Колмогорова, Романовского, Ястрем- ского и др. Большинство критериев согласия базируется на использовании отклонений эмпирических частот от теоретических. Очевидно, что чем меньше эти отклонения, тем лучше теоретическое распределение соответствует эмпирическому (или описывает его).

Критерии согласия - это критерии проверки гипотез о соответствии эмпирического распределения теоретическому распределению вероятностей. Такие критерии подразделяются на два класса: общие и специальные. Общие критерии согласия применимы к самой общей формулировке гипотезы, а именно к гипотезе о согласии наблюдаемых результатов с любым априорно предполагаемым распределением вероятностей. Специальные критерии согласия предполагают специальные нулевые гипотезы, формулирующие согласие с определенной формой распределения вероятностей.

Критерии согласия, опираясь на установленный закон распределения, дают возможность установить, когда расхождения между теоретическими и эмпирическими частотами следует признать несущественными (случайными), а когда - существенными (неслучайными). Из этого следует, что критерии согласия позволяют отвергнуть или иодтвердить правильность выдвинутой при выравнивании ряда гипотезы о характере распределения в эмпирическом ряду и дать ответ, можно ли принять для данного эмпирического распределения модель, выраженную некоторым теоретическим законом распределения.

Критерий согласия Пирсона х 2 (хи-квадрат) - один из основных критериев согласия. Предложен английским математиком Карлом Пирсоном (1857-1936) для оценки случайности (существенности) расхождений между частотами эмпирического и теоретического распределений:

где k - число групп, на которые разбито эмпирическое распределение; fi - эмпирическая частота признака в i -й группе; / тс °р - теоретическая частота признака в i-й группе.

Схема применения критерия у} к оценке согласованности теоретического и эмпирического распределений сводится к следующему.

  • 1. Определяется расчетная мера расхождения % 2 асч.
  • 2. Определяется число степеней свободы.
  • 3. По числу степеней свободы v с помощью специальной таблицы определяется %^бл
  • 4. Если % 2 асч >х 2 абл, то при заданном уровне значимости а и числе степеней свободы v гипотезу о несущественности (случайности) расхождений отклоняют. В противном случае гипотезу можно признать не противоречащей полученным экспериментальным данным и с вероятностью (1 - а) можно утверждать, что расхождения между теоретическими и эмпирическими частотами случайны.

Уровень значимости - это вероятность ошибочного отклонения выдвинутой гипотезы, т.е. вероятность того, что будет отвергнута правильная гипотеза. В статистических исследованиях в зависимости от важности и ответственности решаемых задач пользуются следующими тремя уровнями значимости:

  • 1) а = 0,1, тогда Р = 0,9;
  • 2) а = 0,05, тогда Р = 0,95;
  • 3) а = 0,01, тогда Р = 0,99.

Используя критерий согласия у}, необходимо соблюдать следующие условия.

  • 1. Объем исследуемой совокупности должен удовлетворять условию п > 50, при этом частота или численность группы должна быть не менее 5. Если это условие нарушается, необходимо предварительно объединить небольшие частоты (меньше 5).
  • 2. Эмпирическое распределение должно состоять из данных, полученных в результате случайного отбора, т.е. они должны быть независимыми.

Недостатком критерия согласия Пирсона является потеря части первоначальной информации, связанная с необходимостью группировки результатов наблюдений в интервалы и объединения отдельных интервалов с малым числом наблюдений. В связи с этим рекомендуется дополнять проверку соответствия распределений но критерию у} другими критериями. Особенно это необходимо при объеме выборки п ~ 100.

В статистике критерий согласия Колмогорова (также известный как критерий согласия Колмогорова - Смирнова) используется для того, чтобы определить, подчиняются ли два эмпирических распределения одному закону, либо определить, подчиняется ли полученное распределение предполагаемой модели. Критерий Колмогорова основан на определении максимального расхождения между накопленными частотами или частостями эмпирических или теоретических распределений. Критерий Колмогорова исчисляется по следующим формулам:

где D и d - соответственно максимальная разность между накопленными частотами (/-/") и между накопленными частостями (р-р ") эмпирического и теоретического рядов распределений; N - число единиц в совокупности.

Рассчитав значение X, по специальной таблице определяется вероятность, с которой можно утверждать, что отклонения эмпирических частот от теоретических случайны. Если признак принимает значения до 0,3, то это означает, что происходит полное совпадение частот. При большом числе наблюдений критерий Колмогорова способен обнаружить любое отступление от гипотезы. Это означает, что любое отличие распределения выборки от теоретического будет с его помощью обнаружено, если наблюдений будет достаточно много. Практическая значимость этого свойства несущественна, так как в большинстве случаев трудно рассчитывать на получение большого числа наблюдений в неизменных условиях, теоретическое представление о законе распределения, которому должна подчиняться выборка, всегда приближенное, а точность статистических проверок не должна превышать точность выбранной модели.

Критерий согласия Романовского основан на использовании критерия Пирсона, т.е. уже найденных значений х 2 > и числа степеней свободы:

где v - число степеней свободы вариации.

Критерий Романовского удобен при отсутствии таблиц для х 2 . Если К р К? > 3, то неслучайны и теоретическое распределение не может служить моделью для изучаемого эмпирического распределения.

Б. С. Ястремский использовал в критерии согласия не число степеней свободы, а число групп (k ), особую величину 0, зависящую от числа групп, и величину хи-квадрат. Критерий согласия Ястремского имеет тот же смысл, что и критерий Романовского, и выражается формулой

где х 2 - критерий согласия Пирсона; /е гр - число групп; 0 - коэффициент, для числа групп меньше 20 равный 0,6.

Если 1ф акт > 3, расхождения между теоретическими и эмпирическими распределениями неслучайны, т.е. эмпирическое распределение не отвечает требованиям нормального распределения. Если 1ф акт

В настоящем п° мы рассмотрим один из вопросов, связанных с проверкой правдоподобия гипотез, а именно-вопрос о согласован­ности теоретического и статистического распределения.

Допустим, что данное статистическое распределение выравнено с помощью некоторой теоретической кривой f (х) (рис. 7.6.1). Как бы хорошо ни была подобрана теоретическая кривая, между нею и статистическим распределением неизбежны некоторые расхождения. Естественно возникает вопрос: объясняются ли эти расхождения только случайными обстоятельствами, связанными с ограниченным числом наблюдений, или они являются существенными и связаны с тем, что подобранная нами кривая плохо выравнивает данное ста­тистическое распределение. Для ответа на такой вопрос служат так называемые «критерии согласия».

ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН



Идея применения критериев согласия заключается в следующем.

На основании данного статистического материала нам предстоит проверить гипотезу Н, состоящую в том, что случайная величина X подчиняется некоторому определенному закону распределения. Этот закон может быть задан в той или иной форме: например, в виде функции распределения F(x) или в виде плотности распределения f (х), или же в виде совокупности вероятностей p t , где p t - вероятность того, что величина X попадет в пределы l-то разряда.

Так как из этих форм функция распределения F (х) является наиболее общей и определяет собой любую другую, будем форму­лировать гипотезу Н, как состоящую в том, что величина X имеет функцию распределения ^(д:).

Для того чтобы принять или опровергнуть гипотезу Н, рассмот­рим некоторую величину U, характеризующую степень расхожде­ния теоретического и статистического распределений. Величина U может быть выбрана различными способами; например, в качестве U можно взять сумму квадратов отклонений теоретических вероятно­стей p t от соответствующих частот р* или же сумму тех"*же квад­ратов с некоторыми коэффициентами («весами»), или же максимальное отклонение статистической функции распределения F*(x) от теоре­тической F(x) и т. д. Допустим, что величина U выбрана тем или иным способом. Очевидно, это есть некоторая случайная величина. Закон распределения этой случайной величины зависит от закона распределения случайной величины X, над которой производились опыты, и от числа опытов п. Если гипотеза Н верна, то закон рас­пределения величины U определяется законом распределения вели­чины X (функцией F(x)) и числом п.

Допустим, что этот закон распределения нам известен. В рез­ультате данной серии опытов обнаружено, что выбранная нами мера



КРИТЕРИИ СОГЛАСИЯ


расхождения U приняла некоторое значение а. Спрашивается, можно ли объяснить это случайными причинами или же это расхождение слишком велико и указывает на наличие существенной разницы между теоретическим и статистическим распределениями и, следовательно, на непригодность гипотезы Н? Для ответа на этот вопрос предпо­ложим, что гипотеза Н верна, и вычислим в этом предположении вероятность того, что за счет случайных причин, связанных с недо­статочным объемом опытного материала, мера расхождения U ока­жется не меньше, чем наблюденное нами в опыте значение и, т. е. вычислим вероятность события:

Если эта вероятность весьма мала, то гипотезу Н следует отверг­нуть как мало правдоподобную; если же эта вероятность значительна, следует признать, что экспериментальные данные не противоречат гипотезе Н.

Возникает вопрос о том, каким же способом следует выбирать меру расхождения £/? Оказывается, что при некоторых способах ее выбора закон распределения величины U обладает весьма простыми свойствами и при достаточно большом п практически не зависит от функции F(x). Именно такими мерами расхождения и пользуются в математической статистике в качестве критериев согласия.

Рассмотрим один из наиболее часто применяемых критериев со­гласия- так называемый «критерий у?» Пирсона.

Предположим, что произведено га независимых опытов, в каждом из которых случайная величина X приняла определенное значение. Результаты опытов сведены в k разрядов и оформлены в виде ста­тистического ряда.

Для проверки гипотезы о соответствии эмпирического распределения теоретическому закону распределения используются особые статистические показатели - критерии согласия (или критерии соответствия). К ним относятся критерии Пирсона, Колмогорова, Романовского, Ястремского и др. Большинство критериев согласия базируется на использовании отклонений эмпирических частот от теоретических. Очевидно, что чем меньше эти отклонения, тем лучше теоретическое распределение соответствует эмпирическому (или описывает его).

Критерии согласия - это критерии проверки гипотез о соответствии эмпирического распределения теоретическому распределению вероятностей. Такие критерии подразделяются на два класса: общие и специальные. Общие критерии согласия применимы к самой общей формулировке гипотезы, а именно, к гипотезе о согласии наблюдаемых результатов с любым априорно предполагаемым распределением вероятностей. Специальные критерии согласия предполагают специальные нулевые гипотезы, формулирующие согласие с определенной формой распределения вероятностей.

Критерии согласия, опираясь на установленный закон распределения, дают возможность установить, когда расхождения между теоретическими и эмпирическими частотами следует признать несущественными (случайными), а когда - существенными (неслучайными). Из этого следует, что критерии согласия позволяют отвергнуть или подтвердить правильность выдвинутой при выравнивании ряда гипотезы о характере распределения в эмпирическом ряду и дать ответ, можно ли принять для данного эмпирического распределения модель, выраженную некоторым теоретическим законом распределения.

Критерий согласия Пирсона c 2 (хи-квадрат) - один из основных критериев согласия. Предложен английским математиком Карлом Пирсоном (1857-1936) для оценки случайности (существенности) расхождений между частотами эмпирического и теоретического распределений:

Схема применения критерия c 2 к оценке согласованности теоретического и эмпирического распределений сводится к следующему:

1. Определяется расчетная мера расхождения .

2. Определяется число степеней свободы.

3. По числу степеней свободы n с помощью специальной таблицы определяется .

4. Если , то при заданном уровне значимости α и числе степеней свободы n гипотезу о несущественности (случайности) расхождений отклоняют. В противном случае гипотезу можно признать не противоречащей полученным экспериментальным данным и с вероятностью (1 – α) можно утверждать, что расхождения между теоретическими и эмпирическими частотами случайны.

Уровень значимости - это вероятность ошибочного отклонения выдвинутой гипотезы, т.е. вероятность того, что будет отвергнута правильная гипотеза. В статистических исследованиях в зависимости от важности и ответственности решаемых задач пользуются следующими тремя уровнями значимости:

1) a = 0,1, тогда Р = 0,9;

2) a = 0,05, тогда Р = 0,95;

3) a = 0,01, тогда Р = 0,99.

Используя критерий согласия c 2 , необходимо соблюдать следующие условия:

1. Объем исследуемой совокупности должен быть достаточно большим (N ≥ 50), при этом частота или численность группы должна быть не менее 5. Если это условие нарушается, необходимо предварительно объединить небольшие частоты (меньше 5).

2. Эмпирическое распределение должно состоять из данных, полученных в результате случайного отбора, т.е. они должны быть независимыми.

Недостатком критерия согласия Пирсона является потеря части первоначальной информации, связанная с необходимостью группировки результатов наблюдений в интервалы и объединения отдельных интервалов с малым числом наблюдений. В связи с этим рекомендуется дополнять проверку соответствия распределений по критерию c 2 другими критериями. Особенно это необходимо при сравнительно малом объеме выборки (n ≈ 100).

В статистике критерий согласия Колмогорова (также известный, как критерий согласия Колмогорова - Смирнова) используется для того, чтобы определить, подчиняются ли два эмпирических распределения одному закону, либо определить, подчиняется ли полученное распределение предполагаемой модели. Критерий Колмогорова основан на определении максимального расхождения между накопленными частотами или частостями эмпирических или теоретических распределений. Критерий Колмогорова исчисляется по следующим формулам:

где D и d - соответственно максимальная разность между накопленными частотами (f f ¢) и между накопленными частостями (p p ¢) эмпирического и теоретического рядов распределений; N - число единиц в совокупности.

Рассчитав значение λ, по специальной таблице определяется вероятность, с которой можно утверждать, что отклонения эмпирических частот от теоретических случайны. Если признак принимает значения до 0,3, то это означает, что происходит полное совпадение частот. При большом числе наблюдений критерий Колмогорова способен обнаружить любое отступление от гипотезы. Это означает, что любое отличие распределения выборки от теоретического будет с его помощью обнаружено, если наблюдений будет достаточно много. Практическая значимость этого свойства не существенна, так как в большинстве случаев трудно рассчитывать на получение большого числа наблюдений в неизменных условиях, теоретическое представление о законе распределения, которому должна подчиняться выборка, всегда приближенное, а точность статистических проверок не должна превышать точность выбранной модели.

Критерий согласия Романовского основан на использовании критерия Пирсона, т.е. уже найденных значений c 2 , и числа степеней свободы:

где n - число степеней свободы вариации.

Критерий Романовского удобен при отсутствии таблиц для . Если < 3, то расхождения распределений случайны, если же > 3, то не случайны и теоретическое распределение не может служить моделью для изучаемого эмпирического распределения.

Б. С. Ястремский использовал в критерии согласия не число степеней свободы, а число групп (k ), особую величину q, зависящую от числа групп, и величину хи-квадрат. Критерий согласия Ястремского имеет тот же смысл, что и критерий Романовского, и выражается формулой

где c 2 - критерий согласия Пирсона; - число групп; q - коэффициент, для числа групп меньше 20 равный 0,6.

Если L факт > 3, расхождениz между теоретическими и эмпирическими распределениями неслучайны, т.е. эмпирическое распределение не отвечает требованиям нормального распределения. Если L факт < 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.

Loading...Loading...