Лабораторная работа № 13

Проверка гипотезы о виде функции распределения

Данные, получаемые при контроле технологического процесса, для дальнейшей обработки желательно представить в виде теоретического распределения, максимально соответствующего экспериментальному распределению. Проверку гипотезы о виде функции распределения проводят по критериям согласия – Пирсона, Колмогорова и другим.

Наиболее часто используется критерий Пирсона c2. Применение его показано в примере 11.1 лабораторной работы 11 при проверке гипотезы о том, что число дефектных изделий в партии подчиняется распределению Пуассона.

Однако применение критериев согласия требует обычно довольно значительного объёма данных. Так, критерий Пирсона обычно рекомендуется использовать при объёме выборки не менее 50..100. Поэтому при небольшом объёме выборки проверку гипотезы о виде функции распределения проводят приближёнными методами –графическим методом или по асимметрии и эксцессу.

Наиболее простой, но весьма приближенный метод оценки согласия результатов с тем или иным распределением – графический. По этому методу результаты  располагают в вариационном ряду. Затем для каждого результата xi рассчитывают накопленную частость по формуле , где i – номер результата в вариационном ряду, n – объём выборки. Используя накопленные частости как значения функции распределения, для каждого W(i) находят соответствующие значения квантиля предполагаемого распределения. В частности, для нормального распределения находят квантили стандартного нормального распределения zi. Результаты наносят на график в координатах xz. Поскольку предполагается, что значения xi являются квантилями того же вида распределения, что и zi, между значениями x и z должна быть линейная зависимость. Если нанесенные на график точки укладываются вдоль прямой линии лишь с небольшими отклонениями, считается, что результаты удовлетворительно описываются выбранным теоретическим распределением. При больших отклонениях от прямой экспериментальное распределение не соответствует выбранному теоретическому. Возможна также оценка допустимых величин отклонений от прямой.

Пример 13.1. Проверить нормальность распределения результатов наблюдений, представленных в примере 1.1.

Поскольку объём выборки невелик (n=30), используем графический метод. В ячейку А1 вводим заголовок работы. В ячейки А3:D3 вводим заголовки i, X, W, z. В диапазон А4:А103 вводим номера наблюдений в вариационном ряду от 1 до 100. Предусмотреть такое большое количество данных необходимо для того, чтобы таблица была «многоразовой», т.е. при вводе новых данных (числом до 100) таблица автоматически пересчитывалась бы. В диапазон В4:В33 вводим исходные данные и располагаем их в вариационном ряду, для чего выделяем диапазон В4:В33 и нажимаем кнопку Сортировка по возрастанию. В ячейке G3 рассчитываем объём выборки по статистической функции СЧЁТ, для чего в диалоговом окне функции СЧЁТ в первой строке вводим диапазон В4:В103. В результате будет рассчитано количество чисел в диапазоне, что и соответствует объёму выборки.

В ячейке С4 рассчитываем накопленную частость для i=1, и после указания необходимой абсолютной адресации копируем формулу из ячейки С4 в диапазон С5:С103.

В ячейке D4 рассчитываем значение z1 по статистической функции НОРМСТОБР. При этом в строку Вероятность диалогового  окна функции вводим ссылку на соответствующую накопленную частость. Из ячейки D4 копируем формулу в диапазон D5:D103.

По результатам расчётов строим точечную диаграмму вида Точечная диаграмма позволяет сравнить пары значений, используя в качестве диапазона данных диапазон B4:B33, D4:D33. Затем добавляем на диаграмму линейную линию тренда, открыв для этого на точках диаграммы контекстное меню и выбрав команду Добавить линию тренда.

Результаты расчётов и построений показаны на рис 13.1.

 

 

 

 

 

 

 

 

 

 

 

 

 


Рис.13.1. Расчёты и построения в примере 13.1.

Как видно из диаграммы, точки расположены вблизи прямой, и поэтому гипотеза о нормальности распределения принимается.

Для приближенной проверки гипотезы о нормальности распределения  используют также показатели асимметрии и эксцесса. Асимметрия - это показатель, отражающий степень несимметричности кривой дифференциальной функции экспериментального распределения по сравнению с дифференциальной функцией нормального распределения. Эксцесс - показатель, отображающий  вытянутость (возвышение) кривой дифференциальной функции экспериментального распределения по сравнению с дифференциальной функцией нормального распределения.

Значения асимметрии  (А) и эксцесса (Е) рассчитываются следующим образом:

 

В программе Excel есть встроенные статистические функции для расчета А (функция СКОС) и Е (функция ЭКСЦЕСС).

Выборочные А и Е – случайные величины. Их дисперсии равны

 

Если   и , то распределение считают нормальным. Гипотезу нормальности бракуют, если  много больше и  много больше.

Пример 13.2. Проверить нормальность распределения результатов наблюдений штамповок колец подшипников по высоте (мм), представленных в ряду  31,74 32,17 32,25 32,28 32,26 32,29 32,28 32,92 32,74 32,63 32,68 32,61 32,48 32,47 32,30 31,60 31,70 32,36 32,46 31,73.

В ячейку А1 нового листа книги Excel вводим заголовок работы. В ячейку В3 вводим заголовок столбца X. В диапазон В4:В23 вводим исходные данные. В ячейке Е4 рассчитываем объём выборки – так же, как в графическом методе. При этом для функции СЧЁТ указываем диапазон В4:В103, чтобы электронная таблица была «многоразовой» при объёме выборки до 100 элементов.

В диапазоне Е5:Е8 рассчитываем значения асимметрии (статистическая функция СКОС), эксцесса (статистическая функция ЭКСЦЕСС), модуля асимметрии и модуля эксцесса (математическая функция ABS). Далее в ячейках Е9 и Е10 рассчитываем значения дисперсий асимметрии и эксцесса по приведённым выше расчётным формулам. Затем в ячейках Е11 и Е12 находим  и соответственно.

После этого уже можно визуально оценить справедливость неравенств  и  и сделать вывод о соответствии экспериментального распределения нормальному. Однако такую оценку можно автоматизировать следующим образом: в ячейку D14 вводим логическую функцию ЕСЛИ, и в строку Логическое_выражение открывшегося диалогового окна вводим неравенство E7<=3*E9. Затем вводим здесь же логическую функцию И, и в открывшемся диалоговом окне вводим в строку Логическое 1 неравенство E8<=E12. После этого, установив курсор в строке формул после всех сделанных записей, возвращаемся в диалоговое окно функции ЕСЛИ. Здесь в строку Значение_если_истина вводим сообщение Распределение нормальное, а в строку Значение_если_ложь – сообщение Возможно, распределение не является нормальным. В конечном счёте формула в ячейке D14 будет выглядеть так: =ЕСЛИ(E7<=3*E9+И(E8<=E12);"Распределение нормальное";"Возможно, распределение не является нормальным"). Таким образом, в ячейке D14 будет появляться одно из двух введённых сообщений, в зависимости от выполнения или невыполнения условий нормальности распределения. При использовании данных примера будет выведено сообщение Распределение нормальное. Убедиться в правильности работы электронной таблицы можно, введя, например, в ячейку В4 значение 34 вместо 31,74, после чего появится сообщение Возможно, распределение не является нормальным.

Результаты расчётов показаны на рис.13.2.

 

 

 

 

 

 

 

 

 

 

 

 


Рис.13.2. Расчёты и построения в примере 13.2.

Задание

Выполнить расчёты и построения в соответствии с примерами 13.1 и 13.2.

 

        Далее     Содержание
© В.В.Заляжных