Какими свойствами обладает нормальное распределение результатов измерений

Какими свойствами обладает нормальное распределение результатов измерений thumbnail

Норма́льное распределе́ние[1][2], также называемое распределением Гаусса или Гаусса — Лапласа[3] — распределение вероятностей, которое в одномерном случае задаётся функцией плотности вероятности, совпадающей с функцией Гаусса:

где параметр  — математическое ожидание (среднее значение), медиана и мода распределения, а параметр  — среднеквадратическое отклонение ( — дисперсия) распределения.

Таким образом, одномерное нормальное распределение является двухпараметрическим семейством распределений, которое принадлежит экспоненциальному классу распределений.[4] Многомерный случай описан в статье «Многомерное нормальное распределение».

Стандартным нормальным распределением называется нормальное распределение с математическим ожиданием и стандартным отклонением .

Общие сведения[править | править код]

Если величина является суммой многих случайных слабо взаимозависимых величин, каждая из которых вносит малый вклад относительно общей суммы, то центрированное и нормированное распределение такой величины при достаточно большом числе слагаемых стремится к нормальному распределению.

Это следует из центральной предельной теоремы теории вероятностей. В окружающем нас мире часто встречаются величины, значение которых определяется совокупностью многих независимых факторов. Этот факт, а также то, что распределение считалось типичным, обычным, привели к тому, что в конце XIX века стал использоваться термин «нормальное распределение». Нормальное распределение играет заметную роль во многих областях науки, например в математической статистике и статистической физике.

Случайная величина, имеющая нормальное распределение, называется нормальной, или гауссовской, случайной величиной.

Определения[править | править код]

Стандартное нормальное распределение[править | править код]

Наиболее простой случай нормального распределения — стандартное нормальное распределение — частный случай, когда и . Его плотность вероятности равна

Множитель в выражении обеспечивает условие нормировки интеграла .[5] Поскольку множитель в экспоненте обеспечивает единичную дисперсию (то есть дисперсия равна единице), то и стандартное отклонение равно 1. Функция симметрична в точке , её значение в ней максимально и равно . Точки перегиба функции — и .

Гаусс называл стандартным нормальным распределение с , то есть

Нормальное распределение с параметрами [править | править код]

Каждое нормальное распределение — это вариант стандартного нормального распределения, область значений которого растягивается множителем (стандартное отклонение) и переносится на (математическое ожидание):

являются параметрами нормального распределения. Плотность вероятности должна нормироваться , так что интеграл равен 1.

Если  — стандартная нормальная случайная величина, то величина будет иметь нормальное распределение с математическим ожиданием и стандартным отклонением . Наоборот, если  — нормальная величина с параметрами и , то будет иметь стандартное нормальное распределение.

Если в экспоненте плотности вероятности раскрыть скобки и учитывать, что , то

Таким образом, плотность вероятности каждого нормального распределения представляет собой экспоненту квадратичной функции:

где . Отсюда можно выразить среднее значение как , а дисперсию как . Для стандартного нормального распределения , и .

Обозначение[править | править код]

Плотность вероятности стандартного нормального распределения (с нулевым средним и единичной дисперсией) часто обозначается греческой буквой (фи) [6]. Также достаточно часто используется альтернативная формы греческой буквы фи .

Нормальное распределение часто обозначается , или .[7] Если случайная величина распределена по нормальному закону со средним и вариацией , то пишут

Функция распределения[править | править код]

Функция распределения стандартного нормального распределения обычно обозначается заглавной греческой буквой (фи) и представляет собой интеграл

С ней связана функция ошибок (интеграл вероятности) , дающий вероятность того, что нормальная случайная величина со средним 0 и вариацией 1/2 попадёт в отрезок :

Эти интегралы, неберущиеся в элементарных функциях, и называются специальными функциями. Многие их численные приближения известны. См. ниже.

Функции связаны, в частности, соотношением

Нормальное распределение с плотностью , средним и отклонением имеет следующую функцию распределения:

Можно использовать функцию  — она даст вероятность того, что значение стандартной нормальной случайной величины превысит : .

График стандартной нормальной функции распределения имеет 2-кратную вращательную симметрию относительно точки (0,1/2), то есть . Её неопределенный интеграл равен

Функция распределения стандартной нормальной случайной величины может быть разложена с помощью интегрирования по частям в ряд:

где знак означает двойной факториал.

Асимптотическое разложение функции распределения для больших может быть также произведено интегрированием по частям.

Стандартное отклонение[править | править код]

Для нормального распределения значения, отличающиеся от среднего на число, меньшее чем одно стандартное отклонение, составляют 68,27 % популяции. В то же время значения, отличающиеся от среднего на два стандартных отклонения, составляют 95,45 %, а на три стандартных отклонения — 99,73 %.

Около 68 % значений из нормального распределения находятся на расстоянии не более одного стандартного отклонения σ от среднего; около 95 % значений лежат расстоянии не более двух стандартных отклонений; и 99,7 % не более трёх. Этот факт является частным случаем правила 3 сигм для нормальной выборки.

Более точно, вероятность получить нормальное число в интервале между и равна

Если рассматривать 12 значимых символов, значения для равны:[8]

Свойства[править | править код]

Моменты[править | править код]

Моментами и абсолютными моментами случайной величины называются математические ожидания случайных величин и , соответственно. Если математическое ожидание случайной величины , то эти параметры называются центральными моментами. В большинстве случаев представляют интерес моменты для целых .

Читайте также:  Какие механические свойства металлов

Если имеет нормальное распределение, то для неё существуют (конечные) моменты при всех с действительной частью больше −1. Для неотрицательных целых , центральные моменты таковы:

Здесь  — натуральное число, а запись означает двойной факториал числа , то есть (поскольку в данном случае нечётно) произведение всех нечётных чисел от 1 до .

Центральные абсолютные моменты для неотрицательных целых таковы:

Последняя формула справедлива также для произвольных .

Преобразование Фурье и характеристическая функция[править | править код]

Преобразование Фурье нормальной плотности вероятности с математическим ожиданием стандартным отклонением равно[9]

где есть мнимая единица. Если математическое ожидание , то первый множитель равен 1, и преобразование Фурье, не считая константу, есть нормальная плотность вероятности на частотных интервалах, с математическим ожиданием равным 0 и стандартным отклонением . В частности, стандартное нормальное распределение есть собственная функция от преобразования Фурье.

В теории вероятности, преобразование Фурье плотности распределения действительной случайной величины близко связано с характеристической функцией этой величины, которая определена как математическое ожидание от и является функцией вещественной переменной (частотный параметр преобразования Фурье). Определение может быть распространено и на комплексную переменную .[10] Соотношение записывается так:

Бесконечная делимость[править | править код]

Нормальное распределение является бесконечно делимым.

Если случайные величины и независимы и имеют нормальное распределение с математическими ожиданиями и и дисперсиями и соответственно, то также имеет нормальное распределение с математическим ожиданием и дисперсией
Отсюда вытекает, что нормальная случайная величина представима как сумма произвольного числа независимых нормальных случайных величин.

Максимальная энтропия[править | править код]

Нормальное распределение имеет максимальную дифференциальную энтропию среди всех непрерывных распределений, дисперсия которых не превышает заданную величину[11][12].

Правило трёх сигм для гауссовской случайной величины[править | править код]

Правило трёх сигм () — практически все значения нормально распределённой случайной величины лежат в интервале , где  — математическое ожидание и параметр нормальной случайной величины. Более точно — приблизительно с вероятностью 0,9973 значение нормально распределённой случайной величины лежит в указанном интервале.

Моделирование нормальных псевдослучайных величин[править | править код]

При компьютерном моделировании, особенно при применении метода Монте-Карло, желательно использовать величины, распределенные по нормальному закону. Многие алгоритмы дают стандартные нормальные величины, так как нормальную величину можно получить как , где Z — стандартная нормальная величина. Алгоритмы также используют различные преобразования равномерных величин.
Простейшие приближённые методы моделирования основываются на центральной предельной теореме. Если сложить достаточно большое количество независимых одинаково распределённых величин с конечной дисперсией, то сумма будет иметь распределение, близкое к нормальному. Например, если сложить 100 независимых стандартно равномерно распределённых случайных величин, то распределение суммы будет приближённо нормальным.

Для программного генерирования нормально распределённых псевдослучайных величин предпочтительнее использовать преобразование Бокса — Мюллера. Оно позволяет генерировать одну нормально распределённую величину на базе одной равномерно распределённой.

Также существует алгоритм Зиккурат, который работает даже быстрее преобразования Бокса — Мюллера. Тем не менее, сложнее в реализации, но его применение оправдано в случаях, когда требуется генерирование очень большого числа неравномерно распределённых случайных чисел.

Нормальное распределение в природе и приложениях[править | править код]

Нормальное распределение часто встречается в природе. Например, следующие случайные величины хорошо моделируются нормальным распределением:

  • отклонение при стрельбе;
  • погрешности измерений (однако погрешности некоторых измерительных приборов имеют иное распределение);
  • некоторые характеристики живых организмов в популяции.

Такое широкое распространение этого распределения связано с тем, что оно является бесконечно делимым непрерывным распределением с конечной дисперсией. Поэтому к нему в пределе приближаются некоторые другие, например биномиальное и пуассоновское. Этим распределением моделируются многие недетерминированные физические процессы[13].

Многомерное нормальное распределение используется при исследовании многомерных случайных величин (случайных векторов). Одним из многочисленных примеров таких приложений является исследование параметров личности человека в психологии и психиатрии.

Связь с другими распределениями[править | править код]

  • Нормальное распределение является распределением Пирсона типа XI[14].
  • Отношение пары независимых стандартных нормально распределенных случайных величин имеет распределение Коши[15]. То есть, если случайная величина представляет собой отношение (где и  — независимые стандартные нормальные случайные величины), то она будет обладать распределением Коши.
  • Если  — совместно независимые стандартные нормальные случайные величины, то есть , то случайная величина имеет распределение хи-квадрат с k степенями свободы.
  • Если случайная величина подчинена логнормальному распределению, то её натуральный логарифм имеет нормальное распределение. То есть, если , то . И наоборот, если , то .
  • Если независимые нормально распределенные случайные величины с математическими ожиданиями и дисперсиями , то их выборочное среднее независимо от выборочного стандартного отклонения,[16] а отношение следующих двух величин будет иметь t-распределение с степенями свободы:
  • Отношение квадратов двух стандартных нормальных случайных величин имеет распределение Фишера со степенями свободы .

История[править | править код]

Впервые нормальное распределение как предел биномиального распределения при появилось в 1738 году во втором издании работы Муавра «Доктрина случайностей»[en][18]. Это было первое доказательство частного случая центральной предельной теоремы. В 1809 году Гаусс в сочинении «Теория движения небесных тел» ввёл это распределение как возникающее в результате многократных измерений движения небесных тел. Однако Гаусс вывел формулу для действительных случайных величин из принципа достижения максимума совместной плотности всех измерений в точке с координатами, равными среднему всех измерений. Этот принцип впоследствии подвергался критике. В 1812 году Лаплас в теореме Муавра — Лапласа обобщил результат Муавра для произвольного биномиального распределения, то есть для сумм одинаково распределённых независимых бинарных величин[3].

Читайте также:  Какими лечебными свойствами обладает подорожник

См. также[править | править код]

  • Аддитивный белый гауссовский шум
  • Логнормальное распределение
  • Равномерное распределение
  • Центральная предельная теорема
  • Двумерное нормальное распределение
  • Многомерное нормальное распределение
  • Распределение хи-квадрат
  • Статистический критерий
  • Частотное распределение

Примечания[править | править код]

  1. Вентцель Е. С. Теория вероятностей. — 10-е изд., стер.. — М.: Academia, 2005. — 576 с. — ISBN 5-7695-2311-5.
  2. Ширяев, А. Н. Вероятность. — М.: Наука, 1980.
  3. 1 2 Математический энциклопедический словарь. — М.: Советская энциклопедия, 1988. — С. 139—140.
  4. L. Wasserman. All of Statistics. — New York, NY: Springer, 2004. — С. 142. — 433 с. — ISBN 978-1-4419-2322-6.
  5. ↑ Доказательство см. Гауссов интеграл
  6. ↑ Halperin, Hartley & Hoel (1965, item 7)
  7. ↑ McPherson (1990)
  8. ↑ Wolfram|Alpha: Computational Knowledge Engine. Wolframalpha.com. Дата обращения 3 марта 2017.
  9. ↑ Bryc (1995, p. 23)
  10. ↑ Bryc (1995, p. 24)
  11. Cover, Thomas M.; Thomas, Joy A. Elements of Information Theory. — John Wiley and Sons, 2006. — С. 254.
  12. Park, Sung Y.; Bera, Anil K. Maximum Entropy Autoregressive Conditional Heteroskedasticity Model (англ.) // Journal of Econometrics (англ.)русск. : journal. — Elsevier, 2009. — P. 219—230. Архивировано 7 марта 2016 года.
  13. Талеб Н. Н. Чёрный лебедь. Под знаком непредсказуемости = The Black Swan: The Impact of the Highly Improbable. — КоЛибри, 2012. — 525 с. — ISBN 978-5-389-00573-0.
  14. ↑ Королюк, 1985, с. 135.
  15. Галкин В. М., Ерофеева Л. Н., Лещева С. В. Оценки параметра распределения Коши // Труды Нижегородского государственного технического университета им. Р. Е. Алексеева. — 2014. — № 2(104). — С. 314—319. — УДК 513.015.2(G).
  16. Lukacs, Eugene. A Characterization of the Normal Distribution (англ.) // The Annals of Mathematical Statistics (англ.)русск. : journal. — 1942. — Vol. 13, no. 1. — P. 91—3. — ISSN 0003-4851. — doi:10.1214/aoms/1177731647.
  17. Lehmann, E. L. Testing Statistical Hypotheses. — 2nd. — Springer (англ.)русск., 1997. — С. 199. — ISBN 978-0-387-94919-2.
  18. ↑ The doctrine of chances; or, a method of calculating the probability of events in play, L., 1718, 1738, 1756; L., 1967 (репродуцир. изд.); Miscellanea analytica de scriebus et quadraturis, L., 1730.

Литература[править | править код]

  • Королюк В. С., Портенко Н. И., Скороход А. В., Турбин А. Ф. Справочник по теории вероятностей и математической статистике. — М.: Наука, 1985. — 640 с.
  • Halperin, Max; Hartley, Herman O.; Hoel, Paul G. Recommended Standards for Statistical Symbols and Notation. COPSS Committee on Symbols and Notation (англ.) // The American Statistician (англ.)русск. : journal. — 1965. — Vol. 19, no. 3. — P. 12—14. — doi:10.2307/2681417.
  • McPherson, Glen. Statistics in Scientific Investigation: Its Basis, Application and Interpretation (англ.). — Springer-Verlag, 1990. — ISBN 978-0-387-97137-7.
  • Bryc, Wlodzimierz. The Normal Distribution: Characterizations with Applications (англ.). — Springer-Verlag, 1995. — ISBN 978-0-387-97990-8.

Ссылки[править | править код]

  • Таблица значений функции стандартного нормального распределения
  • Онлайн расчёт вероятности нормального распределения

Источник

Случайной
погрешностью измерения
называется
составляющая погрешности, изменяющаяся
случайным образом (по знаку и зна­чению)
при повторных измерениях одной и той
же физической ве­личины, проведенных
с одинаковой тщательностью. Примеры
распределения случайных величин

Способы
нахождения значений случайной величины
зависят от вида функции ее распределения.
Однако на практике такие функции, как
правило, неизвестны. Если же случайный
характер результатов наблюдений
обусловлен погрешностями измерений, 
то полагают, что наблюдения имеют
нормальное
распределение
.
Это обусловлено тем, что погрешности
измерений складываются из большого
числа небольших возмущений, ни одно из
которых не является преобладающим.
Согласно же центральной
предельной теореме

сумма бесконечно большого числа взаимно
независимых бесконечно малых случайных
величин с любыми распределениями имеет
нормальное
распределение
.
Нормальное распределение для
Какими свойствами обладает нормальное распределение результатов измеренийслучайной
величиных
с
математическим ожиданием 
Какими свойствами обладает нормальное распределение результатов измеренийи
дисперсиейs 
имеет вид:
Реально даже воздействие
ограниченного числа возмущений приводит
к нормальному распределению результатов
измерений  и их погрешностей. В
настоящее время наиболее полно разработан
математический аппарат именно для
случайных величин, имеющих нормальное
распределение. Если же предположение
о нормальности распределения отвергается,
то статистическая обработка наблюдений
существенно усложняется и в таком
случае невозможно рекомендовать общую
методику статистической обработки
наблюдений. Часто даже не известно,
какая характеристика распределения
может служить оценкой истинного значения
измеряемой величины.
Выше приведено
аналитическое выражение нормального
распределения для случайной измеряемой
величины х.
Переход к нормальному
распределению случайных погрешностей

Какими свойствами обладает нормальное распределение результатов измеренийосуществляется
переносом центра распределений вКакими свойствами обладает нормальное распределение результатов измеренийи
откладывания по оси абсцисс погрешностиКакими свойствами обладает нормальное распределение результатов измерений.

Нормальное
распределение характеризуется двумя
парамет-рами: математическим ожиданием
m1
и
средним квадратическим отклонением
σ.
При многократных измерениях
несмещенной, состоятельной и эффективной
оценкой  m1 
для группы из n 
наблюдений является среднее арифметическое
Какими свойствами обладает нормальное распределение результатов измерений:Какими свойствами обладает нормальное распределение результатов измерений.
Нужно
сказать, что среднее арифметическое
дает оценку математического ожидания
результата наблюдений и может бытьоценкой
истинного (действительного) значения
измеряемой
величины только после
исключения

систематических погрешностей.
Оценка
S
среднего квадратического отклонения
(СКО) дается
формулой:
                                          
Какими свойствами обладает нормальное распределение результатов измеренийЭта
оценка характеризуетрассеяние
единичных результатов измерений в ряду
равноточных измерений одной и той же
величины около их среднего значения.

Читайте также:  С каким свойством пространства связан закон сохранения момента импульса

Другими оценками рассеяния результатов
в ряду измерений являются размах
(разница между наибольшим и наименьшим
значением),  модуль средней
арифметической погрешности

(арифметическая сумма погрешностей,
деленная на число измерений) и
доверительная граница погрешности
(подробно рассматривается ниже).
СКО
является наиболее удобной характеристикой
погрешности в случае ее дальнейшего
преобразования. Например, для нескольких
некоррелированных слагаемых СКО суммы
определяется по
формуле:
                                   
Какими свойствами обладает нормальное распределение результатов измерений.
Оценка
S характеризует рассеяние единичных
результатов наблюдений относительно
среднего значения, то есть в случае,
если мы за результат измерений примем
отдельный  исправленный результат
наблюдений. Если же в качестве результата
измерений принимается среднее
арифметическое, то СКО этого среднегоКакими свойствами обладает нормальное распределение результатов измеренийопределяется
по формуле:Какими свойствами обладает нормальное распределение результатов измеренийНормальное
распределение погрешностей имеет
следующиесвойства:

  • симметричность,
    т.е. погрешности, одинаковые по величине,
    но противоположные по   знаку,
    встречаются одинаково часто;

  • математическое
    ожидание случайной погрешности равно
    нулю;

  • малые
    погрешности более вероятны, чем большие;

  • чем
    меньше s, тем меньше рассеяние результатов
    наблюдений и больше вероятность малых
    погрешностей.

Доверительные
интервалы

Приведенные
выше оценки параметров распределения
случайных величин в виде  среднего
арифметического для оценки математического
ожидания и СКО для оценки дисперсии
называются точечными
оценками
,
так как они выражаются одним числом.
Однако в некоторых случаях знание
точечной оценки является недостаточным.
Наиболее корректной и наглядной оценкой
случайной погрешности измерений 
является оценка  с помощью доверительных
интервалов.

Симметричный интервал в границами
± Δх(Р)
называется доверительным
интервалом
случайной
погрешности с довери-тельной вероятностью
Р,
если площадь кривой распределения
между абсциссами –Δх
и
+Δх
составляет Р
часть всей площади под кривой плотности
распределения вероятностей. При
нормировке всей площади на единицу Р
представляет часть этой площади в долях
единицы (или в процентах). Другими
словами, в интервале от -Dх(Р)
до +Dх(Р)
с заданной вероятностью Р
встречаются Р×100%
всех возможных значений случайной
погрешности.
Доверительный интервал
для нормального распределения находится
по формуле:
                                
Какими свойствами обладает нормальное распределение результатов измеренийгде
коэффициентt
зависит от доверительной вероятности
Р.
Для
нормального распределения существуют
следующие соотношения между доверительными
интервалами и доверительной вероятностью:
1s (Р=0,68), 2s (Р= 0,95), 3s (Р= 0,997), 4s (Р=0,999).

Доверительные
вероятности для выражения результатов
измерений и погрешностей  в различных
областях науки и техники принимаются
равными. Так, в технических измерениях
принята доверительная вероятность
0,95. Лишь для особо точных и ответственных
измерений принимают более высокие
доверительные вероятности. В метрологии
используют, как правило,  доверитель-ные
вероятности 0,97, в исключительных случаях
0,99. Необходимо отметить, что точность
измерений должна соответствовать
поставленной измерительной задаче.
Излишняя точность ведет к неоправданному
расходу средств. Недостаточная точность
измерений может привести к принятию
по его результатам ошибочных решений
с самыми непредсказуемыми последствиями,
вплоть до серьезных материальных потерь
или катастроф.

При
проведении многократных измерений
величины х,
подчиняющейся нормальному распределению,
доверительный интервал может быть
построен для любой доверительной
вероятности по формуле:

                                
Какими свойствами обладает нормальное распределение результатов измеренийгдеtq
коэффициент Стьюдента, зависящий от
числа наблюдений n
и выбранной доверительной вероятности
Р.
Он определяется с помощью таблицы
q-процентных
точек распределения Стьюдента, которая
имеет два параметра: k
= n

– 1 и  q=
1 – P
Какими свойствами обладает нормальное распределение результатов измерений
оценка среднего квадратического
отклонения среднего арифметического.
Доверительный
интервал для погрешностиDх(Р)
позволяет построить доверительный
интервал для истинного (действительного)
значения измеряемой величины
,
оценкой которой является среднее
арифметическое
Какими свойствами обладает нормальное распределение результатов измерений.
Истинное значение измеряемой величины
находится с доверительной вероятностью
Р внутри интервала:Какими свойствами обладает нормальное распределение результатов измерений.
Доверительный интервал позволяет
выяснить, насколько может измениться
полученная в результате данной серии
измерений оценка измеряемой величины
при проведении повторной серии измерений
в тех же условиях. Необходимо отметить,
что доверительные интервалы строят
длянеслучайных
величин
,
значения которых неизвестны. Такими
являются истинное значение измеряемой
величины и средние квадратические
отклонения. В то же время оценки этих
величин, получаемые в результате
обработки данных наблюдений, являются
случайными величинами.
Недостатком 
доверительных интервалов при оценке
случай-ных погрешностей является то,
что при произвольно выбираемых
доверительных вероятностях нельзя
суммировать несколько погреш-ностей,
т.к. доверительный интервал суммы не
равен сумме довери-тельных интервалов
Суммируются
дисперсии независимых случай-ных
величин:
D
å
= åDi.
То есть, для возможности суммирования
составляющие случайной погрешности
должны быть представлены своими СКО,
а не предельными или доверительными
погрешностями.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Источник