Какого свойства дисперсии не существует
Важное значение
для характеристики случайных величин
имеет дисперсия.
Определение.
Дисперсией случайной
величины называется математическое
ожидание квадрата отклонения случайной
величины от ее математического ожидания
.
Слово «дисперсия»
означает «рассеяние», т.е. дисперсия
характеризует рассеяние (разбросанность)
значений случайной величины около ее
математического ожидания.
Из определения
следует, что дисперсия – это постоянная
величина, т.е. числовая характеристика
случайной величины, которая имеет
размерность квадрата случайной величины.
С
вероятной точки зрения,
дисперсия является мерой рассеяния
значений случайной величины около ее
математического ожидания.
Действительно,
рассмотрим дискретную случайную
величину, которая имеет конечное
множество значений. Тогда, согласно
определению, дисперсия вычисляется по
формуле
. (2)
Если
дисперсия
мала, то из формулы (2) следует, что малы
слагаемые.
Поэтому, если не рассматривать значения,
которым соответствует малая вероятность
(такие значения практически невозможны),
то все остальные значениямало отклоняются от математического
ожидания.
Следовательно,при
малой дисперсии возможные значения
случайной величины концентрируются
около ее математического ожидания (за
исключением, может быть, сравнительно
малого числа отдельных значений). Если
дисперсия
велика, то это означает большой разброс
значений случайной величины, концентрация
значений случайной величины около
какого-нибудь центра исключается.
Пример.Пусть
случайные величины
иимеют следующее законы распределения
Таблица
9.
Таблица 10.
-0,1 | 0,1 | 0,4 | -10 | 0,5 | 10 | |||
0,3 | 0,15 | 0,3 | 0,25 | 0,4 | 0,2 | 0,4 |
Найти математические
ожидания и дисперсии этих случайных
величин.
Решение.
Воспользовавшись
формулой для вычисления математических
ожиданий, находим
.
.
С помощью формулы
(2) вычислим дисперсии заданных случайных
величин
.
Из
полученных результатов делаем вывод:
математические ожидания случайных
величин
иодинаковы, однако дисперсии различны.
Дисперсия случайной величинымала и мы видим, что ее значение
сконцентрированы около ее математического
ожидания.
Напротив, значения случайной величинызначительно рассеяны относительно,
а поэтому дисперсияимеет большое значение. ●
Свойства дисперсии
Свойство
1.
Дисперсия постоянной величины равна
нулю
.
Доказательство.
Свойство
2.
Постоянный множитель можно выносить
за знак дисперсии, возводя его в квадрат
.
Доказательство.
Свойство
3.
Дисперсия
суммы двух независимых случайных величин
равна сумме их дисперсий
.
Доказательство.Воспользуемся
определением дисперсии и свойствами
3, 2 математического ожидания, имеем
(3)
Определение.Математическое
ожидание произведения отклонений
случайных величин
и
от их математических ожиданий называется
корреляционным
моментом этих
величин
.
Если
случайные величины, величины
инезависимы, то, воспользовавшись
свойствами 6 и 7 математических ожиданий,
находим
.
Поэтому из формулы
3 имеем
,
откуда окончательно
следует
.
●
С помощью метода
математической индукции это свойство
может быть распространено на случай
любого конечного числа независимых
случайных величин.
Свойство
4.Дисперсия
суммы независимых случайных величин
равна сумме их дисперсий
.
●
Свойство
5.
Дисперсия
разности двух случайных независимых
величин равна сумме дисперсий этих
величин
.
Доказательство.
Свойство
6.Дисперсия
случайной величины равна математическому
ожиданию
квадрата этой
величины минус квадрат ее математического
ожидания
.
(Эта формула
применяется для вычисления дисперсии)
Доказательство.
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
28.02.2016185.86 Кб54.doc
- #
- #
- #
- #
- #
- #
- #
- #
Источник
В различных научных дисциплинах словосочетание «дисперсия это» характеризует мало схожие понятия. С латыни «dispersio» переводится как «рассеяние».
В физике, например, означает связь фазовой скорости волны с частотой. В химии описывает несмешиваемые субстанции. В биологии – многообразие признаков популяции.
В данной статье речь пойдет о математической трактовке. Рассматривается как одно из свойств случайных величин.
Что такое дисперсия в статистике
Статистика, в частности, оперирует рядами данных, характеризующих какой-либо признак, явление. Интересует их изменение.
Вариация представляет собой отличие величин одинакового показателя у разных предметов. Ее изучение позволит понять причины отклонений от нормы, анализировать их и в какой-то мере прогнозировать. Также станет возможным выявить факторы, влияющие на значения, отсеяв случайные.
Характеристики равномерного распределения представлены на картинке:
При значительном объеме статистики, средняя величина очевидно близка к нормальной. Об этом говорят и законы распределения. Отклонения от нее будут являться объективной характеристикой.
Только вот отрицательные значения этих разбросов будут сбивать с толку при расчетах, погашая положительные. А оставлять лишь модули – для математика не корректно. Напрашивается возвести в четную степень, а именно – во вторую.
Решение оказалось не только удобным. Оно открыло бо́льшие возможности в изучении отклонений. А важны именно они, поскольку сама по себе средняя мало что дает.
В качестве одного из важных показателей вариации, вводится понятие «дисперсия» – усредненный квадрат отклонений численных значений каких-либо событий от средней величины.
Кратко записывается D[X] в русскоязычных источниках и Var[X] (от «variance») в английских. В статистических выкладках используется σ2.
Никакого наглядного смысла величина не несет. Другое дело, среднее квадратическое отклонение – корень квадратный из дисперсии.
Виды дисперсии дискретной случайной величины
Для анализа данных цифр в таком виде недостаточно. Гораздо больше можно выжать из последовательности, если разбить ее на группы по определенному признаку.
Общая дисперсия
Как можно заметить, вычисленная по приведенному выше определению величина характеризует отклонения в целом. Без учета определяющих вариацию факторов. Вернее, с учетом всех, включая совершенно случайные. Поэтому и называется «общей» и рассчитывается по формулам, указанным ниже.
Простая дисперсия, без разделения на группы:
Или в несколько преобразованном виде:
Взвешенная дисперсия, для вариационного ряда:
где xi – значение из ряда;
fi – частота, количество повторений;
k – групп;
n – число вариантов.
Черта сверху указывает на среднюю величину.
Межгрупповая дисперсия
Характеризует систематическое отклонение, возникающее из-за фактора, по которому производилось выделение признаков в группы. Поэтому также называется «факторной».
Как найти данную дисперсию? По формуле:
где k – количество групп;
nj – элементов в группе с индексом j.
Внутригрупповая дисперсия
Возникает по хаотичной причине, не связанной с причиной сделанной выборки. Неучтенный фактор. Еще обозначается как «остаточная».
Например, рассматривается количество выпущенных деталей за месяц каждым фрезеровщиком цеха.
В качестве критерия отбора в группу выбираем возраст оборудования. Он-то и не будет влиять на производительность внутри подборки: там станки у всех практически одинаковые.
Если вычислить среднюю величину от всех групповых,
то получим характеристику случайного разброса. Иными словами, составляющую вариации, зависящую от чего угодно, кроме фактора отбора.
Взаимосвязь
В соответствии с правилом сложения, общая D[X] включает средние выражения остаточной и факторной. И это логично, поскольку учитывает и случайное изменение в группе, и систематическое в факторной.
Свойства дисперсии
Опишем основные:
Если последовательность состоит из одинаковых чисел, то D[X] будет нулевой.
Уменьшение всех значений на постоянную величину на дисперсию не влияет. Иначе говоря, рассчитать σ2 можно по отклонениям от фиксированного числа.
Уменьшение всех цифр в k раз приведет к падению D[X] в k2 раз. Можно, например, иметь в виду значения в метрах, а результат вычислить в футах. Достаточно учесть один раз то, на что следует умножить.
Средний квадрат отклонений от постоянной величины X отличается в большую сторону от того же с использованием среднего значения. Разница составит (Xcр – X)2.
Показатели вариаций
Кроме размаха (разницы максимального и минимального значений), среднего линейного и дисперсии, изменения описываются коэффициентом вариации:
Оценить масштаб разброса проще по относительной величине. Тем более, что измеряются в одних единицах.
Пример расчета дисперсии
Компания объявила конкурсный отбор для приема сотрудников. В качестве критерия принят стаж работы по специальности. Приведем исходные данные и расчеты.
Усредненный стаж:
Дисперсия:
По альтернативной формуле:
Среднеквадратическое:
Коэффициент вариации:
Заключение
Статистика оперирует значительными объемами данных. Вариация, как одно из основных понятий – не исключение. И дисперсия в качестве основной характеристики.
Для упрощения расчетов существует масса онлайн калькуляторов. Имеется упомянутый инструмент в MS Excel.
Источник
Получить выполненную работу или консультацию специалиста по вашему
учебному проекту
Узнать стоимость
Свойства дисперсии.
1. Дисперсия постоянной величины равна 0.
.
2. Если из каждой варианты отнять постоянное число А, то значение дисперсии не изменится. Уменьшение всех значений признака на одну и ту же величину А не меняет величины дисперсии:
.
Значит, средний квадрат отклонений можно вычислить не по заданным значениям признака, а по отклонениям их от какого-то постоянного числа.
3. Если все значения признака разделить на какое-то постоянное число А, то дисперсия уменьшится в А2 раз. Уменьшение всех значений признака в А раз уменьшает дисперсию в А2 раз, а среднее квадратическое отклонение – в А раз.
Значит, все значения признака можно разделить на какое-то постоянное число (скажем, на величину интервала ряда), исчислить среднее квадратическое отклонение, а затем умножить его на постоянное число:
.
4. Если исчислить средний квадрат отклонений от любой величины А, которая отличается от средней арифметической , тогда он будет больше среднего квадрата отклонения σ2, исчисленной от средней арифметической:
Средний квадрат отклонений при этом будет больше на вполне определенную величину – на квадрат разности средней и этой условно взятой величины, т.е. на :
, или .
Обоснование:
Если A=0, тогда
Таким образом:
Значит, дисперсия от средней всегда меньше дисперсий, исчисленных от любых других величин, т.е. она имеет свойство минимальности.
Если воспользоваться 3 и 4 свойствами, то получим формулу (способ моментов):
где m1, m2 – моменты первого и второго порядков соответственно, А – центральное значение (величина) варианта, i – величина интервала.
Пример. Расчет дисперсии способом моментов.
Распределение предприятий по объему товарооборота.
Группы предприятий по объему товарооборота, млн. руб. | Число предприятий (f) | Середина интервала (x) | x*f | |||
60-80 | 21 | 70 | -2 | -42 | 84 | |
80-100 | 27 | 90 | -1 | -27 | 27 | |
100-120 | 24 | 110 | ||||
120-140 | 16 | 130 | 1 | 16 | 16 | |
140-160 | 8 | 150 | 2 | 16 | 32 | |
160-180 | 4 | 170 | 3 | 12 | 36 | |
Всего: | 100 | -25 | 195 |
i=20 млн. руб.
Среднее квадратическое отклонение играет важную роль в анализе рядов распределения. В условиях нормального распределения существует следующая зависимость между величиной среднего квадратического отклонения и количеством наблюдений:
– в пределах располагается 0,683, или 68,3%, количество наблюдений;
– – 0,954, или 95,4%, количества наблюдений;
– в пределах – 0,997, или 99,7%, количества наблюдений.
В действительности на практике почти не встречаются отклонения, которые превышают . Отклонение может считаться максимально возможным. Это положение называют «правилом трех сигм».
Виды дисперсий, правила сложения дисперсий.
Для того, чтобы определить влияние отдельных факторов, характеризующих колеблемость индивидуальных значений признака, нужно разделить изучаемую совокупность на группы, однородные по признаку-фактору.
При этом можно определить три вида дисперсии:
– общая дисперсия;
– межгрупповая дисперсия;
– внутригрупповая дисперсия.
Общая дисперсия (σ2) измеряет вариацию признака по всей совокупности под влиянием всех факторов:
Межгрупповая дисперсия ()отражает вариацию изучаемого признака, которая возникает под влиянием признака-фактора, положенного в основу группировки. Она характеризует колеблемость групповых средних около общей средней :
, где ni – численности отдельных групп.
Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, происходящей под влиянием неучтенных факторов и независящую от признака фактора, положенного в основание группировки. Она исчисляется следующим образом:
Определим среднюю из внутригрупповых дисперсий:
Общая дисперсия, межгрупповая дисперсия и средняя из внутригрупповых дисперсий связаны между собой следующим соотношением:
Данное соотношение называется правилом сложения дисперсий. Согласно этому правилу, общая дисперсия, возникающая под действием всех факторов, равна сумме дисперсии, появляющейся под влиянием всех прочих факторов, и дисперсии, возникающей за счет группировочного признака. Широко применяется при исчислении показателей тесноты связи, дисперсионном анализе и в других случаях.
Показатель, представляющий собой долю межгрупповой дисперсии, называется эмпирическим коэффициентом детерминации:
Этот коэффициент показывает долю общей вариации изучаемого признака, обусловленную вариацией группировочного признака.
Эмпирическое корреляционное отношение:
, где 0≤η≤1.
Оно характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака.
Если η=0, то группировочный признак не оказывает влияние на результативный. Если η=1, то результативный признак изменяется только в зависимости от признака, положенного в основание группировки.
Квантили.
Рис. Ранжирование ряда распределения.
В вариационном ряду распределения кроме медианы можно определить квартили, децили и процентили, которые получили общее название квантили.
Квартили представляют собой значение признака, делящее ранжированную совокупность на четыре равновеликие части. Первый квартиль (нижний квартиль) Q1, отделяющий одну четвертую часть совокупности, с наименьшими значениями признака. Q2 – средний квартиль, медиана, делящая ранжированную совокупность пополам. Q3 – верхний квартиль, отделяющий одну четвертую часть совокупности с наибольшими значениями признака.
Децили – варианты, делящие совокупность на 10 равных частей. Первый дециль D1 отделяет от начала совокупности одну десятую часть ряда с наименьшими значениями признака. Второй дециль отделяет две десятые ряда. Перцентили – варианты, которые делят совокупность на сто равных частей. Они используются для детального изучения структуры вариационного ряда.
Внимание!
Если вам нужна помощь в написании работы, то рекомендуем обратиться к
профессионалам. Более 70 000 авторов готовы помочь вам прямо сейчас. Бесплатные
корректировки и доработки. Узнайте стоимость своей работы.
Источник
В различных научных дисциплинах словосочетание «дисперсия это» характеризует мало схожие понятия. С латыни «dispersio» переводится как «рассеяние».
В физике, например, означает связь фазовой скорости волны с частотой. В химии описывает несмешиваемые субстанции. В биологии – многообразие признаков популяции.
В данной статье речь пойдет о математической трактовке. Рассматривается как одно из свойств случайных величин.
Что такое дисперсия в статистике
Статистика, в частности, оперирует рядами данных, характеризующих какой-либо признак, явление. Интересует их изменение.
Вариация представляет собой отличие величин одинакового показателя у разных предметов. Ее изучение позволит понять причины отклонений от нормы, анализировать их и в какой-то мере прогнозировать. Также станет возможным выявить факторы, влияющие на значения, отсеяв случайные.
Характеристики равномерного распределения представлены на картинке:
При значительном объеме статистики, средняя величина очевидно близка к нормальной. Об этом говорят и законы распределения. Отклонения от нее будут являться объективной характеристикой.
Только вот отрицательные значения этих разбросов будут сбивать с толку при расчетах, погашая положительные. А оставлять лишь модули – для математика не корректно. Напрашивается возвести в четную степень, а именно – во вторую.
Решение оказалось не только удобным. Оно открыло бо́льшие возможности в изучении отклонений. А важны именно они, поскольку сама по себе средняя мало что дает.
В качестве одного из важных показателей вариации, вводится понятие «дисперсия» – усредненный квадрат отклонений численных значений каких-либо событий от средней величины.
Кратко записывается D[X] в русскоязычных источниках и Var[X] (от «variance») в английских. В статистических выкладках используется σ2.
Никакого наглядного смысла величина не несет. Другое дело, среднее квадратическое отклонение – корень квадратный из дисперсии.
Виды дисперсии дискретной случайной величины
Для анализа данных цифр в таком виде недостаточно. Гораздо больше можно выжать из последовательности, если разбить ее на группы по определенному признаку.
Общая дисперсия
Как можно заметить, вычисленная по приведенному выше определению величина характеризует отклонения в целом. Без учета определяющих вариацию факторов. Вернее, с учетом всех, включая совершенно случайные. Поэтому и называется «общей» и рассчитывается по формулам, указанным ниже.
Простая дисперсия, без разделения на группы:
Или в несколько преобразованном виде:
Взвешенная дисперсия, для вариационного ряда:
где xi – значение из ряда;
fi – частота, количество повторений;
k – групп;
n – число вариантов.
Черта сверху указывает на среднюю величину.
Межгрупповая дисперсия
Характеризует систематическое отклонение, возникающее из-за фактора, по которому производилось выделение признаков в группы. Поэтому также называется «факторной».
Как найти данную дисперсию? По формуле:
где k – количество групп;
nj – элементов в группе с индексом j.
Внутригрупповая дисперсия
Возникает по хаотичной причине, не связанной с причиной сделанной выборки. Неучтенный фактор. Еще обозначается как «остаточная».
Например, рассматривается количество выпущенных деталей за месяц каждым фрезеровщиком цеха.
В качестве критерия отбора в группу выбираем возраст оборудования. Он-то и не будет влиять на производительность внутри подборки: там станки у всех практически одинаковые.
Если вычислить среднюю величину от всех групповых,
то получим характеристику случайного разброса. Иными словами, составляющую вариации, зависящую от чего угодно, кроме фактора отбора.
Взаимосвязь
В соответствии с правилом сложения, общая D[X] включает средние выражения остаточной и факторной. И это логично, поскольку учитывает и случайное изменение в группе, и систематическое в факторной.
Свойства дисперсии
Опишем основные:
Если последовательность состоит из одинаковых чисел, то D[X] будет нулевой.
Уменьшение всех значений на постоянную величину на дисперсию не влияет. Иначе говоря, рассчитать σ2 можно по отклонениям от фиксированного числа.
Уменьшение всех цифр в k раз приведет к падению D[X] в k2 раз. Можно, например, иметь в виду значения в метрах, а результат вычислить в футах. Достаточно учесть один раз то, на что следует умножить.
Средний квадрат отклонений от постоянной величины X отличается в большую сторону от того же с использованием среднего значения. Разница составит (Xcр – X)2.
Показатели вариаций
Кроме размаха (разницы максимального и минимального значений), среднего линейного и дисперсии, изменения описываются коэффициентом вариации:
Оценить масштаб разброса проще по относительной величине. Тем более, что измеряются в одних единицах.
Пример расчета дисперсии
Компания объявила конкурсный отбор для приема сотрудников. В качестве критерия принят стаж работы по специальности. Приведем исходные данные и расчеты.
Усредненный стаж:
Дисперсия:
По альтернативной формуле:
Среднеквадратическое:
Коэффициент вариации:
Заключение
Статистика оперирует значительными объемами данных. Вариация, как одно из основных понятий – не исключение. И дисперсия в качестве основной характеристики.
Для упрощения расчетов существует масса онлайн калькуляторов. Имеется упомянутый инструмент в MS Excel.
Предыдущая
АлгебраПравило Лопиталя для вычисления пределов, примеры с подробным решением, доказательство
Следующая
АлгебраКоординаты вектора как найти длину отрезка по двум точкам, правило и формула нахождения в пространстве, свойства, задачи с решением, онлайн-калькулятор
Источник