Выборочная ⚠️ дисперсия

Виды дисперсии дискретной случайной величины

Для анализа данных цифр в таком виде недостаточно. Гораздо больше можно выжать из последовательности, если разбить ее на группы по определенному признаку.

Общая дисперсия

Как можно заметить, вычисленная по приведенному выше определению величина характеризует отклонения в целом. Без учета определяющих вариацию факторов. Вернее, с учетом всех, включая совершенно случайные. Поэтому и называется «общей» и рассчитывается по формулам, указанным ниже.

Простая дисперсия, без разделения на группы:

Или в несколько преобразованном виде:

Взвешенная дисперсия, для вариационного ряда:

где xi – значение из ряда;

fi – частота, количество повторений;

k – групп;

n – число вариантов.

Черта сверху указывает на среднюю величину.

Межгрупповая дисперсия

Характеризует систематическое отклонение, возникающее из-за фактора, по которому производилось выделение признаков в группы. Поэтому также называется «факторной». 

Как найти данную дисперсию? По формуле:

где k – количество групп;

nj – элементов в группе с индексом j.

Внутригрупповая дисперсия

Возникает по хаотичной причине, не связанной с причиной сделанной выборки. Неучтенный фактор. Еще обозначается как «остаточная».

Например, рассматривается количество выпущенных деталей за месяц каждым фрезеровщиком цеха. 

В качестве критерия отбора в группу выбираем возраст оборудования. Он-то и не будет влиять на производительность внутри подборки: там станки у всех практически одинаковые.

Если вычислить среднюю величину от всех групповых,

то получим характеристику случайного разброса. Иными словами, составляющую вариации, зависящую от чего угодно, кроме фактора отбора.

Взаимосвязь

В соответствии с правилом сложения, общая D[X] включает средние выражения остаточной и факторной. И это логично, поскольку учитывает и случайное изменение в группе, и систематическое в факторной.

Исправленная дисперсия

Математически выборочная дисперсия не соответствует генеральной, поскольку выборочная используется для смещенного оценивания генеральной дисперсии. По этой причине математическое ожидание выборочной дисперсии вычисляется так:

\(M\left[D_B\right]=\frac{n-1}nD_Г\)

В данной формуле DГ – это истинное значение дисперсии генеральной совокупности.

Исправить выборочную дисперсию можно путем умножения ее на дробь:

\(\frac n{n-1}\)

Получим формулу следующего вида:

\(S^2=\frac n{n-1}\cdot D_В=\frac{\displaystyle\sum_{i=1}^kn_i{(x_i-{\overline x}_В)}^2}{n-1}\)

Исправленная дисперсия используется для несмещенной оценки генеральной дисперсии и обозначается S2

Среднеквадратическая генеральная совокупность оценивается при помощи исправленного среднеквадратического отклонения, которое вычисляется по формуле:

\(S=\sqrt{S^2}\)

При нахождении выборочной и исправленной дисперсии разнятся лишь знаменатели в формулах. Различия в этих характеристиках при больших n незначительны. Применение исправленной дисперсии целесообразно при объеме выборки меньше 30.

Видео

Связь выборочной и генеральной дисперсии

Генеральная дисперсия представляет собой среднее арифметическое квадратов отступлений значений признаков генеральной совокупности от их среднего значения.

Осторожно! Если преподаватель обнаружит плагиат в работе, не избежать крупных проблем (вплоть до отчисления). Если нет возможности написать самому, закажите тут.

Определение

Генеральная совокупность – это комплекс всех возможных объектов, относительно которых планируется вести наблюдение и формулировать выводы.

Выборочная совокупность или выборка является частью генеральной совокупности, выбранной для изучения и составления заключения касательной всей генеральной совокупности.

Виды дисперсии

Общая дисперсия измеряет вариацию признака по всей совокупности в целом под влиянием всех факторов, обуславливающих эту вариацию. Она равняется среднему квадрату отклонений отдельных значений признака х от общего среднего значения х и может быть определена как простая дисперсия или взвешенная дисперсия.

Внутригрупповая дисперсия характеризует случайную вариацию, т.е. часть вариации, которая обусловлена влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Такая дисперсия равна среднему квадрату отклонений отдельных значений признака внутри группы X от средней арифметической группы и может быть вычислена как простая дисперсия или как взвешенная дисперсия.

Таким образом, внутригрупповая дисперсия измеряет вариацию признака внутри группы и определяется по формуле:

где хi — групповая средняя;
 ni — число единиц в

где хi — групповая средняя; ni — число единиц в группе.

Например, внутригрупповые дисперсии, которые надо определить в задаче изучения влияния квалификации рабочих на уровень производительности труда в цехе показывают вариации выработки в каждой группе, вызванные всеми возможными факторами (техническое состояние оборудования, обеспеченность инструментами и материалами, возраст рабочих, интенсивность труда и т.д.), кроме отличий в квалификационном разряде (внутри группы все рабочие имеют одну и ту же квалификацию).

Средняя из внутри групповых дисперсий отражает случайную вариацию, т. е. ту часть вариации, которая происходила под влиянием всех прочих факторов, за исключением фактора группировки. Она рассчитывается по формуле:

Межгрупповая дисперсия характеризует систематическ

Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, которая обусловлена влиянием признака-фактора, положенного в основание группировки. Она равняется среднему квадрату отклонений групповых средних от общей средней. Межгрупповая дисперсия рассчитывается по формуле:

Как работает калькулятор дисперсии?

Онлайн-калькулятор дисперсии совокупности вычисляет дисперсию для заданных наборов данных. Вы можете просмотреть работу, проделанную для расчет дисперсии онлайн из набора данных, следуя этим инструкциям:

Вход:

  • Сначала введите значения набора данных через запятую.
  • Затем выберите дисперсию для выборки или совокупности.
  • Нажмите кнопку «Рассчитать», чтобы получить результаты.

Выход:

  • Калькулятор дисперсии выборки отображает дисперсию, стандартное отклонение, количество, сумму, среднее значение, коэффициент дисперсии и сумму квадратов.
  • Этот калькулятор также обеспечивает пошаговые вычисления дисперсии, коэффициента дисперсии и стандартного отклонения.

Пример расчета дисперсии

Компания объявила конкурсный отбор для приема сотрудников. В качестве критерия принят стаж работы по специальности. Приведем исходные данные и расчеты.

Усредненный стаж:

Дисперсия:

По альтернативной формуле:

Среднеквадратическое:

Коэффициент вариации:

Расчет cреднеквадратичного (стандартного) отклонения в Excel

Для расчета стандартного отклонения достаточно из дисперсии извлечь квадратный корень. Но в Excel есть и готовые функции: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В (по генеральной и выборочной совокупности соответственно).

Среднеквадратичное отклонение имеет те же единицы

Среднеквадратичное отклонение имеет те же единицы измерения, что и анализируемый показатель, поэтому является сопоставимым с исходными данными.

Расчет коэффициента вариации в Excel

Расчет коэффициента вариации в Excel также производится делением стандартного отклонения на среднее арифметическое:

=СТАНДОТКЛОН.В()/СРЗНАЧ()

Коэффициент вариации обычно выражается в процентах, поэтому ячейке с формулой можно присвоить процентный формат:

Пример нахождения дисперсии

Рассмотрим простые примеры, показывающие как найти дисперсию по формулам, введеным выше.

Пример 1. Вычислить и сравнить дисперсию двух законов распределения: $$ x_i \quad 1 \quad 2 \\ p_i \quad 0.5 \quad 0.5 $$ и $$ y_i \quad -10 \quad 10 \\ p_i \quad 0.5 \quad 0.5 $$

Для убедительности и наглядности расчетов мы взяли простые распределения с двумя значениями и одинаковыми вероятностями. Но в первом случае значения случайной величины расположены рядом (1 и 2), а во втором — дальше друг от друга (-10 и 10). А теперь посмотрим, насколько различаются дисперсии: $$ D(X)=\sum_{i=1}^{n}{x_i^2 \cdot p_i}-\left(\sum_{i=1}^{n}{x_i \cdot p_i} \right)^2 =\\ = 1^2\cdot 0.5 + 2^2 \cdot 0.5 — (1\cdot 0.5 + 2\cdot 0.5)^2=2.5-1.5^2=0.25. $$ $$ D(Y)=\sum_{i=1}^{n}{y_i^2 \cdot p_i}-\left(\sum_{i=1}^{n}{y_i \cdot p_i} \right)^2 =\\ = (-10)^2\cdot 0.5 + 10^2 \cdot 0.5 — (-10\cdot 0.5 + 10\cdot 0.5)^2=100-0^2=100. $$ Итак, значения случайных величин различались на 1 и 20 единиц, тогда как дисперсия показывает меру разброса в 0.25 и 100. Если перейти к среднеквадратическому отклонению, получим $\sigma(X)=0.5$, $\sigma(Y)=10$, то есть вполне ожидаемые величины: в первом случае значения отстоят в обе стороны на 0.5 от среднего 1.5, а во втором — на 10 единиц от среднего 0.

Ясно, что для более сложных распределений, где число значений больше и вероятности не одинаковы, картина будет более сложной, прямой зависимости от значений уже не будет (но будет как раз оценка разброса).

Пример 2. Найти дисперсию случайной величины Х, заданной дискретным рядом распределения: $$ x_i \quad -1 \quad 2 \quad 5 \quad 10 \quad 20 \\ p_i \quad 0.1 \quad 0.2 \quad 0.3 \quad 0.3 \quad 0.1 $$

Снова используем формулу для дисперсии дискретной случайной величины: $$ D(X)=M(X^2)-(M(X))^2. $$ В случае, когда значений много, удобно разбить вычисления по шагам. Сначала найдем математическое ожидание: $$ M(X)=\sum_{i=1}^{n}{x_i \cdot p_i} =-1\cdot 0.1 + 2 \cdot 0.2 +5\cdot 0.3 +10\cdot 0.3+20\cdot 0.1=6.8. $$ Потом математическое ожидание квадрата случайной величины: $$ M(X^2)=\sum_{i=1}^{n}{x_i^2 \cdot p_i} = (-1)^2\cdot 0.1 + 2^2 \cdot 0.2 +5^2\cdot 0.3 +10^2\cdot 0.3+20^2\cdot 0.1=78.4. $$ А потом подставим все в формулу для дисперсии: $$ D(X)=M(X^2)-(M(X))^2=78.4-6.8^2=32.16. $$ Дисперсия равна 32.16 квадратных единиц.

Пример 3. Найти дисперсию по заданному непрерывному закону распределения случайной величины Х, заданному плотностью $f(x)=x/18$ при $x \in(0,6)$ и $f(x)=0$ в остальных точках.

Используем для расчета формулу дисперсии непрерывной случайной величины: $$ D(X)=\int_{-\infty}^{+\infty} f(x) \cdot x^2 dx — \left( \int_{-\infty}^{+\infty} f(x) \cdot x dx \right)^2. $$ Вычислим сначала математическое ожидание: $$ M(X)=\int_{-\infty}^{+\infty} f(x) \cdot x dx = \int_{0}^{6} \frac{x}{18} \cdot x dx = \int_{0}^{6} \frac{x^2}{18} dx = \left.\frac{x^3}{54} \right|_0^6=\frac{6^3}{54} = 4. $$ Теперь вычислим $$ M(X^2)=\int_{-\infty}^{+\infty} f(x) \cdot x^2 dx = \int_{0}^{6} \frac{x}{18} \cdot x^2 dx = \int_{0}^{6} \frac{x^3}{18} dx = \left.\frac{x^4}{72} \right|_0^6=\frac{6^4}{72} = 18. $$ Подставляем: $$ D(X)=M(X^2)-(M(X))^2=18-4^2=2. $$ Дисперсия равна 2.

Другие задачи с решениями по ТВ

Подробно решим ваши задачи на вычисление дисперсии

Отправьте задание сейчас!

Связь с центральным моментом [ править]

Определение:
Центральным моментом (англ. central moment) -ого порядка случайной величины называется величина , определяемая формулой .

Заметим, что если равно двум, то . Таким образом, дисперсия является центральным моментом второго порядка.

Свойства дисперсии

1. Если все значения признака уменьшить (увеличить) на одну и ту же постоянную величину, то дисперсия от этого не изменится. 2. Если все значения признака уменьшить (увеличить) в одно и то же число раз n, то дисперсия соответственно уменьшится (увеличить) в n^2 раз.

Теги

Популярные:

Последние:

Adblock
detector