То есть дисперсия — это математическое ожидание отклонений от математического ожидания. Для нахождения среднего квадратического отклонения найдем сначала значение дисперсии. Сегодня узнаем, что такое дисперсия, среднеквадратичное отклонение и коэффициент вариации. Разница между отдельным значением и средней отражает меру отклонения. Математическое ожидание и дисперсия (или среднее квардратическое отклонение ) – наиболее часто применяемые характеристики случайной величины.


В общем смысле среднеквадратическое отклонение можно считать мерой неопределённости. К примеру, в физике среднеквадратическое отклонение используется для определения погрешности серии последовательных измерений какой-либо величины. Получили, что для двух различных законов распределения математическое ожидание принимает одинаковое значения (0), при этом возможные значения случайных величин и различаются. Также следует помнить, что дисперсия всегда принимает неотрицательные значения . Она характеризует рассеяние случайной величины относительно своего математического ожидания.

Дисперсия случайной величины

Построить закон распределения дискретной случайной величины — число лампочек, которые будут опробованы. Подобных примеров можно привести множество, основная их суть в правильном применении приведенных в начале статьи формул для вычисления дисперсии и математического ожидания.

Во многих практически важных случаях существенным является вопрос о том, насколько велики отклонения случайной величины от ее математического ожидания. Однако разброс значений этих величин относительно их математического ожидания неодинаков. Казалось бы естественным рассматривать не квадрат отклонения, а просто отклонение случайной величины от ее математического ожидания. Из предыдущей статьи мы узнали о таких показателя, как размах вариации, межквартильный размах и среднее линейное отклонение.

Эти показатели достаточно часто встречаются в литературе и различных публикациях, поэтому с ними следует хорошенько разобраться. При расчете этого показателя, чтобы избежать взаимопогашения положительных и отрицательных отклонений, используется модуль, то есть каждое отклонение от средней берется с положительным знаком.

Если матожидание отражает центр случайной величины, то дисперсия дает характеристику разброса данных вокруг центра. Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии.

Среднеквадратичное отклонение

Язык знаков полезно перевести на язык слов. Получится, что дисперсия — это средний квадрат отклонений. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании.

Однако в чистом виде, как, например, средняя арифметическая, или индекс, дисперсия не используется. Дабы вернуть дисперсию в реальность, то есть использовать в более приземленных целей, из нее извлекают квадратный корень. Но и этот показатель в чистом виде не очень информативен, так как в нем заложено слишком много промежуточных расчетов, которые сбивают с толку (отклонение, в квадрат, сумма, среднее, корень).

Коэффициент вариации

К примеру, есть такое правило трех сигм, которое гласит, что у нормально распределенных данных 997 значений из 1000 находятся в пределах ±3 сигмы от средней арифметической. Среднеквадратичное отклонение, как мера неопределенности, также участвует во многих статистических расчетах. Если вариация очень большая, то стандартное отклонение тоже получится большим, следовательно, и прогноз будет неточным, что выразится, к примеру, в очень широких доверительных интервалах.

Среднее квадратическое отклонение дает абсолютную оценку меры разброса. Коэффициент вариации измеряется в процентах (если умножить на 100%). По этому показателю можно сравнивать однородность самых разных явлений независимо от их масштаба и единиц измерения.

Он имеет размерность куба случайной величины: чтобы получить безразмерную характеристику, третий момент делят на куб среднего квадратического отклонения

Возьмем пример с расчетом среднего линейного отклонения (из предыдущей статьи). Среднее значение – это обычная средняя арифметическая. Дисперсия – это сигма в квадрате, поэтому она всегда будет относительно большим числом, что, собственно, ни о чем не говорит. Размах вариации – это разница между крайними значениями и может говорить о многом. Коэффициент вариации измеряется в процентах и может быть использован для сравнения вариации различных процессов и явлений.

В серьезных учебниках по статистике я такого вообще не видел )). Но речь о том, что в случае неоднородности выборки обобщающие характеристики (типа средней) не информативны. Для составления закона распределения этой случайной величины необходимо определить соответствующие вероятности. Кроме характеристик положения – средних, типичных значений случайной величины, — употребляется еще ряд характеристик, каждая из которых описывает то или иное свойство распределения.

Таки образом, отклонение не может быть мерой рассеивания случайной величины. Как и матожидание, дисперсия является важной характеристикой случайной величины. Как видно, среднее линейное и среднеквадратичное отклонение дают похожие значения степени вариации данных.

Еще фишки:

Комментарии запрещены.

Навигация по записям