Доверительный интервал правило трех сигм. Нормальное распределение случайной величины и правило трех сигм

Из данной статьи вы узнаете:

    Что такое доверительный интервал ?

    В чем суть правила 3-х сигм ?

    Как можно применить эти знания на практике?

В наше время из-за переизбытка информации, связанного с большим ассортиментом товаров, направлений продаж, сотрудников, направлений деятельности и т.д., бывает трудно выделить главное , на что, в первую очередь, стоит обратить внимание и приложить усилия для управления. Определение доверительного интервала и анализ выхода за его границы фактических значений - методика, которая поможет вам выделить ситуации , влияющие на изменение тенденций. Вы сможете развивать позитивные факторы и снизить влияние негативных. Данная технология применяется во многих известных мировых компаниях.

Существуют так называемые "оповещения" , которые информируют руководителей о том, что очередное значение в определенном направлении вышло за доверительный интервал . Что это означает? Это сигнал, что произошло какое-то нестандартное событие, которое, возможно, изменит существующую тенденцию в данном направлении. Это сигнал к тому, чтобы разобраться в ситуации и понять, что на неё повлияло.

Например, рассмотрим несколько ситуаций. Мы рассчитали прогноз продаж с границами прогноза по 100 товарным позициям на 2011 год по месяцам и в марте фактические продажи:

  1. По «Подсолнечному маслу» пробили верхнюю границу прогноза и не попали в доверительный интервал.
  2. По «Сухим дрожжам» вышли за нижнюю границу прогноза.
  3. По «Овсяным Кашам» пробили верхнюю границу.

По остальным товарам фактические продажи оказались в рамках заданных границ прогноза. Т.е. их продажи оказались в рамках ожиданий. Итак, мы выделили 3 товара, которые вышли за границы, и начали разбираться, что же повлияло на выход за границы:

  1. По «Подсолнечному маслу» мы вошли в новую торговую сеть, которая дала нам дополнительный объем продаж, что привело к выходу за верхнюю границу. Для этого товара стоит пересчитать прогноз до конца года с учетом прогноза продаж в данную сеть.
  2. По «Сухим дрожжам» машина застряла на таможне, и образовался дефицит в рамках 5 дней, что повлияло на снижение продаж и выход за нижнюю границу. Возможно, стоит разобраться, что послужило причиной и постараться не повторять данную ситуацию.
  3. По «Овсяным Кашам» было запущено мероприятие по стимулированию сбыта, которое дало значительный прирост продаж и привело к выходу за границы прогноза.

Мы выделили 3 фактора, которые повлияли на выход за границы прогноза. В жизни их может быть гораздо больше.Для повышения точности прогнозирования и планирования факторы, которые приводят к тому, что фактические продажи могут выйти за границы прогноза, стоит выделить и строить прогнозы и планы по ним отдельно. А затем учитывать их влияние на основной прогноз продаж. Также можно регулярно оценивать влияние данных факторов и менять ситуацию к лучшему за счет уменьшения влияния негативных и увеличения влияния позитивных факторов .

С помощью доверительного интервала мы можем:

  1. Выделить направления , на которые стоит обратить внимание, т.к. в этих направлениях произошли события, которые могут повлиять на изменение тенденции .
  2. Определить факторы , которые реально влияют на изменение ситуации.
  3. Принять взвешенное решение (например, о закупках, при планировании и т.д.).

Теперь рассмотрим, что такое доверительный интервал и как его рассчитать в Excel на примере.

Что такое доверительный интервал?

Доверительный интервал – это границы прогноза (верхняя и нижняя), в рамки которых с заданной вероятностью (сигма) попадут фактические значения.

Т.е. мы рассчитываем прогноз - это наш основной ориентир, но мы понимаем, что фактические значения вряд ли на 100% будут равны нашему прогнозу. И возникает вопрос, в какие границы могут попасть фактические значения, если существующая тенденция сохранится ? И на этот вопрос нам поможет ответить расчет доверительного интервала , т.е. - верхней и нижней границы прогноза.

Что такое заданная вероятность сигма?

При расчете доверительного интервала мы можем задать вероятность попадания фактических значений в заданные границы прогноза . Как это сделать? Для этого мы задаем значение сигма и, если сигма будет равна:

    3 сигма - то, вероятность попадания очередного фактического значения в доверительный интервал составят 99,7%, или 300 к 1, или существует 0,3% вероятности выхода за границы.

    2 сигма - то, вероятность попадания очередного значения в границы составляет ≈ 95,5 %, т.е. шансы примерно 20 к 1, или существует 4,5% вероятности выхода за границы.

    1 сигма - то, вероятность ≈ 68,3%, т.е. шансы примерно 2 к 1, или существует 31,7% вероятность того, что очередное значение выйдет за пределы доверительного интервала.

Мы сформулировали правило 3 сигм, которое гласит, что вероятность попадания очередного случайного значения в доверительный интервал с заданным значением три сигма составляет 99.7% .

Великим русским математиком Чебышевым была доказана теорема о том, что существует 10% вероятность выхода за границы прогноза с заданным значением три сигма. Т.е. вероятность попадания в доверительный интервал 3 сигма составит минимум 90%, в то время как попытка рассчитать прогноз и его границы «на глазок» чревата куда более существенными ошибками.

Как самостоятельно рассчитать доверительный интервал в Excel?

Расчет доверительного интервала в Excel (т.е. верхней и нижней границы прогноза) рассмотрим на примере. У нас есть временной ряд - продажи по месяцам за 5 лет. См. Вложенный файл.

Для расчета границ прогноза рассчитаем:

  1. Прогноз продаж ().
  2. Сигма - среднеквадратическое отклонение модели прогноза от фактических значений.
  3. Три сигма.
  4. Доверительный интервал.

1. Прогноз продаж.

=(RC[-14](данные во временном ряду) - RC[-1](значение модели) )^2(в квадрате)


3. Просуммируем для каждого месяца значения отклонений из 8 этапа Сумма((Xi-Ximod)^2), т.е. просуммируем январи, феврали... для каждого года.

Для этого воспользуемся формулой =СУММЕСЛИ()

СУММЕСЛИ(массив с номерами периодов внутри цикла (для месяцев от 1 до 12);ссылка на номер периода в цикле; ссылка на массив с квадратами разницы исходных данных и значений периодов)


4. Рассчитаем среднеквадратическое отклонение для каждого периода в цикле от 1 до 12 (10 этапво вложенном файле ).

Для этого из значения рассчитанного на 9 этапе мы извлекаем корень и делим на количество периодов в этом цикле минус 1 = КОРЕНЬ((Сумма(Xi-Ximod)^2/(n-1))

Воспользуемся формулами в Excel =КОРЕНЬ(R8 (ссылка на (Сумма(Xi-Ximod)^2) /(СЧЁТЕСЛИ($O$8:$O$67 (ссылка на массив с номерами цикла) ; O8 (ссылка на конкретный номер цикла, которые считаем в массиве) )-1))

С помощью формулы Excel = СЧЁТЕСЛИ мы считаем количество n


Рассчитав среднеквадратическое отклонение фактических данных от модели прогноза, мы получили значение сигма для каждого месяца - этап 10 во вложенном файле .

3. Рассчитаем 3 сигма.

На 11 этапе задаем количество сигм - в нашем примере «3» (11 этапво вложенном файле ):

Также удобные для практики значения сигма:

1,64 сигма - 10% вероятность выхода за предел (1 шанс из 10);

1,96 сигма - 5% вероятность выхода за пределы (1 шанс из 20);

2,6 сигма - 1% вероятность выхода за пределы (1 шанс из 100).

5) Рассчитываем три сигма , для этого мы значения «сигма» для каждого месяца умножаем на «3».

3.Определяем доверительный интервал.

  1. Верхняя граница прогноза - прогноз продаж с учетом роста и сезонности + (плюс) 3 сигма;
  2. Нижняя граница прогноза - прогноз продаж с учетом роста и сезонности – (минус) 3 сигма;

Для удобства расчета доверительного интервала на длительный период (см. вложенный файл) воспользуемся формулой Excel =Y8+ВПР(W8;$U$8:$V$19;2;0) , где

Y8 - прогноз продаж;

W8 - номер месяца, для которого будем брать значение 3-х сигма;

Т.е. Верхняя граница прогноза = «прогноз продаж» + «3 сигма» (в примере, ВПР(номер месяца; таблица со значениями 3-х сигма; столбец, из которого извлекаем значение сигма равное номеру месяца в соответствующей строке;0)).

Нижняя граница прогноза = «прогноз продаж» минус «3 сигма».

Итак, мы рассчитали доверительный интервал в Excel.

Теперь у нас есть прогноз и диапазон с границами в пределах, которого с заданной вероятностью сигма попадут фактические значения.

В данной статье мы рассмотрели, что такое сигма и правило трёх сигм, как определить доверительный интервал и для чего вы можете использовать данную методику на практике.

Точных вам прогнозов и успехов!

Чем Forecast4AC PRO может вам помочь при расчете доверительного интервала ?:

    Forecast4AC PRO автоматически рассчитает верхнюю или нижнюю границы прогноза для более чем 1000 временных рядов одновременно;

    Возможность анализа границ прогноза в сравнении с прогнозом, трендом и фактическими продажами на графике одним нажатием клавиши;

В программе Forcast4AC PRO есть возможность задать значение сигма от 1 до 3.

Присоединяйтесь к нам!

Скачивайте бесплатные приложения для прогнозирования и бизнес-анализа :


  • Novo Forecast Lite - автоматический расчет прогноза в Excel .
  • 4analytics - ABC-XYZ-анализ и анализ выбросов в Excel.
  • Qlik Sense Desktop и QlikView Personal Edition - BI-системы для анализа и визуализации данных.

Тестируйте возможности платных решений:

  • Novo Forecast PRO - прогнозирование в Excel для больших массивов данных.

Случайной величины. Стандартное отклонение используют при расчёте стандартной ошибки среднего арифметического , при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами.

где - стандарт, стандартное отклонение, несмещенная оценка среднеквадратического отклонения случайной величины X относительно её математического ожидания; - дисперсия; - i-й элемент выборки; - среднее арифметическое выборки; - объём выборки.

Следует отметить отличие стандарта (в знаменателе n − 1 ) от корня из дисперсии(среднеквадратического отклонения)(в знаменателе n ), при малом объёме выборки оценка дисперсии через последнюю величину является несколько смещенной, при бесконечно большом объёме выборки разница между указанными величинами исчезает. Выборка - лишь часть генеральной совокупности. Генеральная совокупность - абсолютно все возможные результаты. Получить результат, не входящий в генеральную совокупность абсолютно невозможно в принципе. Для случая с бросанием монетки генеральной совокупностью является: решка, ребро, орел. а вот пара орел-решка уже лишь выборка. Для генеральной совокупности математическое ожидание совпадает с истинным значением оцениваемого параметра. А вот для выборки не факт. Математическое ожидание выборки имеет смещение относительно истинного значения параметра. В силу этого, среднеквадратичная ошибка больше чем дисперсия, так как дисперсия - математическое ожидание квадрата отклонения от среднего значения, а среднеквадратичное отклонение - математическое ожидание отклонения от истинного значения. Разница в том, от чего ищем отклонение, когда дисперсия, то от среднего и не важно истинное это среднее или ошибочно, а когда среднеквадратичное отклонение, то ищем отклонение от истинного значения.

Правило 3-х сигм () - практически все значения нормально распределённой случайной величины лежат в интервале . Более строго - не менее чем с 99,7 % достоверностью, значение нормально распределенной случайной величины лежит в указанном интервале. При условии что величина истинная, а не полученная в результате обработки выборки. Если же истинная величина неизвестна, то следует пользоваться не σ , а s . Таким образом, правило 3-х сигм преобразуется в правило трех s


Wikimedia Foundation . 2010 .

Смотреть что такое "Правило трёх сигм" в других словарях:

    Дисперсия случайной величины мера разброса данной случайной величины, т. е. её отклонения от математического ожидания. Обозначается D[X] в русской литературе и (англ. variance) в зарубежной. В статистике часто употребляется обозначение или.… … Википедия

    - (англ. six sigma) концепция управления производством, разработанная в корпорации Motorola в 1980 е годы и популяризированная в середине 1990 х после того, как Джек Уэлч применил её как ключевую стратегию в General Electric. Суть… … Википедия

    - (синонимы: среднеквадратичное отклонение, квадратичное отклонение; близкие термины: стандартное отклонение, стандартный разброс) в теории вероятностей и статистике наиболее распространённый показатель рассеивания значений случайной величины … Википедия

    Стандартное отклонение (иногда среднеквадратичное отклонение) в теории вероятности и статистике наиболее распространенный показатель рассеивания значений случайной величины относительно её математического ожидания. Измеряется в единицах… … Википедия

    Плотность вероятности Зеленая лин … Википедия

    НЕРВНАЯ СИСТЕМА - НЕРВНАЯ СИСТЕМА. Содержание: I. Эмбриогенез, гистогенез и филогенез Н.с. . 518 II. Анатомия Н. с................. 524 III. Физиология Н. с................ 525 IV. Патология Н.с................. 54? I. Эмбриогенез, гистогенез и филогенез Н. е.… … Большая медицинская энциклопедия

    Самая многочисленная группа губок. Это преимущественно мягкие эластичные формы. Скелет их образован одноосными иглами. Всегда имеется в том или ином количестве спонгин, с помощью которого иглы склеиваются между собой в пучки или волокна … Биологическая энциклопедия

    В медицине совокупность методов количественного изучения и анализа состояния и (или) поведения объектов и систем, относящихся к медицине и здравоохранению. В биологии, медицине и здравоохранении в круг явлений, изучаемых с помощью М.м., входят… … Медицинская энциклопедия

    Содержание 1 Менеджмент на основе хозяйственной деятельности 2 Разработка деловой ситуации 3 … Википедия

    Эту статью следует викифицировать. Пожалуйста, оформите её согласно правилам оформления статей. Расчёт себестоимости по видам деятельности (Activity Based Costing, ABC) ­ это специальная модель описания затрат, которая идентифицирует работы фирмы … Википедия

Распределение величины Х наз.нормальным, если плотность распределения этой величины, выражается формулой: f(x)=

Нормал. распределение - двухпараметрическое распределение (имеет 2 параметра: сред.величина и сред. квадратическое отклонение).

f(x) Кривая

нормального

распределения

«Правило трех сигм» Если случайная величина распределена нормально, то абсолютная величина ее отклонения от математического ожидания не превосходит утроенного среднеквадратического отклонения.

|x i - a| 3Ϭ; а - 3Ϭ Xi а + 3Ϭ

Правило «трёх сигм» применяется, если распределение случайной величины неизвестно, но выполняется условие «трех сигм», то предполагают, что эта величина распределена нормально.

P (|x - a| Ϭ)=0,6823; P (|x - a| 2Ϭ)=0,9545; P (|x - a| 3Ϭ)=0,9973

15.Критерии согласия. Проверка гипотезы распределения…

Критерия согласия -критерий проверки гипотезы о предполагаемом законе распределения: Смирнова; Колмагорова; Критерии Пирсона:

Алгоритм проверки:1.Выдвигается гипотеза Н 0: совокупность распределена нормально

2.Вычисляются теоретические частоты и

3.По таблице «критические точки распределения » при заданном уровне значимости и числе степеней свободы, находят

4.Если в результате сравнения , то Но не отвергается. В противном случае - отвергается.

Ошибка 1рода состоит в том, что будет опровергнута правильная гипотеза. Эту ошибку называют уровнем значимости(альфа )

Ошибка 2рода состоит в том, что будет принята неправильная гипотеза.

Число степеней свободы: = n – k – 1

16. Оценка отклонения теорет. Распределения от нормального…

Оценка отклонения теоретического распределения от нормального осуществляется с помощью показателей асимметрии(As) и эксцесса(Ek).

As= , -3Ek= – 3

Ek=0 – распределение нормальное

Ek>0-распределение

островершинное

Ek<0-распределение плосковершинное

Мо<Ме< - правосторонняя ассиметрия (As>0); - левосторонняя ассиметрия (As<0); Ме= - симметричное нормальное распределение (As=0). As>0,5 - значительна; As<0,25 – не значительна


17. Понятие выборочной и генеральной совокупности. Виды…

Выборочное наблюдение – вид статистического наблюдения, при котором обследованию подвергается не вся совокупность, а лишь часть её единиц, отобранных в определенном порядке, при этом вся совокупность в целом называется генеральной, а единицы подвергающиеся наблюдению называются выборочной совокупностью или выборкой.

Виды отбора :1) повторный – отбор, при котором отобранный объект перед отбором следующего возвращается в генеральную совокупность 2)бесповторный – отбор, при котором отобранный объект, в генеральную совокупность не возвращается.

Способы отбора : 1)Отбор, не требующий расчленения генеральной совокупности на части: а) простой случайный бесповторный отбор; б) простой случайный повторный отбор.

2)Отбор, при котором генеральная совокупность разбивается на части:

а) случайный – отбор, при котором объекты извлекаются случайным образом по одному из генеральной совокупности б) типический – отбор, при котором объекты отбираются не из всей совокупности, а из каждой её качественно-однородной группы в) механический – отбор, при котором генеральную совокупность делят на столько групп, сколько объектов должно войти в выборку и затем из каждой группы выбирают один объект г) серийный – отбор, при котором объекты отбирают из генеральной совокупности сериями, которые затем подвергают обследованию

18.Ошибки выборки: средняя, предельная, относительная….

Ошибки выборки : 1)Средняя:

– для повторного отбора; - для бесповтор-го

2)Предельная: = t* ,где t- коэф-т доверия, определяется по таблице значений Лапласа при заданной доверительной вероятности

Из данной статьи вы узнаете:

    Что такое доверительный интервал ?

    В чем суть правила 3-х сигм ?

    Как можно применить эти знания на практике?

В наше время из-за переизбытка информации, связанного с большим ассортиментом товаров, направлений продаж, сотрудников, направлений деятельности и т.д., бывает трудно выделить главное , на что, в первую очередь, стоит обратить внимание и приложить усилия для управления. Определение доверительного интервала и анализ выхода за его границы фактических значений - методика, которая поможет вам выделить ситуации , влияющие на изменение тенденций. Вы сможете развивать позитивные факторы и снизить влияние негативных. Данная технология применяется во многих известных мировых компаниях.

Существуют так называемые "оповещения" , которые информируют руководителей о том, что очередное значение в определенном направлении вышло за доверительный интервал . Что это означает? Это сигнал, что произошло какое-то нестандартное событие, которое, возможно, изменит существующую тенденцию в данном направлении. Это сигнал к тому, чтобы разобраться в ситуации и понять, что на неё повлияло.

Например, рассмотрим несколько ситуаций. Мы рассчитали прогноз продаж с границами прогноза по 100 товарным позициям на 2011 год по месяцам и в марте фактические продажи:

  1. По «Подсолнечному маслу» пробили верхнюю границу прогноза и не попали в доверительный интервал.
  2. По «Сухим дрожжам» вышли за нижнюю границу прогноза.
  3. По «Овсяным Кашам» пробили верхнюю границу.

По остальным товарам фактические продажи оказались в рамках заданных границ прогноза. Т.е. их продажи оказались в рамках ожиданий. Итак, мы выделили 3 товара, которые вышли за границы, и начали разбираться, что же повлияло на выход за границы:

  1. По «Подсолнечному маслу» мы вошли в новую торговую сеть, которая дала нам дополнительный объем продаж, что привело к выходу за верхнюю границу. Для этого товара стоит пересчитать прогноз до конца года с учетом прогноза продаж в данную сеть.
  2. По «Сухим дрожжам» машина застряла на таможне, и образовался дефицит в рамках 5 дней, что повлияло на снижение продаж и выход за нижнюю границу. Возможно, стоит разобраться, что послужило причиной и постараться не повторять данную ситуацию.
  3. По «Овсяным Кашам» было запущено мероприятие по стимулированию сбыта, которое дало значительный прирост продаж и привело к выходу за границы прогноза.

Мы выделили 3 фактора, которые повлияли на выход за границы прогноза. В жизни их может быть гораздо больше.Для повышения точности прогнозирования и планирования факторы, которые приводят к тому, что фактические продажи могут выйти за границы прогноза, стоит выделить и строить прогнозы и планы по ним отдельно. А затем учитывать их влияние на основной прогноз продаж. Также можно регулярно оценивать влияние данных факторов и менять ситуацию к лучшему за счет уменьшения влияния негативных и увеличения влияния позитивных факторов .

С помощью доверительного интервала мы можем:

  1. Выделить направления , на которые стоит обратить внимание, т.к. в этих направлениях произошли события, которые могут повлиять на изменение тенденции .
  2. Определить факторы , которые реально влияют на изменение ситуации.
  3. Принять взвешенное решение (например, о закупках, при планировании и т.д.).

Теперь рассмотрим, что такое доверительный интервал и как его рассчитать в Excel на примере.

Что такое доверительный интервал?

Доверительный интервал – это границы прогноза (верхняя и нижняя), в рамки которых с заданной вероятностью (сигма) попадут фактические значения.

Т.е. мы рассчитываем прогноз - это наш основной ориентир, но мы понимаем, что фактические значения вряд ли на 100% будут равны нашему прогнозу. И возникает вопрос, в какие границы могут попасть фактические значения, если существующая тенденция сохранится ? И на этот вопрос нам поможет ответить расчет доверительного интервала , т.е. - верхней и нижней границы прогноза.

Что такое заданная вероятность сигма?

При расчете доверительного интервала мы можем задать вероятность попадания фактических значений в заданные границы прогноза . Как это сделать? Для этого мы задаем значение сигма и, если сигма будет равна:

    3 сигма - то, вероятность попадания очередного фактического значения в доверительный интервал составят 99,7%, или 300 к 1, или существует 0,3% вероятности выхода за границы.

    2 сигма - то, вероятность попадания очередного значения в границы составляет ≈ 95,5 %, т.е. шансы примерно 20 к 1, или существует 4,5% вероятности выхода за границы.

    1 сигма - то, вероятность ≈ 68,3%, т.е. шансы примерно 2 к 1, или существует 31,7% вероятность того, что очередное значение выйдет за пределы доверительного интервала.

Мы сформулировали правило 3 сигм, которое гласит, что вероятность попадания очередного случайного значения в доверительный интервал с заданным значением три сигма составляет 99.7% .

Великим русским математиком Чебышевым была доказана теорема о том, что существует 10% вероятность выхода за границы прогноза с заданным значением три сигма. Т.е. вероятность попадания в доверительный интервал 3 сигма составит минимум 90%, в то время как попытка рассчитать прогноз и его границы «на глазок» чревата куда более существенными ошибками.

Как самостоятельно рассчитать доверительный интервал в Excel?

Расчет доверительного интервала в Excel (т.е. верхней и нижней границы прогноза) рассмотрим на примере. У нас есть временной ряд - продажи по месяцам за 5 лет. См. Вложенный файл.

Для расчета границ прогноза рассчитаем:

  1. Прогноз продаж ().
  2. Сигма - среднеквадратическое отклонение модели прогноза от фактических значений.
  3. Три сигма.
  4. Доверительный интервал.

1. Прогноз продаж.

=(RC[-14](данные во временном ряду) - RC[-1](значение модели) )^2(в квадрате)


3. Просуммируем для каждого месяца значения отклонений из 8 этапа Сумма((Xi-Ximod)^2), т.е. просуммируем январи, феврали... для каждого года.

Для этого воспользуемся формулой =СУММЕСЛИ()

СУММЕСЛИ(массив с номерами периодов внутри цикла (для месяцев от 1 до 12);ссылка на номер периода в цикле; ссылка на массив с квадратами разницы исходных данных и значений периодов)


4. Рассчитаем среднеквадратическое отклонение для каждого периода в цикле от 1 до 12 (10 этапво вложенном файле ).

Для этого из значения рассчитанного на 9 этапе мы извлекаем корень и делим на количество периодов в этом цикле минус 1 = КОРЕНЬ((Сумма(Xi-Ximod)^2/(n-1))

Воспользуемся формулами в Excel =КОРЕНЬ(R8 (ссылка на (Сумма(Xi-Ximod)^2) /(СЧЁТЕСЛИ($O$8:$O$67 (ссылка на массив с номерами цикла) ; O8 (ссылка на конкретный номер цикла, которые считаем в массиве) )-1))

С помощью формулы Excel = СЧЁТЕСЛИ мы считаем количество n


Рассчитав среднеквадратическое отклонение фактических данных от модели прогноза, мы получили значение сигма для каждого месяца - этап 10 во вложенном файле .

3. Рассчитаем 3 сигма.

На 11 этапе задаем количество сигм - в нашем примере «3» (11 этапво вложенном файле ):

Также удобные для практики значения сигма:

1,64 сигма - 10% вероятность выхода за предел (1 шанс из 10);

1,96 сигма - 5% вероятность выхода за пределы (1 шанс из 20);

2,6 сигма - 1% вероятность выхода за пределы (1 шанс из 100).

5) Рассчитываем три сигма , для этого мы значения «сигма» для каждого месяца умножаем на «3».

3.Определяем доверительный интервал.

  1. Верхняя граница прогноза - прогноз продаж с учетом роста и сезонности + (плюс) 3 сигма;
  2. Нижняя граница прогноза - прогноз продаж с учетом роста и сезонности – (минус) 3 сигма;

Для удобства расчета доверительного интервала на длительный период (см. вложенный файл) воспользуемся формулой Excel =Y8+ВПР(W8;$U$8:$V$19;2;0) , где

Y8 - прогноз продаж;

W8 - номер месяца, для которого будем брать значение 3-х сигма;

Т.е. Верхняя граница прогноза = «прогноз продаж» + «3 сигма» (в примере, ВПР(номер месяца; таблица со значениями 3-х сигма; столбец, из которого извлекаем значение сигма равное номеру месяца в соответствующей строке;0)).

Нижняя граница прогноза = «прогноз продаж» минус «3 сигма».

Итак, мы рассчитали доверительный интервал в Excel.

Теперь у нас есть прогноз и диапазон с границами в пределах, которого с заданной вероятностью сигма попадут фактические значения.

В данной статье мы рассмотрели, что такое сигма и правило трёх сигм, как определить доверительный интервал и для чего вы можете использовать данную методику на практике.

Точных вам прогнозов и успехов!

Чем Forecast4AC PRO может вам помочь при расчете доверительного интервала ?:

    Forecast4AC PRO автоматически рассчитает верхнюю или нижнюю границы прогноза для более чем 1000 временных рядов одновременно;

    Возможность анализа границ прогноза в сравнении с прогнозом, трендом и фактическими продажами на графике одним нажатием клавиши;

В программе Forcast4AC PRO есть возможность задать значение сигма от 1 до 3.

Присоединяйтесь к нам!

Скачивайте бесплатные приложения для прогнозирования и бизнес-анализа :


  • Novo Forecast Lite - автоматический расчет прогноза в Excel .
  • 4analytics - ABC-XYZ-анализ и анализ выбросов в Excel.
  • Qlik Sense Desktop и QlikView Personal Edition - BI-системы для анализа и визуализации данных.

Тестируйте возможности платных решений:

  • Novo Forecast PRO - прогнозирование в Excel для больших массивов данных.

1. Правило трёх сигм заключается в том, что практически все результаты, составляющие нормально распределенную выборку, находятся в пределах . Это правило можно использовать при решении следующих важных задач:

1) Оценки нормальности распределения выборочных данных. Если результаты находятся примерно в пределах
и в области среднего арифметического результаты встречаются чаще, а вправо и влево от него – реже, то можно предположить, что результаты распределены нормально.

2) Выявление ошибочно полученных результатов. Если отдельные результаты отклоняются от среднего арифметического значения на величины, значительно превосходящие 3, нужно проверить правильность полученных величин. Часто такие «выскакивающие» результаты могут появиться в результате неисправности прибора, ошибки в измерении и расчетах.

3) Оценка величины . Если размах варьирования R=X наиб - X наим, разделить на 6, то мы получим грубо приближенное значение .

2. Критерий W Шапиро и Уилка предназначен для проверки гипотезы о нормальном распределении генеральной совокупности, когда объём выборки мал (n ≤ 50). Процедура проверки следующая: выдвигается нулевая гипотеза о нормальном распределении генеральной совокупности. Рассчитывается наблюдаемое значение критерия Шапиро и Уилка W набл и сравнивается с критическим значением W крит, которое находится по таблице критических точек критерия Шапиро и Уилка в зависимости от объёма выборки и уровня значимости. Если W набл ≥ W крит, нулевая гипотеза о нормальном распределении результатов принимается; при W набл < W крит она отвергается.

1. В чём заключается правило трёх сигм?

2. Практическое применение правила трёх сигм.

3. Какой критерий применяется для проверки нормальности распределения генеральной совокупности при малом объёме выборки?

4. Опишите процедуру проверки нормальности распределения.

Литература:

1. Основы математической статистики. Уч. пособие для ин-тов физической культуры (под общ. ред. В.С. Иванова). – М.: Физкультура и спорт, 1990. – С. 62 – 63, 110 – 112.

2. Рукавицына С.Л., Волков Ю.О., Солтанович Л.Л. Спортивная метрология. Проверка эффективности методики тренировки с применением методов математической статистики. Практикум для студентов БГУФК. – Минск: БГУФК, 2006. – С. 66 – 67.

3. Гинзбург Г.И., Киселев В.Г. Расчетно-графические работы по спортивной метрологии. – Минск: БГОИФК, 1984. – С. 21 – 22, 26 – 29.

ЛЕКЦИЯ 7.

Тема: Взаимосвязь результатов измерения. Методы вычисления коэффициентов взаимосвязи.

Вопросы для рассмотрения:

1. Виды взаимосвязи.

2. Основные задачи корреляционного анализа.

3. Коэффициент корреляции и его свойства.

4. Методы вычисления коэффициентов взаимосвязи.

1. В спортивных исследованиях между изучаемыми показателями часто обнаруживается взаимосвязь. Вид ее бывает различным. Например, определение ускорения по известным данным скорости в биомеханике, закон Фехнера в психологии, закон Хилла в физиологии и другие характеризуют так называемую функциональную зависимость, или взаимосвязь, при которой каждому значению одного показателя соответствует строго определенное значение другого.

К другому виду взаимосвязи относят, например, зависимость веса от длины тела. Одному значению длины тела может соответствовать несколько значений веса и наоборот. В таких случаях, когда одному значению одного показателя соответствует несколько значений другого, взаимосвязь называют статистической.

Изучению статистической взаимосвязи между различными показателями в спортивных исследованиях уделяют большое внимание, поскольку это позволяет вскрыть некоторые закономерности и в дальнейшем описать их как словесно, так и математически с целью использования в практической работе тренера и педагога.

Среди статистических взаимосвязей наиболее важны корреляционные . Корреляция заключается в том, что средняя величина одного показателя изменяется в зависимости от значения другого.

2. Статистический метод, который используется для исследования взаимосвязей, называется корреляционным анализом. Основной задачей его является определение формы, тесноты и направленности взаимосвязи изучаемых показателей. Корреляционный анализ позволяет исследовать только статистическую взаимосвязь. Он широко используется в теории тестов для оценки их надежности и информативности. Различные шкалы измерений требуют разных вариантов корреляционного анализа.

Анализ взаимосвязи начинается с графического представления результатов измерений в прямоугольной системе координат. Строится график, на оси абсцисс которого откладываются результаты X, а на оси ординатрезультаты Y. Таким образом, каждая пара результатов в прямоугольной системе координат будет отображаться точкой. Полученная совокупность точек обводится замкнутой кривой.

Такая графическая зависимость называется диаграммой рассеивания или корреляционным полем . Визуальный анализ графика позволяет выявить форму зависимости (по крайней мере, сделать предположение). Если форма корреляционного поля близка к эллипсу, такую форму взаимосвязи называют линейной зависимостью или линейной формой взаимосвязи.

Однако, на практике можно встретить и иную форму взаимосвязи. Зависимость, экспериментально полученная при подачах в теннисе, является характерной для нелинейной формы взаимосвязи, или нелинейной зависимости.

Таким образом, визуальный анализ корреляционного поля позволяет выявить форму статистической зависимостилинейную или нелинейную. Это имеет существенное значение для следующего шага в анализевыбора и вычисления соответствующего коэффициента корреляции.

3. Если измерения происходят в шкале отношений или интервалов и наблюдается линейная форма взаимосвязи, для количественной оценки тесноты взаимосвязи используется коэффициент корреляции Бравэ-Пирсона. Обозначается буквой r. Вычисляется по формуле:

,

где и – средние арифметические значения показателей x и y; σ x и σ y – средние квадратические отклонения; n – число измерений (испытуемых).

Его свойства:

1) Значения r могут изменяться от –1 до 1.

2) В случае r=-1 и r=1 взаимосвязь функциональная, соответственно, отрицательная и положительная.

3) При r=0 линейная взаимосвязь не установлена, но при этом может наблюдаться взаимосвязь другой формы.

4) При r<0 взаимосвязь отрицательная, при r>0 – положительная.

Для оценки тесноты взаимосвязи в корреляционном анализе используется значение (абсолютная величина) коэффициента корреляции. Абсолютное значение любого коэффициента корреляции лежит в пределах от 0 до 1. Объясняют (интерпретируют) значение этого коэффициента следующим образом:

коэффициент корреляции равен 1,00 (функциональная взаимосвязь, т.к. значению одного показателя соответствует только одно значение другого показателя);

коэффициент корреляции равен 0,990,7 (сильная статистическая взаимосвязь);

коэффициент корреляции равен 0,690,5 (средняя статистическая взаимосвязь);

коэффициент корреляции равен 0,490,2 (слабая статистическая взаимосвязь);

коэффициент корреляции равен 0,190,01 (очень слабая статистическая взаимосвязь);

коэффициент корреляции равен 0,00 (корреляции нет).

4. Прежде, чем начать механическую процедуру вычисления коэффициента корреляции, необходимо ответить на некоторые вопросы:

1) В какой шкале измеряется изучаемый показатель?

2) Как много измерений этого показателя выполнено?

От ответов на эти вопросы зависит, какой именно коэффициент взаимосвязи будет вычисляться.

В частности, в том случае, когда измерения проводятся в шкале интервалов или отношений, для оценки тесноты взаимосвязи вычисляют коэффициент корреляции Бравэ-Пирсона; в ранговой шкале вычисляют ранговый коэффициент корреляции Спирмэна; а в шкале наименований, когда интересующие признак варьирует альтернативно, используют тетрахорический коэффициент сопряженности.

Ранговый коэффициент корреляции Спирмэна вычисляют по формуле:

,

где d = d x - d y – разность рангов данной пары показателей X и Y; n – объем выборки.

Применяется, когда показатели измерены в шкале наименований (т.е. им присвоены числа, но нельзя сказать, что один из них больше другого), а показатели варьируют альтернативно (пол мужской/женский, выполнение или невыполнение задания и т.д., иначе говоря, есть два состояния: 0 и 1).

Обозначается Т 4 и вычисляется по формуле:

,

где A – значение, которое соответствует числу испытуемых (попыток), совпадающих по обоим показателям X и Y, т.е. 1 и 1; B – значение, которое соответствует числу совпадений 0 – X и 1 – Y; C – значение, соответствующее числу совпадений 1 – X и 0 – Y; D – значение совпадений 0 и 0; n – объем выборки.

Контрольные вопросы для самопроверки:

1. Функциональная взаимосвязь. Определение и примеры.

2. Статистическая взаимосвязь. Определение и примеры. Корреляционная взаимосвязь.

3. Основные задачи корреляционного анализа.

4. Корреляционное поле. Порядок построения, анализ изображения.

6. Коэффициент корреляции Браве-Пирсона и его свойства.

7. Правила выбора коэффициента взаимосвязи.

Литература:

1. Основы математической статистики. Уч. пособие для ин-тов физической культуры (под общ. ред. В.С. Иванова). – М.: Физкультура и спорт, 1990. – С. 124 – 126, 142 – 150, 155 – 162.

2. Рукавицына С.Л., Волков Ю.О., Солтанович Л.Л. Спортивная метрология. Проверка эффективности методики тренировки с применением методов математической статистики. Практикум для студентов БГУФК. – Минск: БГУФК, 2006. – С. 42 – 48.

3. Гинзбург Г.И., Киселев В.Г. Расчетно-графические работы по спортивной метрологии. – Минск: БГОИФК, 1984. – С. 51 – 60.

ЛЕКЦИЯ 8.

Тема: Статистические гипотезы и достоверность статистических характеристик. Проверка статистических гипотез.



Что еще почитать