RSS    

   Математическая статистика - (лекции)

p>Отклонения от гипотетического математического ожидания в сумме составляют в нашем примере точно0 и нам необходимо определить количество вариантов, в которых сумма S>0. Всего вариантов 16, а вариантов с нулевой или положительной суммой 9. Вероятность ошибки при отклонении Њ0 оказалась равной 9/16@0. 57, что намного больше контрольных 5 % . Как и следовало ожидать, нам нет смысла отбрасывать нулевую гипотезу – слишком велика ошибка первого рода. Все было бы хорошо, но если мы выдвинем другую нулевую гипотезу о математическом ожидании выручки, например– Њ0: M(G)= 196 гривен, то после аналогичных расчетов получим результат –и эту гипотезу нет оснований отбрасывать, правда вероятность ошибки первого рода теперь будет иной– “всего лишь” 0. 125. Столько же составит вероятность этой ошибки и при Њ0: M(G)= 214. Таким образом, все нулевые гипотезы со значениями от 196 до 214 можно не отвергать (не достигнуто пороговое значение 0. 05). Можно ли рекомендовать принятие альтернативной гипотезы и, если– да, то при каком значении гипотетического математического ожидания? Теория прикладной статистики отвечает на этот вопрос однозначно – нет, рекомендовать нам это она не вправе! Вспомним “неудобное” свойство статистических выводов или рекомендаций –они никогда не бывают однозначными, конкретными. Поэтому наивно ожидать решения задачи об оценке математического ожидания по данным наблюдений в виде одного, конкретного числа.

Еще раз продумаем, чего мы добиваемся, меняя значение в нулевой гипотезе? Ведь самая большая ошибка первого рода была как раз тогда, когда мы выдвинули такое понятное предположение– математическое ожидание равно среднему. Более того, проверка нулевой гипотезы такого вида была совершенно бессмысленным делом. Практически всегда в этих случаях альтернативная гипотеза окажется самой вероятной, но практически никогда вероятность ее истинности не достигнет желанных 95 %.

Всё дело в том, что просчитать последствия своего решения мы умеем только отвергая нулевую гипотезу, но, принимая ее, последствия просчитать не можем. Вот если бы, передвигая воображаемый указатель по шкале СВ мы получили сигнал “СТОП, достаточно! Достигнут уровень ошибки 5 %”, то мы бы запомнили данное значение как левую (или правую) границу интервала, в котором почти “наверняка” лежит искомое нами математическое ожидание. В нашем примере этого не произошло и, оказывается и не могло произойти.

Дело в том, что у нас всего 4 наблюдения (196, 208, 210, 214) со средним значением 207 и среднеквадратичным отклонением около 13. 5 гривен (т. е. более 6 % от среднего). И получить значимые статистические выводы в этом случае просто невозможно– надо увеличить объем выборки, число наблюдений. А вот на вопрос –а сколько же надо наблюдений, каково их достаточное число, прикладная статистика имеет ответ: для “преодоления 5 % барьера” достаточно 5 наблюдений. Попробуем решить другую задачу об оценке математического ожидания СВ на интервальной шкале, но будем решать её не “по чувству”, а “по разуму”. · Наблюдения над случайной величиной X: 19, 17, 15, 13, 12, 11, 10, 8, 7. · Количество наблюдений: 9, возможных исходов 512.

    · Њ0: M(X)= 9, Њ1: M(X)# 9.

Найдем сумму отклонений от гипотетического среднего, S = 31. Из 512 возможных вариантов суммы отклонений выберем только те, в которых эта сумма составляет31 и более. Таких вариантов всего 11, значит при принятии нулевой гипотезы Њ0: M(X)= 9 вероятность наблюдать такие суммы P(S і31) составляет 11/512 @ 0. 02 , что меньше порогового значения в 5 % . Вывод: гипотезу Њ0 следует отвергнуть и считать приемлемым по надежности неравенство M(X) # 9. До сих пор мы выдвигали гипотезу о значении математического ожидания на “левом крае” распределения наблюдений и могли бы повторять проверки, задаваясь значениямиM(X) в 10, 11и т. д. , до тех пор, пока вероятность ошибки первого рода не достигла бы порогового значения.

Можно также исследовать правый край распределения – проверять гипотезы при больших значениях математического ожидания. Например:

· Наблюдения над случайной величиной X: 19, 17, 15, 13, 12, 11, 10, 8, 7. · Количество наблюдений: 9, возможных исходов 512.

    · Њ0: M(X)= 17, Њ1: M(X)# 17.

Теперь сумма отклонений от гипотетического среднего окажется S = – 41. Из 512 возможных вариантов суммы отклонений выберем только те, в которых эта сумма составляет–41 и менее. Таких вариантов всего 3, значит при принятии нулевой гипотезы Њ0: M(X)= 17 вероятность наблюдать такие суммы составляет P(S Ј – 31) = 3/512 @ 0. 006 , что намного меньше порогового значения в 5 % . Следовательно, можно попробовать гипотезы с меньшим M(X), сужая диапазон или так называемый доверительный интервал для неизвестного нам математического ожидания.

    Оценка наблюдений при известном законе распределения

Не всегда закон распределения СВ представляет для нас полную тайну. В ряде случаев у нас могут быть основания предполагать, что случайные события, определяющие наблюдаемые нами значения этой величины, подчиняются определенной вероятностной схеме.

В таких случаях использование методов выдвижения и проверки гипотез даст нам информацию о параметрах распределения, что может оказаться вполне достаточно для решения конкретной экономической задачи.

    Оценка параметров нормального распределения

Нередки случаи, когда у нас есть некоторые основания считать интересующую нас СВ распределенной по нормальному закону. Существуют специальные методы проверки такой гипотезы по данным наблюдений, но мы ограничимся напоминанием природы этого распределения–наличия влияния на значение данной величины достаточно большого количества случайных факторов.

Напомним себе также, что у нормального распределения всего два параметра – математическое ожидание m и среднеквадратичное отклонение s. Пусть мы произвели 40 наблюдений над такой случайной величиной X и эти наблюдения представили в виде:

    Таблица 5-2
    Xi
    85
    105
    125
    145
    165
    185
    205
    225
    Всего
    ni
    4
    3
    3
    2
    4
    7
    12
    5
    40
    f i
    0. 100
    0. 075
    0. 075
    0. 050
    0. 100
    0. 175
    0. 300
    0. 125
    1

Если мы усредним значения наблюдений, то формула расчета выборочного среднего Mx = S Xi · ni =S Xi · fi{5–1} будет отличаться от выражения для математического ожидания m только использованием частот вместо вероятностей. В нашем примере выборочное среднее значение составит Mx = 171. 5 , но из этого пока еще нельзя сделать заключение о равенстве m = 171. 5. · Во-первых, Mx –это непрерывная СВ, следовательно, вероятность ее точного равенства чему-нибудь вообще равна нулю.

    · Во-вторых, нас настораживает отсутствие ряда значений X.

·В-третьих, частоты наблюдений стремятся к вероятностям при бесконечно большом числе наблюдений, а у нас их только40. Не мало ли?

Если мы усредним теперь значения квадратов отклонений наблюдений от выборочного среднего, то формула расчета выборочной дисперсии

Dx = (Sx)2 = S (Xi – Mx)2 · ni =S (Xi)2 · fi – (Mx)2 {5–2} также не будет отличаться от формулы, определяющей дисперсию s2 . В нашем примере выборочное значение среднеквадратичного отклонения составит Sx= 45. 5 , но это совсем не означает, что s =45. 5. И всё же –как оценить оба параметра распределения или хотя бы один из них по данным наблюдений, т. е. по уже найденнымMx и Sx?

    Прикладная статистика дает следующие рекомендации:

· значение дисперсии s2 считается неизвестным и решается первый вопрос – достаточно ли число наблюдений N для того, чтобы использовать вместо величины s ее выборочное значение Sx; · если это так, то решается второй вопрос – как построить нулевую гипотезу о величине математического ожидания m и как ее проверить. Предположим вначале, что значение s каким–то способом найдено. Тогда формулируется простая нулевая гипотеза Њ0: m=Mx и осуществляется её проверка с помощью следующего критерия. Вычисляется вспомогательная функция (Z–критерий)

, {5-3} значение и знак которой зависят от выбранного нами предполагаемого m. Доказано, что значение Z является СВ с математическим ожиданием 0 , дисперсией 1 и имеет нормальное распределение. Теперь важно правильно построить альтернативную гипотезу Њ1. Здесь чаще всего применяется два подхода. Выбор одного из них зависит от того – большое или малое (по модулю) значение Z у нас получилось. Иными словами – как далеко от расчетного Mx мы выбрали гипотетическое m... · При малых отличиях между Mx и m разумно строить гипотезы в виде Њ0: m= Mx;

    Њ1: неизвестное нам значение m лежит в пределах
    Mx – ·Z 2k Ј m Ј Mx + ·Z 2k {5–4}

Критическое (соответствующее уровню значимости в 5%) значение критерия составляет при этом = 1. 96 (двухсторонний критерий). Если оказывается, что выборочное значение критерия ЅZЅ < 1. 96, то гипотеза Њ0: m=Mx принимается, данные наблюдений не противоречат ей. Если же это не так, то мы “в утешение” получаем информацию другого вида – где, на каком интервале находится искомое значение m. · При больших отличиях (в большую или меньшую сторону) между m и Mx гипотезы строятся иначе Њ0: m= Mx; Њ1: неизвестное нам значение m лежит вне пределов, указанных в {5–4}. Теперь критическое (соответствующее уровню значимости в 5%) значение критерия составляетZ 1k = 1. 645 (односторонний критерий). Если оказывается, что выборочное значение критерияЅZЅ і 1. 645, то гипотеза Њ0: m =Mx отвергается, данные наблюдений противоречат ей. Если же это не так, то мы получаем информацию другого вида – где, на каком крае интервале находится искомое значение m. Разумеется, для других (не 5%) значений уровня значимости Z1k и Z 2k являются другими. Чуть сложнее путь проверки гипотез о математическом ожидании m в случаях, когда sнам неизвестна и приходится довольствоваться выборочным значением среднеквадратичного отклонения по данным наблюдений.

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12


Новости


Быстрый поиск

Группа вКонтакте: новости

Пока нет

Новости в Twitter и Facebook

                   

Новости

© 2010.