RSS    

   Математическая статистика - (лекции)

p>P(A/B)·P(B) = P(B/A)·P(B); {1–10} –весьма важное средство анализа, особенно в области проверки гипотез и решения вопросов управления на базе методов прикладной статистики.

Подведем некоторые итоги рассмотрения вопроса о вероятностях случайных событий. У нас имеются только две возможности узнать что либо о величине вероятности случайного событияA:

· применить метод статистического моделирования -построить схему данного случайного события и (если у нас есть основания считать, что мы правильно ее строим) и найти значение вероятности прямым расчетом;

· применить метод статистического испытания -наблюдать за появлением события и затем по частоте его появления оценить вероятность.

На практике приходится использовать оба метода, поскольку очень редко можно быть абсолютно уверенным в примененной схеме события (недостаток метода моделирования) и столь же редко частота появления события достаточно быстро стабилизируется с ростом числа наблюдений (недостаток метода испытаний).

    Распределения вероятностей случайных величин
    Шкалирование случайных величин

Как уже отмечалось, дискретной называют величину, которая может принимать одно из счетного множества так называемых “допустимых” значений. Примеров дискретных величин, у которых есть некоторая именованная единица измерения, можно привести достаточно много.

Прежде всего, надо учесть тот факт что все физические величины (вес, расстояния, площади, объемы и т. д. ) теоретически могут принимать бесчисленное множество значений, но практически-только те значения, которые мы можем установить измерительными приборами. А это значит, что в прикладной статистике вполне допустимо распространить понятие дискретных СВ навсе без исключения численные описания величин, имеющих единицы измерения. Вместе с тем надо не забывать, что некоторые СВ просто не имеют количественного описания, естественных единиц измерения (уровень знаний, качество продукции и т. п. ).

Покажем, что для решения вопроса о “единицах измерения” любых СВ, с которыми приходится иметь дело в прикладной статистике, достаточно использовать четыре вида шкал.

· Nom. Первой из них рассмотрим так называемую номинальную шкалу —применяемую к тем величинам, которые не имеют природной единицы измерения. В ряде случаев нам приходится считать случайными такие показатели предметов или явлений окружающего нас мира, как марка автомобиля; национальность человека или его пол, социальное положение; цвет некоторого изделия и т. п. В таких ситуациях можно говорить о случайном событии -"входящий в магазин посетитель оказался мужчиной", но вполне допустимо рассматривать пол посетителя как дискретную СВ, которая приняла одно из допустимых значений на своей номинальной шкале.

Итак, если некоторая величина может принимать на своей номинальной шкале значенияX, Y или Z, то допустимыми считаются только выражения типа: X # Y, X=Z , в то время как выражения типа X і Z, X + Z не имеют никакого смысла. · Ord. Второй способ шкалирования – использование порядковых шкал. Они незаменимы для СВ, не имеющих природных единиц измерения, но позволяющих применять понятия предпочтения одного значения другому. Типичный пример: оценки знаний (даже при числовом описании), служебные уровни и т. п. Для таких величин разрешены не только отношения равенства (= или #), но и знаки предпочтения (> или

Методы использования описанных шкал относится к специальному разделу – так называемой непараметрической статистике и обеспечивают, по крайней мере, два неоспоримых преимущества. ·Появляется возможность совместного рассмотрения нескольких СВ совершенно разной природы (возраст людей и их национальная принадлежность, марка телевизора и его стоимость) на единой платформе- положения каждой из величин на своей собственной шкале. ·Если мы сталкиваемся с СВ непрерывной природы, то использование интервальной или относительной шкалы позволит нам иметь дело не со случайными величинами, а со случайными событиями—типа “вероятность того, что вес продукции находится в интервале 17 Кг”. Появляется возможность применения единого подхода к описанию всех интересующих нас показателей при статистическом подходе к явлениям окружающего нас мира.

    Законы распределений дискретных случайных величин.

Пусть некоторая СВ является дискретной, т. е. может принимать лишь фиксированные (на некоторой шкале) значенияX i. В этом случае ряд значений вероятностей P(X i)для всех (i=1…n) допустимых значений этой величины называют её законом распределения. В самом деле, -такой ряд содержит всю информацию о СВ, это максимум наших знаний о ней. Другое дело, -откуда мы можем получить эту информацию, как найти закон распределения? Попытаемся ответить на этот принципиально важный вопрос, используя уже рассмотренное понятие вероятности.

Точно также, как и для вероятности случайного события, для закона распределения СВ есть только два пути его отыскания. Либо мы строим схему случайного события и находим аналитическое выражение (формулу) вычисления вероятности (возможно, кто–то уже сделал или сделает это за нас! ), либо придется использовать эксперимент и по частотам наблюдений делать какие–то предположения (выдвигать гипотезы) о законе распределения. Заметим, что во втором случае нас будет ожидать новый вопрос, -а какова уверенность в том, что наша гипотеза верна? Какова, выражаясь языком статистики, вероятность ошибки при принятии гипотезы или при её отбрасывании? Продемонстрируем первый путь отыскания закона распределения. Пусть важной для нас случайной величиной является целое число, образуемое по следующему правилу: мы трижды бросаем симметричную монетку, выпадение герба считаем числом1 (в противном случае 0) и после трех бросаний определяем сумму S. Ясно, что эта сумма может принимать любое значение в диапазоне 0…3, но всё же - каковы вероятности P(S=0), P(S=1), P(S=2), P(S=3); что можно о них сказать, кроме очевидного вывода - их сумма равна 1? Попробуем построить схему интересующих нас событий. Обозначим через p вероятность получить 1 в любом бросании, а через q=(1–p) вероятность получить 0. Сообразим, что всего комбинаций ровно 8 (или 23), а поскольку монетка симметрична, то вероятность получить любую комбинацию трех независимых событий(000, 001, 010…111) одна и та же: q3 = q2·p =…= p3 = 0. 125 . Но если p # q , то варианты все тех же восьми комбинаций будут разными: Таблица 1-1

    Первое бросание
    0
    0
    0
    0
    1
    1
    1
    1
    Второе бросание
    0
    0
    1
    1
    0
    0
    1
    1
    Третье бросание
    0
    1
    0
    1
    0
    1
    0
    1
    Сумма S
    0
    1
    1
    2
    1
    2
    2
    3
    Вероятность P(S)
    q3
    q2·p
    q2·p
    q·p2
    q2·p
    q·p2
    q·p2
    p3

Запишем то, что уже знаем - сумма вероятностей последней строки должна быть равна единице: p3 +3·qp2 + 3·q2·p + q3 = (p + q)3 = 1.

Перед нами обычный бином Ньютона 3-й степени, но оказывается - его слагаемые четко определяют вероятности значений случайной величины S ! Мы “открыли” закон распределения СВ, образуемой суммированием результатов n последовательных наблюдений, в каждом из которых может появиться либо 1 (с вероятностью p), либо 0 (с вероятностью 1– p). Итог этого открытия достаточно скромен:

    · возможны всего N = 2 n вариантов значений суммы;

· вероятности каждого из вариантов определяются элементами разложения по степеням бинома (p + q) n ;

· такому распределению можно дать специальное название - биномиальное. Конечно же, мы опоздали со своим открытием лет на 300, но, тем не менее, попытка отыскания закона распределения с помощью построения схемы событий оказалась вполне успешной.

В общем случае биномиальный закон распределения позволяет найти вероятность события S = k в виде

P(S=k)=·pk·(1– p)n-k, {2–1} где - т. н. биномиальные коэффициенты, отыскиваемые из известного “треугольника Паскаля” или по правилам комбинаторики- как число возможных сочетаний из n элементов по k штук в каждом: = n·(n –1)· .... ·(n – k + 1)/ (1·2· ...... · k). {2–2} Многие дискретные СВ позволяют построить схему событий для вычисления вероятности каждого из допустимых для данной случайной величины значений. Конечно же, для каждого из таких, часто называемых "классическими", распределений уже давно эта работа проделана–широко известными и очень часто используемыми в прикладной статистике являются биномиальное и полиномиальное распределения, геометрическое и гипергеометрическое, распределение Паскаля и Пуассона и многие другие. Для почти всех классических распределений немедленно строились и публиковались специальные статистические таблицы, уточняемые по мере увеличения точности расчетов. Без использования многих томов этих таблиц, без обучения правилам пользования ими последние два столетия практическое использование статистики было невозможно.

Сегодня положение изменилось –нет нужды хранить данные расчетов по формулам (как бы последние не были сложны! ), время на использование закона распределения для практики сведено к минутам, а то и секундам.

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12


Новости


Быстрый поиск

Группа вКонтакте: новости

Пока нет

Новости в Twitter и Facebook

                   

Новости

© 2010.