Характеристики біноміального розподілу. Біноміальний розподіл


Звичайно, при обчисленні кумулятивної функції розподілу слід скористатися згаданою зв'язком біноміального і бета- розподілу. Цей спосіб явно краще безпосереднього підсумовування, коли n> 10.

У класичних підручниках по статистиці для отримання значень біноміального розподілу часто рекомендують використовувати формули, засновані на граничних теоремах (типу формули Муавра-Лапласа). Необхідно відмітити, що з чисто обчислювальної точки зоруцінність цих теорем близька до нуля, особливо зараз, коли практично на кожному столі стоїть потужний комп'ютер. Основний недолік наведених аппроксимаций - їх абсолютно недостатня точність при значеннях n, характерних для більшості додатків. Не меншим недоліком є ​​і відсутність скільки-небудь чітких рекомендацій про можливість застосування тієї чи іншої апроксимації (в стандартних текстах наводяться лише асимптотичні формулювання, вони не супроводжуються оцінками точності і, отже, мало корисні). Я б сказав, що обидві формули придатні лише при n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Я не розглядаю тут завдання пошуку квантилів: для дискретних розподілів вона тривіальна, а в тих завданнях, де такі розподілу виникають, вона, як правило, і не актуальна. Якщо ж квантилі все-таки знадобляться, рекомендую так переформулювати задачу, щоб працювати з p-значеннями (наблюденнимі значимість). Ось приклад: при реалізації деяких переборних алгоритмів на кожному кроці потрібно перевіряти статистичну гіпотезупро біноміальної випадкової величини. Відповідно до класичного підходу на кожному кроці потрібно обчислити статистику критерію і порівняти її значення з кордоном критичного безлічі. Оскільки, однак, алгоритм переборний, доводиться визначати кордон критичного безлічі кожен раз заново (адже від кроку до кроку обсяг вибірки змінюється), що непродуктивно збільшує тимчасові витрати. сучасний підхідрекомендує обчислювати спостереження значимість і порівнювати її з довірчою ймовірністю, економлячи на пошуку квантилів.

Тому в наведених нижче кодах відсутня обчислення оберненої функції, натомість приведена функція rev_binomialDF, яка обчислює ймовірність p успіху в окремому випробуванні по заданій кількості n випробувань, числу m успіхів в них і значенням y ймовірності отримати ці m успіхів. При цьому використовується вищезгадана зв'язок між біноміальним і бета розподілами.

Фактично, ця функція дозволяє отримувати кордону довірчих інтервалів. Справді, припустимо, що в n біноміальних випробуваннях ми отримали m успіхів. Як відомо, ліва межа двостороннього довірчого інтервалу для параметра p з довірчим рівнем дорівнює 0, якщо m = 0, а для розв'язує рівняння . Аналогічно, права межа дорівнює 1, якщо m = n, а для розв'язує рівняння . Звідси випливає, що для пошуку лівої межі ми повинні вирішувати щодо рівняння , А для пошуку правою - рівняння . Вони і вирішуються у функціях binom_leftCI і binom_rightCI, які повертають верхню і нижню межі двостороннього довірчого інтервалу відповідно.

Хочу зауважити, що якщо не потрібна зовсім вже неймовірна точність, то при досить великих n можна скористатися наступною апроксимацією [Б.Л. ван дер Варден, Математична статистика. М: ІЛ, 1960, гл. 2, розд. 7]: , Де g - квантиль нормального розподілу. Цінність цієї апроксимації в тому, що є дуже прості наближення, що дозволяють обчислювати квантилі нормального розподілу (див. Текст про обчислення нормального розподілу і відповідний розділ даного довідника). У моїй практиці (в основному, при n> 100) ця апроксимація давала приблизно 3-4 знака, чого, як правило, цілком достатньо.

Для обчислень за допомогою нижченаведених кодів потрібні файли betaDF.h, betaDF.cpp (див. Розділ про бета-розподіл), а також logGamma.h, logGamma.cpp (див. Додаток А). Ви можете подивитися також приклад використання функцій.

файл binomialDF.h

#ifndef __BINOMIAL_H__ #include "betaDF.h" double binomialDF (double trials, double successes, double p); / * * Нехай є "trials" незалежних спостережень * з імовірністю "p" успіху в кожному. * Обчислюється ймовірність B (successes | trials, p) того, що число * успіхів укладено між 0 і "successes" (включно). * / Double rev_binomialDF (double trials, double successes, double y); / * * Нехай відома ймовірність y настання не менше m успіхів * в trials випробуваннях схеми Бернуллі. Функція знаходить ймовірність p * успіху в окремому випробуванні. * * У обчисленнях використовується наступне співвідношення * * 1 - p = rev_Beta (trials-successes | successes + 1, y). * / Double binom_leftCI (double trials, double successes, double level); / * Нехай є "trials" незалежних спостережень * з імовірністю "p" успіху в кожному * і кількість успіхів одно "successes". * Обчислюється ліва межа двостороннього довірчого інтервалу * з рівнем значущості level. * / Double binom_rightCI (double n, double successes, double level); / * Нехай є "trials" незалежних спостережень * з імовірністю "p" успіху в кожному * і кількість успіхів одно "successes". * Обчислюється права межа двостороннього довірчого інтервалу * з рівнем значущості level. * / #Endif / * Ends #ifndef __BINOMIAL_H__ * /

файл binomialDF.cpp

/ ************************************************* ********** / / * Біноміальний розподіл * / / ******************************** *************************** / #include #include #include "betaDF.h" ENTRY double binomialDF (double n, double m, double p) / * * Нехай є "n" незалежних спостережень * з імовірністю "p" успіху в кожному. * Обчислюється ймовірність B (m | n, p) того, що число успіхів укладено * між 0 і "m" (включно), тобто * Суму біноміальних ймовірностей від 0 до m: * * m * - (n) j nj *> () p (1-p) * - (j) * j = 0 * * Обчислення не мають на увазі тупе підсумовування - використовується * наступна зв'язок з центральним бета-розподілом: * * B (m | n, p) = Beta (1-p | nm, m + 1). * * Аргументи повинні бути позитивними, причому 0<= p <= 1. */ { assert((n >0) && (p> = 0) && (p<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= N) return 1; else return BetaDF (n-m, m + 1) .value (1-p); ) / * BinomialDF * / ENTRY double rev_binomialDF (double n, double m, double y) / * * Нехай відома ймовірність y настання не менше m успіхів * в n випробуваннях схеми Бернуллі. Функція знаходить ймовірність p * успіху в окремому випробуванні. * * У обчисленнях використовується наступне співвідношення * * 1 - p = rev_Beta (y | n-m, m + 1). * / (Assert ((n> 0) && (m> = 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m> = 0) && (m<= n) && (y >= 0.5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m> = 0) && (m<= n) && (y >= 0.5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

Теорія ймовірності незримо присутній в нашому житті. Ми не звертаємо на це уваги, але кожна подія в нашому житті має ту чи іншу ймовірність. Беручи до уваги величезну кількість варіантів розвитку подій, нам стає необхідним визначати найбільш ймовірні і найменш вірогідні з них. Найбільш зручно аналізувати такі ймовірні дані графічно. У цьому нам може допомогти розподіл. Біноміальний - одне з найлегших і найточніших.

Перш ніж перейти безпосередньо до математики і теорії ймовірності, розберемося з тим, хто ж перший придумав такий вид розподілу і яка історія розвитку математичного апарату для цього поняття.

Історія

Поняття ймовірності відомо ще з давніх часів. Однак стародавні математики не надавали їй особливо значення і змогли закласти тільки основи для теорії, що стала згодом теорією ймовірності. Вони створили деякі комбінаторні методи, які сильно допомогли тим, хто пізніше створив і розвинув саму теорію.

У другій половині сімнадцятого століття почалося формування основних понять і методів теорії ймовірності. Були введені визначення випадкових величин, способи обчислення ймовірності простих і деяких складних незалежних і залежних подій. Продиктований такий інтерес до випадкових величин і можливостям був азартними іграми: кожна людина хотіла знати, які у нього шанси перемогти в грі.

Наступним етапом стало застосування в теорії ймовірності методів математичного аналізу. Цим зайнялися видатні математики, такі як Лаплас, Гаусс, Пуассон і Бернуллі. Саме вони просунули цю область математики на новий рівень. Саме Джеймс Бернуллі відкрив біноміальний закон розподілу. До речі, як ми пізніше з'ясуємо, на основі цього відкриття були зроблені ще кілька, які дозволили створити закон нормального розподілу і ще безліч інших.

Зараз, перш ніж почати описувати розподіл биномиальное, ми трохи освіжимо в пам'яті поняття теорії ймовірностей, напевно вже забуті зі шкільної лави.

Основи теорії ймовірностей

Будемо розглядати такі системи, в результаті дії яких можливі тільки два виходи: "успіх" і "не успіх". Це легко зрозуміти на прикладі: ми підкидаємо монетку, загадавши те, що випаде решка. Ймовірності кожного з можливих подій (випаде решка - "успіх", випаде орел - "не успіх") рівні 50 відсоткам при ідеальної балансуванню монети і відсутності інших факторів, які можуть вплинути на експеримент.

Це було найпростіше подія. Але бувають ще й складні системи, в яких виконуються послідовні дії, і вірогідність результатів цих дій будуть відрізнятися. Наприклад, розглянемо таку систему: в коробці, вміст якої ми не можемо розглядати, лежать шість абсолютно однакових кульок, три пари синього, червоного і білого кольорів. Ми повинні дістати навмання кілька кульок. Відповідно, витягнувши першим один з білих кульок, ми зменшимо в рази ймовірність того, що наступним нам теж попадеться білий кулька. Відбувається це тому, що змінюється кількість об'єктів в системі.

У наступному розділі розглянемо більш складні математичні поняття, впритул підводять нас до того, що означають слова " нормальний розподіл"," Біноміальний розподіл "і тому подібні.

Елементи математичної статистики

У статистиці, яка є однією з областей застосування теорії ймовірностей, існує безліч прикладів, коли дані для аналізу подані не в явному вигляді. Тобто не в чисельному, а у вигляді поділу за ознаками, наприклад, за статевими. Для того щоб застосувати до таких даних математичний апарат і зробити з отриманих результатів якісь висновки, потрібно перевести вихідні дані в числовий формат. Як правило, для здійснення цього позитивного результату привласнюють значення 1, а негативного - 0. Таким чином, ми отримуємо статистичні дані, які можна піддати аналізу за допомогою математичних методів.

Наступний крок в розумінні того, що таке біноміальний розподіл випадкової величини, - це визначення дисперсії випадкової величини і математичного очікування. Про це поговоримо в наступному розділі.

Математичне очікування

Насправді зрозуміти те, що таке математичне очікування, не складно. Розглянемо систему, в якій існує багато різних подій зі своїми різними можливостями. Математичним очікуванням буде називатися величина, рівна сумітворів значень цих подій (а математичному вигляді, про який ми говорили в попередньому розділі) на ймовірності їх здійснення.

Математичне сподівання біноміального розподілу розраховується за тією ж самою схемою: ми беремо значення випадкової величини, множимо його на ймовірність позитивного результату, а потім підсумовуємо отримані дані для всіх величин. Дуже зручно представити ці дані графічно - так краще сприймається різниця між математичними очікуваннями різних величин.

У наступному розділі ми розповімо вам трохи про інше поняття - дисперсії випадкової величини. Воно теж тісно пов'язане з таким поняттям, як біноміальний розподіл ймовірностей, і є його характеристикою.

Дисперсія біноміального розподілу

Ця величина тісно пов'язана з попередньою і також характеризує розподіл статистичних даних. Вона являє собою середній квадрат відхилень значень від їх математичного очікування. Тобто дисперсія випадкової величини - це сума квадратів різниць між значенням випадкової величини і її математичним очікуванням, помножена на ймовірність цієї події.

Загалом, це все, що нам потрібно знати про дисперсії для розуміння того, що таке біноміальний розподіл ймовірностей. Тепер перейдемо безпосередньо до нашої основної теми. А саме до того, що ж криється за таким на вигляд досить складним словосполученням "біноміальний закон розподілу".

Біноміальний розподіл

Розберемося для початку, чому ж це розподіл биномиальное. Воно походить від слова "біном". Може бути, ви чули про біном Ньютона - такій формулі, за допомогою якої можна розкласти суму двох будь-яких чисел a і b в будь-який неотрицательной ступеня n.

Як ви, напевно, вже здогадалися, формула бінома Ньютона і формула біноміального розподілу - це практично однакові формули. За тим лише винятком, що друга має прикладне значеннядля конкретних величин, а перша - лише загальний математичний інструмент, застосування якого на практиці можуть бути різні.

формули розподілу

Функція біноміального розподілу може бути записана у вигляді суми наступних членів:

(N! / (N-k)! K!) * P k * q n-k

Тут n - число незалежних випадкових експериментів, p- число вдалих результатів, q- кількість невдалих результатів, k - номер експерименту (може приймати значення від 0 до n) ,! - позначення факторіала, такої функції числа, значення якої дорівнює добутку всіх, хто йде до неї чисел (наприклад, для числа 4: 4! = 1 * 2 * 3 * 4 = 24).

Крім цього, функція біноміального розподілу може бути записана у вигляді неповної бета-функції. Однак це вже більш складне визначення, яке використовується тільки при вирішенні складних статистичних задач.

Біноміальний розподіл, приклади якого ми розглянули вище, - одне з найбільш простих видіврозподілів в теорії ймовірностей. Існує також нормальний розподіл, що є одним з видів біноміального. Воно використовується найчастіше, і найбільш просто в розрахунках. Буває також розподіл Бернуллі, розподіл Пуассона, умовний розподіл. Всі вони характеризують графічно області ймовірності того чи іншого процесу при різних умовах.

У наступному розділі розглянемо аспекти, що стосуються застосування цього математичного апарату в реальному житті. На перший погляд, звичайно, здається, що це чергова математична штука, яка, як правило, не знаходить застосування в реальному житті, і взагалі не потрібна нікому, окрім самих математиків. Однак це далеко не так. Адже всі види розподілів і їх графічні уявлення були створені виключно під практичні цілі, а не в якості примхи вчених.

застосування

Безумовно, найважливіше застосування розподілу знаходять в статистиці, адже там потрібен комплексний аналізбезлічі даних. Як показує практика, дуже багато масиви даних мають приблизно однакові розподілу величин: критичні області дуже низьких і дуже високих величин, як правило, містять менше елементів, ніж середні значення.

Аналіз великих масивів даних потрібно не тільки в статистиці. Він незамінний, наприклад, у фізичній хімії. У цій науці він використовується для визначення багатьох величин, які пов'язані з випадковими коливаннями і переміщеннями атомів і молекул.

У наступному розділі розберемося, наскільки важливо застосування таких статистичних понять, як биномиальное розподіл випадкової величини в повсякденному життідля нас з вами.

Навіщо мені це треба?

Багато хто задає собі таке питання, коли справа стосується математики. А між іншим, математика не дарма називається царицею наук. Вона є основою фізики, хімії, біології, економіки, і в кожній з цих наук застосовується в тому числі і будь-який розподіл: будь це дискретне біноміальний розподіл, або ж нормальне, не важливо. І якщо ми краще придивимося до навколишнього світу, то побачимо, що математика застосовується скрізь: у повсякденному житті, на роботі, і в тому числі людські відносиниможна представити у вигляді статистичних даних і провести їх аналіз (так, до речі, і роблять ті, хто працюють в спеціальних організаціях, що займаються збором інформації).

Зараз поговоримо трохи про те, що ж робити, якщо вам потрібно знати по даній темі набагато більше, ніж те, що ми виклали в цій статті.

Та інформація, що ми дали в цій статті, далеко не повна. Існує безліч нюансів, стосовно того, яку форму може приймати розподіл. Біноміальний розподіл, як ми вже з'ясували, є одним з основних видів, на якому ґрунтується вся математична статистикаі теорія ймовірностей.

Якщо вам стало цікаво, чи в зв'язку з вашою роботою вам потрібно знати по цій темі набагато більше, потрібно буде вивчити спеціалізовану літературу. Почати слід з університетського курсу математичного аналізуі дійти там до розділу теорії ймовірностей. Також знадобляться знання в області рядів, адже біноміальний розподіл ймовірностей - це ні що інше, як ряд послідовних членів.

висновок

Перш ніж закінчити статтю, ми хотіли б розповісти ще одну цікаву річ. Вона стосується безпосередньо теми нашої статті і всієї математики в цілому.

Багато людей твердять, що математика - марна наука, і ніщо з того, що вони проходили в школі, їм не знадобилося. Але знання адже ніколи не буває зайвим, і якщо вам щось не стало в нагоді в житті, значить, ви просто цього не пам'ятаєте. Якщо у вас є знання, вони можуть вам допомогти, але якщо їх немає, то і допомоги від них чекати не доводиться.

Отже, ми розглянули поняття біноміального розподілу і всі пов'язані з ним визначення і поговорили про те, як же це застосовується в нашій з вами життя.

Розглянемо здійснення схеми Бернуллі, тобто прозводится серія повторних незалежних випробувань, в кожному з яких дана подія А має одну і ту ж ймовірність, що не залежить від номера випробування. І для кожного випробування є тільки два виходи:

1) подія А - успіх;

2) подія - неуспіх,

з постійними ймовірностями

Введемо в розгляд дискретну випадкову величину Х - «число появ події А при пвипробуваннях »і знайдемо закон розподілу цієї випадкової величини. Величина Х може приймати значення

імовірність того, що випадкову величину Х прийме значення x kзнаходиться за формулою Бернуллі

Закон розподілу дискретної випадкової величини, що визначається формулою Бернуллі (1), називається біноміальним законом розподілу. постійні п і р (q = 1-p), Що входять в формулу (1) називаються параметрами біноміального розподілу.

Назва «біноміальний розподіл» пов'язане з тим, що права частина в рівність (1) це загальний член розкладання бінома Ньютона, тобто.

(2)

А так як p + q = 1, То права частина рівності (2) дорівнює 1

Це означає, що

(4)

У рівності (3) перший член q nв правій частині означає ймовірність того, що в пвипробуваннях подія А чи не з'явиться жодного разу, другий член ймовірність того, що подія А з'явиться один раз, третій член - ймовірність, що подія А з'явиться два рази і нарешті, останній член р п- ймовірність того, що подія А з'явиться рівно праз.

Біноміальний закон розподілу дискретної випадкової величини представляють у вигляді таблиці:

Х 0 1 k n
Р q n р п

Основні числові характеристики біноміального розподілу:

1) математичне очікування (5)

2) дисперсія (6)

3) середнє квадратичне відхилення (7)

4) найімовірніше число поява події k 0- це число якого при заданому пвідповідає максимальна Біноміальна ймовірність

при заданих пі рце число визначається нерівностями

(8)

якщо число пр + рне є цілим, то k 0одно цілої частини цього числа, якщо ж пр + р- ціле число, то k 0має два значення

Біноміальний закон розподілу ймовірностей застосовується в теорії стрільби, в теорії і практиці статистичного контролюякості продукції, в теорії масового обслуговування, в теорії надійності і т.д. Цей закон може застосовуватися в усіх випадках, коли має місце послідовність незалежних випробувань.

Приклад 1:Перевіркою якості встановлено, що з кожних 100 приладів не мають дефекти 90 штук в середньому. Скласти біноміальний закон розподілу ймовірностей числа якісних приладів з придбаних навмання 4.


Рішення:Подія А - поява якого перевіряється це - «придбаний навмання прилад якісний». За умовою завдання основні параметри біноміального розподілу:

Випадкова величина Х - число якісних приладів з узятих 4, значить значення Х -Знайдіть ймовірності значень Х за формулою (1):


Таким чином, закон розподілу величини Х - число якісних приладів з узятих 4:

Х 0 1 2 3 4
Р 0,0001 0,0036 0,0486 0,2916 0,6561

Для перевірки правильності побудови розподілу перевіримо чому дорівнює сума ймовірностей

відповідь:закон розподілу

Х 0 1 2 3 4
Р 0,0001 0,0036 0,0486 0,2916 0,6561

Приклад 2:Застосовуваний метод лікування призводить до одужання в 95% випадків. П'ятеро хворих застосовували даний метод. Знайти найімовірніше число видужали, а так само числові характеристики випадкової величини Х - число видужали з 5 хворих застосовували даний метод.

Розглянемо Біноміальний розподіл, обчислимо його математичне сподівання, дисперсію, моду. За допомогою функції MS EXCEL БІНОМ.РАСП () побудуємо графіки функції розподілу і щільності ймовірності. Зробимо оцінку параметра розподілу p, математичного очікування розподілу і стандартного відхилення. Також розглянемо розподіл Бернуллі.

визначення. нехай проводяться nвипробувань, в кожному з яких може відбутися тільки 2 події: подія «успіх» з ймовірністю p або подія «невдача» з ймовірністю q = 1-p (так звана Схема Бернуллі,Bernoullitrials).

Імовірність отримання рівно x успіхів в цих n випробуваннях дорівнює:

Кількість успіхів у вибірці x є випадковою величиною, яка має Біноміальний розподіл(Англ. Binomialdistribution) pі nє параметрами цього розподілу.

Нагадаємо, що для застосування схеми Бернулліі відповідно Біноміального розподілу,повинні бути виконані наступні умови:

  • кожне випробування має мати рівно два результату, умовно званих «успіхом» і «невдачею».
  • результат кожного випробування не повинен залежати від результатів попередніх випробувань (незалежність випробувань).
  • ймовірність успіху p повинна бути постійною для всіх випробувань.

Біноміальний розподіл в MS EXCEL

В MS EXCEL, починаючи з версії 2010, для є функція БІНОМ.РАСП (), англійська назва- BINOM.DIST (), яка дозволяє обчислити вірогідність того, що у вибірці буде рівно х«Успіхів» (тобто функцію щільності ймовірності p (x), см. формулу вище), і інтегральну функцію розподілу(Ймовірність того, що у вибірці буде xабо менше «успіхів», включаючи 0).

До MS EXCEL 2010 у EXCEL була функція БІНОМРАСП (), яка також дозволяє обчислити функцію розподілуі щільність ймовірності p (x). БІНОМРАСП () залишена в MS EXCEL 2010 року для сумісності.

У файлі прикладу наведені графіки щільності розподілу ймовірностіі .

Біноміальний розподілумає позначення B (n ; p) .

Примітка: Для побудови інтегральної функції розподілуідеально підходить діаграма типу Графік, для щільності розподілуГістограма з угрупованням. Детальніше про побудову діаграм читайте статтю Основні типи діаграм.

Примітка: Для зручності написання формул в файлі прикладу створені Імена для параметрів біноміального розподілу: N і p.

У файлі прикладу наведені різні розрахунки ймовірності за допомогою функцій MS EXCEL:

Як видно на зображенні вище, передбачається, що:

  • У нескінченній сукупності, з якої робиться вибірка, міститься 10% (або 0,1) придатних елементів (параметр p, Третій аргумент функції = БІНОМ.РАСП ())
  • Щоб обчислити вірогідність, того що у вибірці з 10 елементів (параметр n, Другий аргумент функції) буде рівно 5 придатних елементів (перший аргумент), потрібно записати формулу: = БІНОМ.РАСП (5; 10; 0,1; ЛОЖЬ)
  • Останній, четвертий елемент, встановлений = БРЕХНЯ, тобто повертається значення функції щільності розподілу .

Якщо значення четвертого аргументу = ІСТИНА, то функція БІНОМ.РАСП () повертає значення інтегральної функції розподілуабо просто функцію розподілу. В цьому випадку можна розрахувати ймовірність того, що у вибірці кількість придатних елементів буде з певного діапазону, наприклад, 2 або менше (включаючи 0).

Для цього потрібно записати формулу: = БІНОМ.РАСП (2; 10; 0,1; ІСТИНА)

Примітка: При нецілі значенні х,. Наприклад, такі формули повернуть одне і теж значення: = БІНОМ.РАСП ( 2 ; 10; 0,1; ІСТИНА)= БІНОМ.РАСП ( 2,9 ; 10; 0,1; ІСТИНА)

Примітка: У файлі прикладу щільність ймовірностіі функція розподілутакож обчислені з використанням визначення та функції ЧІСЛКОМБ ().

показники розподілу

В файлі прикладу на аркуші Прикладє формули для розрахунку деяких показників розподілу:

  • = N * p;
  • (Квадрата стандартного відхилення) = n * p * (1-p);
  • = (N + 1) * p;
  • = (1-2 * p) * Корінь (n * p * (1-p)).

виведемо формулу математичного очікуваннябіноміального розподілу, використовуючи схему Бернуллі .

За визначенням випадкова величина Х в схемою Бернуллі(Bernoulli random variable) має функцію розподілу :

Цей розподіл називається розподіл Бернуллі .

Примітка : розподіл Бернуллі- окремий випадок біноміального розподілуз параметром n = 1.

Згенеруємо 3 масиву по 100 чисел з різними можливостями успіху: 0,1; 0,5 і 0,9. Для цього у вікні Генерація випадкових чиселвстановимо наступні параметри для кожної ймовірності p:

Примітка: Якщо встановити опцію Випадкове розсіювання (Random Seed), То можна вибрати певний випадковий набір згенерованих чисел. Наприклад, встановивши цю опцію = 25 можна згенерувати на різних комп'ютерах одні й ті ж набори випадкових чисел (якщо, звичайно, інші параметри розподілу збігаються). Значення опції може приймати цілі значення від 1 до 32 767. Назва опції Випадкове розсіюванняможе заплутати. Краще було б її перевести як Номер набору з випадковими числами .

В результаті матимемо 3 стовпці по 100 чисел, на підставі яких можна, наприклад, оцінити ймовірність успіху pза формулою: Число успіхів / 100(Див. файл прикладу лист ГенераціяБернуллі).

Примітка: Для розподілу Бернулліз p = 0,5 можна використовувати формулу = СЛУЧМЕЖДУ (0; 1), яка відповідає.

Генерація випадкових чисел. Біноміальний розподіл

Припустимо, що у вибірці виявилося 7 дефектних виробів. Це означає, що «дуже ймовірна» ситуація, що змінилася частка дефектних виробів p, Яка є характеристикою нашого виробничого процесу. Хоча така ситуація «дуже ймовірна», але існує ймовірність (альфа-ризик, помилка 1-го роду, «помилкова тривога»), що все ж pзалишилася без змін, а збільшена кількість дефектних виробів обумовлено випадковістю вибірки.

Як видно на малюнку нижче, 7 - кількість дефектних виробів, яке допустимо для процесу з p = 0,21 при тому ж значенні Альфа. Це служить ілюстрацією, що при перевищенні порогового значення дефектних виробів у вибірці, p«Швидше за все» збільшилася. Фраза «швидше за все» означає, що існує всього лише 10% вірогідність (100% -90%) того, що відхилення частки дефектних виробів вище порогового викликано тільки сучайнимі причинами.

Таким чином, перевищення порогового кількості дефектних виробів у вибірці, може служити сигналом, що процес засмутився і став випускати б прольшие відсоток бракованих виробів.

Примітка: До MS EXCEL 2010 у EXCEL була функція КРІТБІНОМ (), яка еквівалентна БІНОМ.ОБР (). КРІТБІНОМ () залишена в MS EXCEL 2010 і вище для сумісності.

Зв'язок Біноміальний розподіл з іншими розподілами

якщо параметр nбіноміального розподілупрямує до нескінченності, а pпрагне до 0, то в цьому випадку Біноміальний розподілможе бути апроксимувати. Можна сформулювати умови, коли наближення розподілом Пуассонапрацює добре:

  • p(Чим менше pі більше n, Тим наближення точніше);
  • p >0,9 (враховуючи що q =1- p, Обчислення в цьому випадку необхідно проводити через qхпотрібно замінити на n - x). Отже, чим менше qі більше n, Тим наближення точніше).

при 0,110 Біноміальний розподілможна апроксимувати.

В свою чергу, Біноміальний розподілможе служити хорошим наближенням, коли розмір сукупності N гипергеометрического розподілунабагато більше розміру вибірки n (тобто, N >> n або n / N Детальніше про зв'язок вищевказаних розподілів, можна прочитати в статті. Там же наведені приклади апроксимації, і пояснені умови, коли вона можлива і з якою точністю.

ПОРАДА: Про інших розподілах MS EXCEL можна прочитати в статті.

Глава 7.

Конкретні закони розподілу випадкових величин

Види законів розподілу дискретних випадкових величин

Нехай дискретна випадкова величина може приймати значення х 1 , х 2 , …, х n, .... Ймовірності цих значень можуть бути обчислені за різними формулами, наприклад, за допомогою основних теорем теорії ймовірностей, формули Бернуллі або з якихось інших формулах. Для деяких з цих формул закон розподілу має свою назву.

Найбільш часто зустрічаються законами розподілу дискретної випадкової величини є біноміальний, геометричний, гіпергеометричний, закон розподілу Пуассона.

Біноміальний закон розподілу

нехай проводиться nнезалежних випробувань, в кожному з яких може з'явитися або не з'являться подія А. Імовірність появи цієї події в кожному одиничному випробуванні постійна, не залежить від номера випробування і дорівнює р=Р(А). Звідси вірогідність не появи події Ав кожному випробуванні також є сталою і дорівнює q=1–р. Розглянемо випадкову величину Хрівну числу появ події Ав nвипробуваннях. Очевидно, що значення цієї величини рівні

х 1 = 0 - подія Ав nвипробуваннях не з'явилося;

х 2 = 1 - подія Ав nвипробування з'явилося один раз;

х 3 = 2 - подія Ав nвипробування з'явилося два рази;

…………………………………………………………..

х n +1 = n- подія Ав nвипробування з'явилося все nраз.

Ймовірності цих значень можуть бути обчислені за формулою Бернуллі (4.1):

де до=0, 1, 2, …,n .

Біноміальним законом розподілу Х, рівній числууспіхів в nвипробуваннях Бернуллі, з імовірністю успіху р.

Отже, дискретна випадкова величина має біноміальний розподіл (або розподілена за біноміальним законом), якщо її можливі значення 0, 1, 2, ..., n, А відповідні ймовірності обчислюються за формулою (7.1).

Біноміальний розподіл залежить від двох параметрів рі n.

Ряд розподілу випадкової величини, розподіленої за біноміальним законом, має вигляд:

Х k n
Р

приклад 7.1 . Проводиться три незалежних пострілу по мішені. Ймовірність влучення при кожному пострілі дорівнює 0,4. Випадкова величина Х- число влучень в мішень. Побудувати її ряд розподілу.

Рішення. Можливими значеннями випадкової величини Хє х 1 =0; х 2 =1; х 3 =2; х 4 = 3. Знайдемо відповідні ймовірності, використовуючи формулу Бернуллі. Неважко показати, що застосування цієї формули тут цілком виправдано. Відзначимо, що вірогідність не попадання в ціль при одному пострілі буде дорівнює 1-0,4 = 0,6. отримаємо

Ряд розподілу має такий вигляд:

Х
Р 0,216 0,432 0,288 0,064

Неважко перевірити, що сума всіх ймовірностей дорівнює 1. Сама випадкова величина Хрозподілена за біноміальним законом. ■

Знайдемо математичне сподівання і дисперсію випадкової величини, розподіленої за біноміальним законом.

При вирішенні прикладу 6.5 було показано, що математичне очікування числа появ події Ав nнезалежних випробуваннях, якщо ймовірність появи Ав кожному випробуванні постійна і дорівнює р, так само n· р

У цьому прикладі використовувалася випадкова величина, розподілена за біноміальним законом. Тому рішення прикладу 6.5, по суті є доказом наступної теореми.

Теорема 7.1.Математичне сподівання дискретної випадкової величини, розподіленої за біноміальним законом, дорівнює добутку числа випробувань на ймовірність "успіху", тобто М(Х)=n· р.

Теорема 7.2.Дисперсія випадкової величини, розподіленої за біноміальним законом, дорівнює добутку числа випробувань на ймовірність "успіху" і на ймовірність "невдачі", тобто D(Х)=nрq.

Асиметрія і ексцес випадкової величини, розподіленої за біноміальним законом, визначаються за формулами

Ці формули можна отримати, скориставшись поняттям початкових і центральних моментів.

Біноміальний закон розподілу лежить в основі багатьох реальних ситуацій. При великих значеннях nбіноміальний розподіл може бути апроксимувати за допомогою інших розподілів, зокрема за допомогою розподілу Пуассона.

розподіл Пуассона

нехай є nвипробувань Бернуллі, при цьому число випробувань nдосить велике. Раніше було показано, що в цьому випадку (якщо до того ж ймовірність рподії Адуже мала) для знаходження ймовірності того, що подія Аз'явитися траз у випробуваннях можна скористатися формулою Пуассона (4.9). Якщо випадкова величина Хозначає число появ події Ав nвипробуваннях Бернуллі, то ймовірність того, що Хприйме значення kможе бути обчислена за формулою

, (7.2)

де λ = .

Законом розподілу Пуассонаназивається розподіл дискретної випадкової величини Х, Для якої можливими значеннями є цілі невід'ємні числа, а ймовірності р тцих значень знаходяться за формулою (7.2).

величина λ = називається параметромрозподілу Пуассона.

Випадкова величина, розподілена за законом Пуассона, може приймати безліч значень. Так як для цього розподілу ймовірність рпояви події в кожному випробуванні мала, то цей розподіл іноді називають законом рідкісних явищ.

Ряд розподілу випадкової величини, розподіленої за законом Пуассона, має вигляд

Х т
Р

Неважко переконатися, що сума ймовірностей другого рядка дорівнює 1. Для цього необхідно згадати, що функцію можна розкласти в ряд Маклорена, який сходиться для будь-якого х. В даному випадку маємо

. (7.3)

Як було відзначено, закон Пуассона в певних граничних випадках замінює біноміальний закон. Як приклад можна привести випадкову величину Х, Значення якої дорівнюють кількості збоїв за певний проміжок часу при багаторазовому застосуванні технічного пристрою. При цьому передбачається, що цей пристрій високої надійності, тобто ймовірність збою при одному застосуванні дуже мала.

Крім таких граничних випадків, на практиці зустрічаються випадкові величини, розподілені за законом Пуассона, не пов'язані з біноміальним розподілом. Наприклад, розподіл Пуассона часто використовується тоді, коли мають справу з числом подій, що з'являються в проміжку часу (число надходжень викликів на телефонну станцію протягом години, число машин, які прибули на авто мийку протягом доби, число зупинок верстатів в тиждень і т.п .). Всі ці події повинні утворювати, так званий потік подій, який є одним з основних понять теорії масового обслуговування. параметр λ характеризує середню інтенсивність потоку подій.

приклад 7.2 . На факультеті налічується 500 студентів. Яка ймовірність того, що 1 вересня є днем ​​народження для трьох студентів даного факультету?

Рішення . Так як число студентів n= 500 досить велике і р- ймовірність народиться першого вересня будь-якому зі студентів дорівнює, тобто досить мала, то можна вважати, що випадкова величина Х- число студентів, які народилися першого вересня, розподілена за законом Пуассона з параметром λ = np= = 1,36986. Тоді, за формулою (7.2) отримаємо

Теорема 7.3.Нехай випадкова величина Хрозподілена за законом Пуассона. Тоді її математичне сподівання і дисперсія рівні один одному і дорівнюють значенню параметра λ , Тобто M(X) = D(X) = λ = np.

Доведення.За визначенням математичного очікування, використовуючи формулу (7.3) і ряд розподілу випадкової величини, розподіленої за законом Пуассона, отримаємо

Перш, ніж знайти дисперсію, знайдемо спочатку математичне очікування квадрата розглянутої випадкової величини. отримуємо

Звідси, за визначенням дисперсії, отримуємо

Теорема доведена.

Застосовуючи поняття початкових і центральних моментів, можна показати, що для випадкової величини, розподіленої за законом Пуассона, коефіцієнти асиметрії і ексцесу визначаються за формулами

Неважко зрозуміти, що, так як за смисловим змістом параметр λ = npпозитивний, то у випадкової величини, розподіленої за законом Пуассона, завжди позитивні і асиметрія і ексцес.

Поділіться з друзями або збережіть для себе:

Завантаження ...