Статистичні методи. Імовірність і статистика - основні факти Ймовірносно статистичні методи дослідження

У багатьох випадках в гірничій науці необхідно досліджувати не тільки детерміновані, а й випадкові процеси. Все геомеханічні процеси протікають в безперервно змінних умовах, коли ті чи інші події можуть відбутися, а можуть і не відбутися. При цьому виникає необхідність аналізувати випадкові зв'язки.

Незважаючи на випадковий характер подій, вони підкоряються певним закономірностям, що розглядаються в теорії ймовірностей , Яка вивчає теоретичні розподілу випадкових величин і їх характеристики. Способами обробки і аналізу випадкових емпіричних подій займається інша наука, так звана математична статистика. Ці дві споріднені науки складають єдину математичну теорію масових випадкових процесів, широко застосовується в наукових дослідженнях.

Елементи теорії ймовірностей і матстатистику.під сукупністю розуміють безліч однорідних подій випадкової величини х, Яка становить первинний статистичний матеріал. Сукупність може бути генеральною (велика вибірка N), Що містить найрізноманітніші варіанти масового явища, і вибіркової (мала вибірка N 1), що представляє собою лише частина генеральної сукупності.

ймовірністю Р(х) події х називають відношення числа випадків N(х), Які призводять до настання події х, До загальної кількості можливих випадків N:

У математичній статистиці аналогом ймовірності є поняття частости події, що представляє собою відношення числа випадків, при яких мало місце подія, до загальної кількості подій:

При необмеженому зростанні числа подій частость прагне до ймовірності Р(х).



Припустимо, є якісь статистичні дані, представлені у вигляді ряду розподілу (гістограми) на рис. 4.11, тоді частость характеризує ймовірність появи випадкової величини в інтервалі і , А плавна крива носить назву функції розподілу.

Імовірність випадкової величини - це кількісна оцінка можливості її появи. Достовірна подія має Р\u003d 1, неможлива подія - Р\u003d 0. Отже, для випадкової події, а сума ймовірностей всіх можливих значень.

У дослідженнях недостатньо мати криву розподілу, а необхідно знати і її характеристики:

а) середньоарифметичне -; (4.53)

б) розмах - R= x max - x min, який можна використовувати для орієнтовної оцінки варіації подій, де x max і x min - екстремальні значення виміряної величини;

в) математичне очікування -. (4.54)

Для безперервних випадкових величин математичне сподівання записується у вигляді

, (4.55)

тобто одно дійсного значення спостережуваних подій х, А відповідна матожіданія абсциса називається центром розподілу.

г) дисперсія - , (4.56)

яка характеризує розсіювання випадкової величини по відношенню до математичного сподівання. Дисперсію випадкової величини інакше ще називають центральним моментом другого порядку.

Для неперервної випадкової величини дисперсія дорівнює

; (4.57)

д) середньоквадратичне відхилення або стандарт -

е) коефіцієнт варіації (відносне розсіювання) -

, (4.59)

який характеризує інтенсивність розсіювання в різних сукупностях і застосовується для їх порівняння.

Площа, розташована під кривою розподілу, відповідає одиниці, це означає, що крива охоплює всі значення випадкових величин. Однак таких кривих, які будуть мати площу, рівну одиниці, можна побудувати велику кількість, тобто вони можуть мати різне розсіювання. Мірою розсіювання і є дисперсія або середньоквадратичне відхилення (рис. 4.12).


Вище ми розглянули основні характеристики теоретичної кривої розподілу, які аналізує теорія ймовірностей. У статистиці оперують емпіричними розподілами, а основним завданням статистики є підбір теоретичних кривих за наявним емпіричному закону розподілу.

Нехай в результаті n вимірювань випадкової величини отримано варіаційний ряд х 1 , х 2 , х 3 , … х n. Обробка таких рядів зводиться до наступних операцій:

- групують х і в інтервалі і встановлюють для кожного з них абсолютну і відносні частості;

- за значеннями будують ступінчасту гистограмму (рис. 4.11);

- обчислюють характеристики емпіричної кривої розподілу: середнє арифметичне дисперсію Д\u003d; середньоквадратичне відхилення .

значенням, Д і s емпіричного розподілу відповідають величини, Д(х) і s(х) Теоретичного розподілу.



Розглянемо основні теоретичні криві розподілу. Найбільш часто в дослідженнях застосовують закон нормального розподілу (рис. 4.13), рівняння якого при має вигляд:

(4.60)

Якщо поєднати вісь координат з точкою m, Тобто прийняти m(x) \u003d 0 і прийняти, закон нормального розподілу буде описуватися більш простим рівнянням:

Для оцінки розсіювання зазвичай користуються величиною . чим менше s, Тим менше розсіювання, тобто спостереження мало відрізняється один від одного. Зі збільшенням sрозсіювання зростає, ймовірність похибок збільшується, а максимум кривої (ордината), рівний, зменшується. Тому значення у\u003d 1 / при 1 називають мірою точності. Середньоквадратичні відхилення і відповідають точкам перегину (заштрихована область на рис. 4.12) кривої розподілу.

При аналізі багатьох випадкових дискретних процесів використовують розподіл Пуассона (короткострокові події, які відбуваються в одиницю часу). Імовірність появи чисел рідкісних подій х \u003d 1, 2, ... за даний відрізок часу виражається законом Пуассона (див. Рис. 4.14):

, (4.62)

де х - число подій за даний відрізок часу t;

λ - щільність, тобто середнє число подій за одиницю часу;

- середнє число подій за час t;

Для закону Пуассона дисперсія дорівнює математичному очікуванню числа настання подій за час t, Тобто .

Для дослідження кількісних характеристик деяких процесів (часу відмов машин і т.д.) застосовують показовий закон розподілу (рис. 4.15), щільність розподілу якого виражається залежністю

де λ - інтенсивність (середнє число) подій в одиницю часу.

У показовому розподілі інтенсивність λ є величиною, зворотної математичного сподівання λ = 1/m(x). Крім того, справедливо співвідношення.

У різних областях досліджень широко застосовується закон розподілу Вейбулла (рис. 4.16):

, (4.64)

де n, μ , - параметри закону; х - аргумент, найчастіше час.

Досліджуючи процеси, пов'язані з поступовим зниженням параметрів (зниженням міцності порід в часі і т.д.), застосовують закон гамма-розподілу (рис. 4.17):

, (4.65)

де λ , a - параметри. якщо a\u003d 1, гамма функції перетворюється в показовий закон.

Крім наведених вище законів застосовують і інші види розподілів: Пірсона, Релея, бета - розподіл і ін.

Дисперсійний аналіз.У дослідженнях часто виникає питання: Якою мірою впливає той чи інший випадковий фактор на досліджуваний процес? Методи встановлення основних факторів і їх вплив на досліджуваний процес розглядаються в спеціальному розділі теорії ймовірностей і математичної статистики - дисперсійному аналізі. Розрізняють одно - і багатофакторний аналіз. Дисперсійний аналіз ґрунтується на використанні нормального закону розподілу і на гіпотезі, що центри нормальних розподілів випадкових величин рівні. Отже, всі виміри можна розглядати як вибірку з однієї і тієї ж нормальної сукупності.

Теорія надійності.Методи теорії ймовірностей і математичної статистики часто застосовують в теорії надійності, яка широко використовується в різних галузях науки і техніки. Під надійністю розуміють властивість об'єкта виконувати задані функції (зберігати встановлені експлуатаційні показники) протягом необхідного періоду часу. У теорії надійності відмови розглядаються як випадкові події. Для кількісного опису відмов застосовують математичні моделі - функції розподілу інтервалів часу (нормальне і експоненціальне розподіл, Вейбулла, гамма-розподілу). Завдання полягає в знаходженні ймовірностей різних показників.

Метод Монте-Карло.Для дослідження складних процесів імовірнісного характеру застосовують метод Монте-Карло.С допомогою цього методу вирішують завдання по знаходженню найкращого рішення з безлічі розглянутих варіантів.

Метод Монте-Карло інакше ще називають методом статистичного моделювання. Це чисельний метод, він заснований на використанні випадкових чисел, що моделюють ймовірні процеси. Математичною основою методу є закон великих чисел, який формулюється таким чином: при великому числі статистичних випробувань ймовірність того, що середньоарифметичне значення випадкової величини прагне до її математичного сподівання, Дорівнює 1:

, (4.64)

де ε - будь-яке мале позитивне число.

Послідовність рішення завдань методом Монте-Карло:

- збір, обробка та аналіз статистичних спостережень;

- відбір головних і відкидання другорядних факторів і складання математичної моделі;

- складання алгоритмів і рішення задач на ЕОМ.

Для вирішення завдань методом Монте-Карло необхідно мати статистичний ряд, знати закон його розподілу, середнє значення, математичне сподівання і середньоквадратичне відхилення. Рішення ефективно лише з використанням ЕОМ.

3. Суть ймовірносно-статистичних методів

Як підходи, ідеї і результати теорії ймовірностей і математичної статистики використовуються при обробці даних - результатів спостережень, вимірювань, випробувань, аналізів, дослідів з метою прийняття практично важливих рішень?

Базою є імовірнісна модель реального явища або процесу, тобто математична модель, в якій об'єктивні співвідношення виражені в термінах теорії ймовірностей. Ймовірності використовуються насамперед для опису невизначеностей, які необхідно враховувати при прийнятті рішень. Маються на увазі як небажані можливості (ризики), так і привабливі ( «щасливий випадок»). Іноді випадковість вноситься в ситуацію свідомо, наприклад, при жеребкуванні, випадковому відборі одиниць для контролю, проведення лотерей або опитувань споживачів.

Теорія ймовірностей дозволяє по одним можливостям розрахувати інші, цікаві для дослідника. Наприклад, за ймовірністю випадання герба можна розрахувати ймовірність того, що при 10 киданнях монет випаде не менше 3 гербів. Подібний розрахунок спирається на вірогідну модель, згідно з якою кидання монет описуються схемою незалежних випробувань, крім того, випадання герба і решітки рівноможливими, а тому ймовірність кожного з цих подій дорівнює ½. Складнішою є модель, в якій замість кидання монети розглядається перевірка якості одиниці продукції. Відповідна імовірнісна модель спирається на припущення про те, що контроль якості різних одиниць продукції описується схемою незалежних випробувань. На відміну від моделі з киданням монет необхідно ввести новий параметр - ймовірність р того, що одиниця продукції є дефектною. Модель буде повністю описана, якщо прийняти, що всі одиниці продукції мають однакову ймовірність виявитися дефектними. Якщо останнє припущення невірно, то число параметрів моделі зростає. Наприклад, можна прийняти, що кожна одиниця продукції має свою ймовірність опинитися дефектної.

Обговоримо модель контролю якості із загальною для всіх одиниць продукції ймовірністю дефектності р. Щоб при аналізі моделі «дійти до числа», необхідно замінити р на деяке конкретне значення. Для цього необхідно вийти з рамок ймовірнісної моделі і звернутися до даних, отриманих при контролі якості. Математична статистика вирішує зворотну задачу по відношенню до теорії ймовірностей. Її мета - на основі результатів спостережень (вимірювань, аналізів, випробувань, дослідів) отримати висновки про ймовірності, що лежать в основі ймовірнісної моделі. Наприклад, на основі частоти появи дефектних виробів при контролі можна зробити висновки про ймовірність дефектності (див. Обговорення вище сиспользованием теореми Бернуллі). На основі нерівності Чебишева робилися висновки про відповідність частоти появи дефектних виробів гіпотезі про те, що ймовірність дефектності приймає певне значення.

Таким чином, застосування математичної статистики спирається на вірогідну модель явища чи процесу. Використовуються два паралельних ряди понять - пов'язані з теорії (ймовірнісної моделі) і відносяться до практиці (вибірці результатів спостережень). Наприклад, теоретичної ймовірності відповідає частота, знайдена по вибірці. Математичного сподівання (теоретичний ряд) відповідає вибіркове середнє арифметичне (практичний ряд). Як правило, вибіркові характеристики є оцінками теоретичних. При цьому величини, що відносяться до теоретичного ряду, «знаходяться в головах дослідників», відносяться до світу ідей (по давньогрецького філософа Платона), недоступні для безпосереднього вимірювання. Дослідники мають у своєму розпорядженні лише вибірковими даними, за допомогою яких вони намагаються встановити, що цікавлять їх властивості теоретичної ймовірнісної моделі.

Навіщо ж потрібна імовірнісна модель? Справа в тому, що тільки з її допомогою можна перенести властивості, встановлені за результатами аналізу конкретної вибірки, на інші вибірки, а також на всю так звану генеральну сукупність. Термін «генеральна сукупність» використовується, коли мова йде про великий, але кінцевої сукупності досліджуваних одиниць. Наприклад, про сукупності всіх жителів Росії або сукупності всіх споживачів розчинної кави в Москві. Мета маркетингових або соціологічних опитувань полягає в тому, щоб твердження, отримані за вибіркою з сотень або тисяч чоловік, перенести на генеральні сукупності в кілька мільйонів чоловік. При контролі якості в ролі генеральної сукупності виступає партія продукції.

Щоб перенести висновки з вибірки на ширшу сукупність, необхідні ті чи інші припущення про зв'язок вибіркових характеристик з характеристиками цієї ширшої сукупності. Ці припущення засновані на відповідній ймовірнісної моделі.

Звичайно, можна обробляти вибіркові дані, не використовуючи ту чи іншу вірогідну модель. Наприклад, можна розраховувати вибіркове середнє арифметичне, підраховувати частоту виконання тих чи інших умов і т.п. Однак результати розрахунків будуть ставитися тільки до конкретної вибірці, перенесення отриманих з їх допомогою висновків на будь-яку іншу сукупність некоректний. Іноді подібну діяльність називають «аналіз даних». У порівнянні з ймовірносно-статистичними методами аналіз даних має обмежену пізнавальну цінність.

Отже, використання імовірнісних моделей на основі оцінювання та перевірки гіпотез за допомогою вибіркових характеристик - ось суть ймовірносно-статистичних методів прийняття рішень.

Підкреслимо, що логіка використання вибіркових характеристик для прийняття рішень на основі теоретичних моделей припускає одночасне використання двох паралельних рядів понять, один з яких відповідає імовірнісним моделям, а другий - вибірковими даними. На жаль, в ряді літературних джерел, зазвичай застарілих небудь написаних в рецептурному дусі, не робиться відмінності між вибірковими і теоретичними характеристиками, що призводить читачів до здивування і помилок при практичному використанні статистичних методів.

Попередня

Частина 1. Фундамент прикладної статистики

1.2.3. Суть ймовірносно-статистичних методів прийняття рішень

Як підходи, ідеї і результати теорії ймовірностей і математичної статистики використовуються при прийнятті рішень?

Базою є імовірнісна модель реального явища або процесу, тобто математична модель, в якій об'єктивні співвідношення виражені в термінах теорії ймовірностей. Ймовірності використовуються насамперед для опису невизначеностей, які необхідно враховувати при прийнятті рішень. Маються на увазі як небажані можливості (ризики), так і привабливі ( «щасливий випадок»). Іноді випадковість вноситься в ситуацію свідомо, наприклад, при жеребкуванні, випадковому відборі одиниць для контролю, проведення лотерей або опитувань споживачів.

Теорія ймовірностей дозволяє по одним можливостям розрахувати інші, цікаві для дослідника. Наприклад, за ймовірністю випадання герба можна розрахувати ймовірність того, що при 10 киданнях монет випаде не менше 3 гербів. Подібний розрахунок спирається на вірогідну модель, згідно з якою кидання монет описуються схемою незалежних випробувань, крім того, випадання герба і решітки рівноможливими, а тому ймовірність кожного з цих подій дорівнює ½. Складнішою є модель, в якій замість кидання монети розглядається перевірка якості одиниці продукції. Відповідна імовірнісна модель спирається на припущення про те, що контроль якості різних одиниць продукції описується схемою незалежних випробувань. На відміну від моделі з киданням монет необхідно ввести новий параметр - ймовірність р того, що одиниця продукції є дефектною. Модель буде повністю описана, якщо прийняти, що всі одиниці продукції мають однакову ймовірність виявитися дефектними. Якщо останнє припущення невірно, то число параметрів моделі зростає. Наприклад, можна прийняти, що кожна одиниця продукції має свою ймовірність опинитися дефектної.

Обговоримо модель контролю якості із загальною для всіх одиниць продукції ймовірністю дефектності р. Щоб при аналізі моделі «дійти до числа», необхідно замінити р на деяке конкретне значення. Для цього необхідно вийти з рамок ймовірнісної моделі і звернутися до даних, отриманих при контролі якості. Математична статистика вирішує зворотну задачу по відношенню до теорії ймовірностей. Її мета - на основі результатів спостережень (вимірювань, аналізів, випробувань, дослідів) отримати висновки про ймовірності, що лежать в основі ймовірнісної моделі. Наприклад, на основі частоти появи дефектних виробів при контролі можна зробити висновки про ймовірність дефектності (див. Теорему Бернуллі вище). На основі нерівності Чебишева робилися висновки про відповідність частоти появи дефектних виробів гіпотезі про те, що ймовірність дефектності приймає певне значення.

Таким чином, застосування математичної статистики спирається на вірогідну модель явища чи процесу. Використовуються два паралельних ряди понять - пов'язані з теорії (ймовірнісної моделі) і відносяться до практиці (вибірці результатів спостережень). Наприклад, теоретичної ймовірності відповідає частота, знайдена по вибірці. Математичного сподівання (теоретичний ряд) відповідає вибіркове середнє арифметичне (практичний ряд). Як правило, вибіркові характеристики є оцінками теоретичних. При цьому величини, що відносяться до теоретичного ряду, «знаходяться в головах дослідників», відносяться до світу ідей (по давньогрецького філософа Платона), недоступні для безпосереднього вимірювання. Дослідники мають у своєму розпорядженні лише вибірковими даними, за допомогою яких вони намагаються встановити, що цікавлять їх властивості теоретичної ймовірнісної моделі.

Навіщо ж потрібна імовірнісна модель? Справа в тому, що тільки з її допомогою можна перенести властивості, встановлені за результатами аналізу конкретної вибірки, на інші вибірки, а також на всю так звану генеральну сукупність. Термін «генеральна сукупність» використовується, коли мова йде про великий, але кінцевої сукупності досліджуваних одиниць. Наприклад, про сукупності всіх жителів Росії або сукупності всіх споживачів розчинної кави в Москві. Мета маркетингових або соціологічних опитувань полягає в тому, щоб твердження, отримані за вибіркою з сотень або тисяч чоловік, перенести на генеральні сукупності в кілька мільйонів чоловік. При контролі якості в ролі генеральної сукупності виступає партія продукції.

Щоб перенести висновки з вибірки на ширшу сукупність, необхідні ті чи інші припущення про зв'язок вибіркових характеристик з характеристиками цієї ширшої сукупності. Ці припущення засновані на відповідній ймовірнісної моделі.

Звичайно, можна обробляти вибіркові дані, не використовуючи ту чи іншу вірогідну модель. Наприклад, можна розраховувати вибіркове середнє арифметичне, підраховувати частоту виконання тих чи інших умов і т.п. Однак результати розрахунків будуть ставитися тільки до конкретної вибірці, перенесення отриманих з їх допомогою висновків на будь-яку іншу сукупність некоректний. Іноді подібну діяльність називають «аналіз даних». У порівнянні з ймовірносно-статистичними методами аналіз даних має обмежену пізнавальну цінність.

Отже, використання імовірнісних моделей на основі оцінювання та перевірки гіпотез за допомогою вибіркових характеристик - ось суть ймовірносно-статистичних методів прийняття рішень.

Підкреслимо, що логіка використання вибіркових характеристик для прийняття рішень на основі теоретичних моделей припускає одночасне використання двох паралельних рядів понять, один з яких відповідає імовірнісним моделям, а другий - вибірковими даними. На жаль, в ряді літературних джерел, зазвичай застарілих небудь написаних в рецептурному дусі, не робиться відмінності між вибірковими і теоретичними характеристиками, що призводить читачів до здивування і помилок при практичному використанні статистичних методів.

Попередня

Ймовірносно-статистичні методи моделювання економічних систем


Вступ


Під завданням ідентифікації закону розподілу спостережуваної випадкової величини (структурно-параметричної ідентифікації), як правило, розуміють завдання вибору такої параметричної моделі закону розподілу ймовірностей, яка найкращим чином відповідає результатам експериментальних спостережень. Випадкові помилки засобів вимірювальної техніки не так вже й часто підкоряються нормальному закону, точніше, не так часто добре описуються моделлю нормального закону. В основі вимірювальних приладів і систем лежать різні фізичні принципи, різні методи вимірювань і різні перетворення вимірювальних сигналів. Похибки вимірювань як величини є наслідком впливу безлічі факторів, випадкового і невипадкового характеру, що діють постійно або епізодично. Тому зрозуміло, що тільки при виконанні певних передумов (теоретичних і технічних) похибки вимірювань досить добре описуються моделлю нормального закону.

Взагалі кажучи, слід розуміти, що істинний закон розподілу (якщо він, звичайно, існує), що описує похибки конкретної вимірювальної системи, залишається (залишиться) невідомим, не дивлячись на всі наші спроби його ідентифікувати. На підставі даних вимірювань і теоретичних міркувань ми можемо тільки підібрати вірогідну модель, яка в певному сенсі найкращим чином наближає цей істинний закон. Якщо побудована модель адекватна, тобто застосовувані критерії не дають підстав для її відхилення, то на основі даної моделі можна обчислити всі питання, що цікавлять нас імовірнісні характеристики випадкової складової похибки вимірювального засобу, які будуть відрізнятися від дійсних значень тільки за приводу не виключеною систематичної (ненаблюдаемой або нерегистрируемой ) складової похибки вимірювань. Її трохи і характеризує правильність вимірювань. Безліч можливих законів розподілу ймовірностей, які можна використовувати для опису спостережуваних випадкових величин, не обмежена. Безглуздо ставити за мету завдання ідентифікації знаходження істинного закону розподілу спостережуваної величини. Ми можемо лише вирішувати завдання вибору найкращої моделі з деякого безлічі. Наприклад, з того безлічі параметричних законів і се мейства розподілів, які використовуються в додатках, і згадка про яких можна знайти в літературних джерелах.

Класичний підхід до структурно-параметричної ідентифікації закону розподілу. Під класичним підходом будемо розуміти алгоритм вибору закону розподілу, цілком базується на апараті математичної статистики.


1. Елементарні поняття про випадкові події, величинах і функціях


Ми вже бачили, що для багатьох експериментів немає ніяких відмінностей в підрахунку ймовірностей подій, тоді як елементарні результати в цих експериментах дуже різняться. Але нас і повинні цікавити саме ймовірності подій, а не структура простору елементарних фіналів. Тому пора у всіх таких «схожих» експериментах замість самих різних елементарних фіналів використовувати, наприклад, числа. Інакше кажучи, кожному елементарному результату поставити у відповідність деякий дійсне число, і працювати тільки з числами.

Нехай задано ймовірнісний простір.

Визначення 26.функція називається випадковою величиною, Якщо для будь-якого борелівської безлічі безліч є подією, тобто належить - алгебри .

безліч , Що складається з тих елементарних фіналів , для яких належить , Називається повним прообразом множини.

зауваження 9 . Взагалі, нехай функція діє з безлічі в безліч , І задані -алгебри і підмножин і відповідно. функція називається вимірної, Якщо для будь-якого безлічі його повний прообраз належить.

Зауваження 10. Читач, який не хоче забивати собі голову абстракціями, пов'язаними з -алгебри подій і з измеримостью, може сміливо вважати, що будь-яка множина елементарних фіналів є подія, і, отже, випадкова величина є довільна функція з в . Неприємностей на практиці це не тягне, так що все подальше в цьому параграфі можна пропустити.

Тепер, позбувшись від байдужих читачів, спробуємо зрозуміти, навіщо випадкової величиною потрібна вимірність.

Якщо задана випадкова величина , Нам може знадобитися обчислити ймовірності виду , , , (І взагалі найрізноманітніші ймовірності попадання в борелевская безлічі на прямий). Це можливо лише якщо безлічі, що стоять під знаком ймовірності, є подіями - адже ймовірність є функція, певна тільки на -алгебри подій. Вимога вимірності рівнозначно тому, що для будь-якого борелівської безлічі визначена ймовірність.

Можна вимагати у визначенні 26 чогось іншого. Наприклад, щоб подією було потрапляння в будь-який інтервал: , Або в будь-який напівінтервал:.

Переконаємося, наприклад, що еквівалентні визначення 26 і 27:

Визначення 27. функція називається випадковою величиною, якщо для будь-яких речових безліч належить -алгебри .

Доведення еквівалентності визначень 26, 27.

якщо - випадкова величина в сенсі визначення 26, то вона буде випадковою величиною і в сенсі визначення 27, оскільки будь-який інтервал є борелевская безліччю.

Доведемо, що вірно і зворотне. Нехай для будь-якого інтервалу виконано . Ми повинні довести, що те ж саме вірно і для будь-яких борелевская множин.

Зберемо в безлічі всі підмножини речової прямої, прообрази яких є подіями. безліч вже містить всі інтервали . Покажемо тепер, що безліч є -алгебри. За визначенням, тоді і тільки тоді, коли безліч належить.

1. Переконаємося, що . але і, отже, .

2. Переконаємося, що для будь-якого . нехай . тоді , так як - -алгебра.

3. Переконаємося, що для будь-яких . нехай для всіх . але - -алгебра, тому

Ми довели, що - -алгебра і містить всі інтервали на прямій. але - найменша з -алгебр, що містять всі інтервали на прямій. отже, містить: .

Наведемо приклади вимірних і невимірних функцій.

Приклад 25. Підкидаємо кубик. нехай , І дві функції з в задані так: , . Поки не задана -алгебра , Не можна говорити про вимірності. Функція, вимірна відносно якоїсь -алгебри , Може не бути такою для іншого.

якщо є безліч всіх підмножин , то і є випадковими величинами, оскільки будь-яка множина елементарних фіналів належить , у тому числі й або . Можна записати відповідність між значеннями випадкових величин і і можливостями приймати ці значення в вигляді «Таблиці розподілу ймовірностей» або, коротко, «таблиці розподілу»:

Тут.


2. Нехай -алгебра подій складається з чотирьох множин:



тобто подією є, крім достовірного і неможливого подій, випадання парного або непарного числа очок. Переконаємося, що при такій порівняно бідної -алгебри ні , ні не є випадковими величинами, оскільки вони незмірно. Візьмемо, скажімо, . Бачимо, що і


2. Числові характеристики випадкових величин


Математичне очікування. Математичним очікуванням дискретної випадкової величини Х, яка приймає кінцеве число значень хi з вірогідністю р i, називається сума:


(6-а)


Математичним очікуванням неперервної випадкової величини Х називається інтеграл від твору її значень х на щільність розподілу ймовірностей f (x):


(6б)


Невласний інтеграл (6б) передбачається абсолютно збіжним (в іншому випадку говорять, що математичне сподівання М (Х) не існує). Математичне сподівання характеризує середнє значення випадкової величини Х. Його розмірність збігається з розмірністю випадкової величини. Властивості математичного очікування:



Дисперсія. Дисперсією випадкової величини Х називається число:



Дисперсія є характеристикою розсіювання значень випадкової величини Х щодо її середнього значення М (Х). Розмірність дисперсії дорівнює розмірності випадкової величини в квадраті. Виходячи з визначень дисперсії (8) і математичного очікування (5) для дискретної випадкової величини та (6) для неперервної випадкової величини отримаємо аналогічні вирази для дисперсії:



Тут m \u003d М (Х).

Властивості дисперсії:


(10)


Середнє квадратичне відхилення:


(11)


Так як розмірність середнього квадратичного відхилення та ж, що і у випадкової величини, воно частіше, ніж дисперсія, використовується як міра розсіювання.

Моменти розподілу.Поняття математичного очікування і дисперсії є окремими випадками більш загального поняття для числових характеристик випадкових величин - моментів розподілу. Моменти розподілу випадкової величини вводяться як математичні очікування деяких найпростіших функцій від випадкової величини. Так, моментом порядку k щодо точки х0називается математичне сподівання М (Х - х0) k. Моменти щодо початку координат х \u003d 0 називаються початковими моментами і позначаються:


(12)


Початковий момент першого порядку є центр розподілу даної випадкової величини:


(13)


Моменти щодо центру розподілу х \u003d m називаються центральними моментами і позначаються:


(14)


З (7) випливає, що центральний момент першого порядку завжди дорівнює нулю:


(15)


Центральні моменти не залежать від початку відліку значень випадкової величини, так як при зсуві на постійне значення С її центр розподілу зсувається на те ж значення С, а відхилення від центру не змінюється:


Х - m \u003d (Х - С) - (m - С).


Тепер очевидно, що дисперсія - це центральний момент другого порядку:


(16)


Асиметрія.Центральний момент третього порядку:


(17)


служить для оцінки асиметрії розподілу. Якщо розподіл симетрично відносно точки х \u003d m, то центральний момент третього порядку буде дорівнює нулю (як і всі центральні моменти непарних порядків). Тому, якщо центральний момент третього порядку відмінний від нуля, то розподіл не може бути симетричним. Величину асиметрії оцінюють за допомогою безрозмірного коефіцієнта асиметрії:


(18)


Знак коефіцієнта асиметрії (18) вказує на правобічним або лівостороннім асиметрію (рис. 2).


Мал. 1. Види асиметрії розподілів


Ексцес. Центральний момент четвертого порядку:


(19)


служить для оцінки так званого ексцесу, що визначає ступінь крутості (гостровершинності) кривої розподілу поблизу центру розподілу по відношенню до кривої нормального розподілу. Так як для нормального розподілу , То в якості ексцесу приймається величина:


(20)


На рис. 3 наведені приклади кривих розподілу з різними значеннями ексцесу. Для нормального розподілу Е \u003d 0. Криві, більш островершінние, ніж нормальна, мають позитивний ексцес, більш плосковершінние - негативний.


Мал. 2. Криві розподілу з різним ступенем крутості (ексцесом)


Моменти вищих порядків в інженерному застосуванні математичної статистики зазвичай не застосовуються.

Мода дискретної випадкової величини - це її найбільш ймовірне значення. Модою неперервної випадкової величини називається її значення, при якому щільність ймовірності максимальна (рис. 2). Якщо крива розподілу має один максимум, то розподіл називається унімодальне. Якщо крива розподілу має більше одного максимуму, то розподіл називається полімодальний. Іноді зустрічаються розподілу, криві яких мають не максимум, а мінімум. Такі розподілу називаються антімодальнимі. У загальному випадку мода і математичне сподівання випадкової величини не збігаються. В окремому випадку, для модального, тобто має моду, симетричного розподілу і за умови, що існує математичне сподівання, останнім збігається з модою і центром симетрії розподілу.

медіанавипадкової величини Х - це її значення Ме, для якого має місце рівність: тобто равновероятно, що випадкова величина Х виявиться менше або більше Ме. Геометрично медіана - це абсциса точки, в якій площа під кривою розподілу ділиться навпіл. У разі симетричного модального розподілу медіана, мода і математичне очікування збігаються.


. Статистична оцінка законів розподілу випадкових величин


Генеральною сукупністю - називається сукупність всіх підлягають вивченню об'єктів або можливих результатів всіх спостережень, вироблених в однакових умовах над одним об'єктом.

вибіркової сукупністю або вибіркою називається сукупність об'єктів або результатів спостереження над об'єктом, відібраних випадковим чином з генеральної сукупності.

об'ємом вибірки називається число об'єктів або спостережень в вибірці.

Конкретні значення вибірки називаються спостерігаються значеннями випадкової величини Х. Спостережувані значення заносяться до протоколу. Протокол є таблицею. Складений протокол є первинною формою записи обробки отриманого матеріалу. Для отримання достовірних, надійних висновків вибірка повинна бути досить представницькою за обсягом. Велика вибірка - це неврегульована безліч чисел. Для дослідження вибірку призводять до наочного впорядкованого вигляду. Для цього в протоколі знаходять найбільше та найменше значення випадкової величини. Вибірка, відсортована по зростанню, приведена в таблиці 1.

Таблиця 1. Протокол

8,66-5,49-4,11-3,48-2,9-2,32-1,82-1,09-0,440,64-8,31-4,71-3,92-3,41-2,85-2,31-1,82-1,01-0,430,71-8,23-4,68-3,85-3,33-2,83-2,29-1,8-0,99-0,430,73-7,67-4,6-3,85-3,25-2,77-2,27-1,77-0,95-0,310,99-6,64-4,43-3,81-3,08-2,72-2,25-1,73-0,89-0,31,03-6,6-4,38-3,8-3,07-2,67-2,19-1,38-0,70,041,05-6,22-4,38-3,77-3,01-2,6-2,15-1,32-0,560,081,13-5,87-4,25-3,73-3,01-2,49-2,09-1,3-0,510,151,76-5,74-4,18-3,59-2,99-2,37-2,01-1,28-0,490,262,95-5,68-4,14-3,49-2,98-2,33-1,91-1,24-0,480,534,42

розмахом вибірки називається різниця між найбільшим і найменшим значенням випадкової величини Х:

Розмах вибірки розбивають на k інтервалів - розрядів. Число розрядів встановлюють залежно від величини розмаху вибірки від 8 до 25, в цій роботі приймемо k \u003d 10.

Тоді довжина інтервалу дорівнюватиме:

У протоколі підрахуємо число спостережуваних значень, що потрапили в кожний інтервал, позначимо їх m1, m2, ..., m10. .

назвемо mi частотою попадання випадкової величини в i інтервал. Якщо будь-яка спостерігається значення випадкової величини збігається з кінцем інтервалу, то це значення випадкової величини за домовленістю відносять до одного з інтервалів.

Після того як визначили частоти mi, визначимо частости випадкової величини, тобто знайдемо відношення частот mi до загальної кількості спостережуваних значень n.

Частість, умова повноти -

Знайдемо середину кожного інтервалу:.

Складемо таблицю 2

Таблиця значень меж інтервалів і відповідних частостей , Де i \u003d 1, 2, 3, ..., k, називається статистичним рядом. Графічним зображенням статистичного ряду називається гістограма. Вона будується наступним чином: по осі абсцис відкладають інтервали і на кожному такому інтервалі, як на підставі, будується прямокутник, площа якого дорівнює відповідній частости.

, - висота прямокутника,.


Таблиця 2

Номер інтервалаЛевая межа інтервалаПравая межа інтервалаІнтервалСередіна інтервалаЧастота інтервалаЧастость інтервалаВисота прямо-угольніка1-8,66-7,352 (-8,66; -7,352) -8,00640,040,03062-7,352-6,044 (-7,352; -6,044) -6,69830 , 030,02293-6,044-4,736 (-6,044; -4,736) -5,3940,040,03064-4,736-3,428 (-4,736; -3,428) -4,082200,20,15295-3,428-2,12 (- 3,428; -2,12) -2,774260,260,19886-2,12-0,812 (-2,12; -0,812) -1,466180,180,13767-0,8120,496 (-0,812; 0,496) -0,158140,140,107080,4961,804 (0,496; 1,804) 1,1590,090,068891,8043,112 (1,804; 3,112) 2,45810,010,0076103,1124,42 (3,112; 4,42 ) 3,76610,010,0076Сумма1001

малюнок 3


Статистичної функцією розподілу називається частость випадкової величини, що не перевершує заданого значення Х:

Для дискретної випадкової величини Х статистична функція розподілу знаходиться за формулою:

Запишемо статистичну функцію розподілу в розгорнутому вигляді:

де - це середина інтервалу i, а - це відповідні частості, де i \u003d 1, 2, ..., k.

Графік статистичної функції розподілу є ступінчаста лінія, точками розриву якої є середини інтервалів, а кінцеві скачки рівні відповідним частотам.


малюнок 3


Обчислення числових характеристик статистичного ряду

Статистичне математичне очікування,

Статистична дисперсія,

Статистичне середньоквадратичне відхилення.

Статистичним математичним очікуванням або статистичними середнім називається середньоарифметичне спостережуваних значень випадкової величини Х.

статистичної дисперсією називається середньоарифметичне значення велічіниілі

При великому обсязі вибірки обчислення за формулами і призводять до громіздким викладкам. Для спрощення розрахунків використовують статистичний ряд з межами і частостей , Де i \u003d 1, 2, 3, ..., k, знаходять середини інтервалів , А потім всі елементи вибірки , Які потрапили в інтервал , Замінюють єдиним значенням , Тоді таких значень буде в кожному інтервалі.

де - середнє значення відповідного інтервалу ; - частость інтервалу

Таблиця 4. Числові характеристики

Частість PiXiPi (Xi-m) ^ 2 (Xi-m) ^ 2 * Pi1-8,0060,04-0,320231,486911,25952-6,6980,03-0,200918,518560,55563-5,390,04 -0,21568,971940,35894-4,0820,20-0,81642,847050,56945-2,7740,26-0,72120,143880,03746-1,4660,18-0,26390,862450,15527 -0,1580,14-0,02215,002740,700481,150,090,103512,564761,130892,4580,010,024623,548500,2355103,7660,010,037737,953980,3795Статістіческое математичне очікування -2,3947Статістіческая дисперсія 5,3822Статістіческое середньоквадратичне отклоненіе2,3200

Визначає положення центру угруповання спостережуваних значень випадкової величини.

, характеризують розсіювання спостережуваних значень випадкової величини навколо

У всякому статистичному розподілі неминуче присутні елементи випадковості. Однак при дуже великій кількості спостережень ці випадковості згладжуються, і випадкові явища виявляють властиву йому закономірність.

При обробці статистичного матеріалу доводиться вирішувати питання про те, як підібрати для даного статистичного ряду теоретичну криву. Ця теоретична крива розподілу повинна виражати істотні риси статистичного розподілу - це завдання називається завданням згладжування або вирівнювання статистичного ряду.

Іноді загальний вигляд розподілу випадкової величини Х випливає з самої природи цієї випадкової величини.

Нехай випадкова величина Х - це результат вимірювання деякої фізичної величини приладу.

Х \u003d точне значення фізичної величини + помилка приладу.

Випадкова помилка приладу при вимірюванні має сумарну природу і розподілена по нормальному закону. Отже таке ж розподіл має випадкова величина Х, тобто нормальний розподіл з щільністю ймовірності:


де, , .


параметри і визначаються так, щоб числові характеристики теоретичного розподілу були рівні відповідним числовим характеристикам статистичного розподілу. При нормальному розподілі вважають, що ,,, Тоді функція нормального розподілу набуде вигляду:

Таблиця 5. Вирівнююча крива

Номер інтервалаСередіна інтервалу Xi табульований функція Нормальна крива 1-8,0060-2,41870,02140,00922-6,6980-1,85490,07140,03083-5,3900-1,29110,17340,07474-4,0820-0,72730,30620,13205- 2,7740-0,16350,39360,1697M-2,394700,39890,17206-1,46600,40030,36820,15877-0,15800,96410,25070,108081,15001,52790,12420,053592,45802, 09170,04480,0193103,76602,65550,01170,0051

Теоретичну нормальну криву будуємо по точках на одному графіку з гістограмою статистичного ряду (Помилка! Джерело посилання не знайдено).


малюнок 6


Вирівнювання статистичної функції розподілу

Статистичну функцію розподілу вирівнюємо функцією розподілу нормального закону:



де ,, - функція Лапласа.


Таблиця 7. Функція розподілу

Номер інтервалаСередіна інтервалу Xi функція Лапласа функція розподілу 1-8,0060-2,4187-0,49220,00782-6,6980-1,8549-0,46820,03183-5,3900-1,2911-0,40170,09834-4,0820-0, 7273-0,26650,23355-2,7740-0,1635-0,06490,4351m-2,3947000,50006-1,46600,40030,15550,65557-0,15800,96410,33250,832581,15001, 52790,43670,936792,45802,09170,48180,9818103,76602,65550,49600,9960

Будуємо графік теоретичної функції розподілу по точках / разом з графіком статистичної функції розподілу.


малюнок 6


Нехай вивчається випадкова величина Х з математичним очікуванням і дисперсією , Обидва параметри невідомі.

Нехай х1, х2, х3, ..., хn - вибірка, отримана в результаті проведення n незалежних спостережень випадкової величини Х. Щоб підкреслити випадковий характер величин х1, х2, х3, ..., хn перепишемо їх у вигляді:

Х1, Х2, Х3, ..., Хn, де Хi - значення випадкової величини Х в i-му досвіді.

Потрібно на підставі цих досвідчених даних оцінити математичне сподівання і дисперсію випадкової величини. Такі оцінки називаються точковими, як оцінки m і D можна прийняти статистичне математичне очікування і статистичну дисперсію, де



До проведення досвіду вибірка Х1, Х2, Х3, ..., Хn є сукупність незалежних випадкових величин, які мають математичне сподівання і дисперсію, а значить розподіл ймовірності такі ж як і сама випадкова величина Х. Таким чином:


Де i \u003d 1, 2, 3, ..., n.


Виходячи з цього, знайдемо математичне сподівання і дисперсію випадкової величини (Користуючись властивостями математичного очікування).

Таким чином математичне очікування статистичного середнього одно точного значення математичного очікування m вимірюваної величини, а дисперсія статистичного середнього в n разів менше дисперсії окремих результатів вимірювань.


при


Це означає, що при великому обсязі вибірки N статистичне середні є величиною майже невипадковою, воно лише незначно відхиляється від точного значення випадкової величини m. Цей закон називається законом великих чисел Чебишева.

Точкові оцінки невідомих значень математичного очікування і дисперсії мають велике значення на початковому етапі обробки статичних даних. Їх недолік в тому, що невідомо з кокой точністю вони дають оцінюваний параметр.

Нехай по даній вибірці Х1, Х2, Х3, ..., Хn отримані точні статистичні оцінки і , Тоді числові характеристики випадкової величини Х будуть приблизно рівні . Для вибірки невеликого обсягу питання поточности оцінки істотний, тому що між m і , D і будуть недостатньо великі відхилення. Крім того при вирішенні практичних завдань потрібно не тільки знайти наближені значення m і D, а й оцінити їх точність і надійність. нехай , Тобто є точковою оцінкою для m. Очевидно, що тим точніше визначає m, чим менше модуль різниці . нехай , де ?>0, тоді, чим менше ?, тим точніше оцінка m. Таким чином, ?>0 характеризує точність оцінки параметра. Однак статистичні методи не дозволяють категорично стверджувати, що оцінка істинного значення m задовольняє , Можна лише говорити про ймовірність ?, з якої це нерівність виконується:

Таким чином, ? - це довірча ймовірність або надійність оцінки, значення ? вибираються заздалегідь залежно від розв'язуваної задачі. надійність ? прийнято вибирати 0.9; 0.95; 0.99; 0.999. Події з такою ймовірністю є практично достовірними. За заданою довірчою ймовірністю можна знайти число?\u003e 0 з .

Тоді отримаємо інтервал , Який накриває з ймовірністю ? справжнє значення математичного очікування m, довжина цього інтервалу дорівнює 2 ?. Цей інтервал називається довірчим інтервалом. А такий спосіб оцінки невідомого параметра m - інтервальним.



Нехай дана вибірка Х1, Х2, Х3, ..., Хn, і нехай по цій вибірці знайдено, ,.

Потрібно знайти довірчий інтервал для математичного очікування m з довірчою ймовірністю ?. величина є величина випадкова з математичним очікуванням, .

Випадкова величина має сумарну природу, при великому обсязі вибірки вона розподілена за законом близьким до нормального. Тоді ймовірність попадання випадкової величини в інтервал буде дорівнює:


де


де - функція Лапласа.

З формули (3) і таблиць функції Лапласа знаходимо число ?>0 і записуємо довірчий інтервал для точного значення випадкової величини Х з надійністю?.

У цій роботі значення ? замінимо , І тоді формула (3) набуде вигляду:

Знайдемо довірчий інтервал , В якому знаходиться математичне очікування. при ? \u003d 0.99, n \u003d 100, ,.

за таблицями Лапласа знаходимо:

Звідси? \u003d 0,5986.

Довірчий інтервал, в якому з імовірністю 99% знаходиться точне значення математичного очікування.


висновок

випадковий величина розподіл економічний

Рішення задач структурно-параметричної ідентифікації при обмежених обсягах вибірок, якими, як правило, мають метрологи, загострює проблему. У цьому випадку ще більш важливими виявляються коректність застосування статистичних методів аналізу, ис користування оцінок, що володіють найкращими статистичними властивостями, і критеріїв, що володіють найбільшою потужністю.

При вирішенні задач ідентифікації краще спиратися на класичний підхід. При ідентифікації рекомендується розглядати ширше безліч законів розподілу, в тому числі моделі у вигляді сумішей законів. В цьому випадку для будь-якого емпіричного розподілу ми завжди зможемо побудувати адекватну, статистично істотно більш обгрунтовану математичну модель.

Слід орієнтуватися на використання і розробку програмних систем, які забезпечують вирішення завдань структурно-параметричної ідентифікації законів розподілів при будь-якій формі реєстрованих спостережень (вимірювань), що включають сучасні методи статис тичного аналізу, орієнтуватися на широке, але коректне використання в дослідженнях методів комп'ютерного моделювання. Ми вже бачили, що для багатьох експериментів немає ніяких відмінностей в підрахунку ймовірностей подій, тоді як елементарні результати в цих експериментах дуже різняться. Але нас і повинні цікавити саме ймовірності подій, а не структура простору елементарних фіналів. Тому пора у всіх таких «схожих» експериментах замість самих різних елементарних фіналів використовувати, наприклад, числа. Інакше кажучи, кожному елементарному результату поставити у відповідність деякий дійсне число, і працювати тільки з числами.

Як використовуються теорія ймовірностей і математична статистика? Ці дисципліни - основа ймовірносно-статистичних методів прийняття рішень. Щоб скористатися їх математичним апаратом, необхідно завдання прийняття рішень висловити в термінах ймовірносно-статистичних моделей. Застосування конкретного ймовірносно-статистичного методу прийняття рішень складається з трьох етапів:

  • перехід від економічної, управлінської, технологічної реальності до абстрактного математико-статистичної схемою, тобто побудова імовірнісної моделі системи управління, технологічного процесу, процедури прийняття рішень, Зокрема за результатами статистичного контролю, і т.п .;
  • проведення розрахунків і отримання висновків чисто математичними засобами в рамках ймовірнісної моделі;
  • інтерпретація математико-статистичних висновків стосовно реальної ситуації і прийняття відповідного рішення (наприклад, про відповідність або невідповідність якості продукції встановленим вимогам, необхідності налагодження технологічного процесу і т.п.), зокрема, укладення (про частку дефектних одиниць продукції в партії, про конкретному виді законів розподілу контрольованих параметрів технологічного процесу та ін.).

Математична статистика використовує поняття, методи і результати теорії ймовірностей. Розглянемо основні питання побудови імовірнісних моделей прийняття рішень в економічних, управлінських, технологічних та інших ситуаціях. Для активного і правильного використання нормативно-технічних та інструктивно-методичних документів по ймовірносно-статистичних методів прийняття рішень потрібні попередні знання. Так, необхідно знати, за яких умов слід застосовувати той чи інший документ, яку вихідну інформацію необхідно мати для його вибору та застосування, які рішення повинні бути прийняті за результатами обробки даних і т.д.

Приклади застосування теорії ймовірностей і математичної статистики. Розглянемо кілька прикладів, коли ймовірносно-статистичні моделі є хорошим інструментом для вирішення управлінських, виробничих, економічних, народногосподарських завдань. Так, наприклад, в романі А.Н. Толстого "Ходіння по муках" (т.1) говориться: "майстерня дає двадцять три відсотка шлюбу, цієї цифри ви тримаєтеся, - сказав Струков Івану Іллічу".

Постає питання, як розуміти ці слова в розмові заводських менеджерів, оскільки одна одиниця продукції не може бути дефектна на 23%. Вона може бути або придатної, або дефектної. Напевно, Струков мав на увазі, що в партії великого обсягу міститься приблизно 23% дефектних одиниць продукції. Тоді виникає питання, а що значить "приблизно"? Нехай з 100 перевірених одиниць продукції 30 виявляться дефектними, або з 1000-300, або з 100000-30000 і т.д., треба звинувачувати Струкова у брехні?

Або інший приклад. Монетка, яку використовують як жереб, повинна бути "симетричною", тобто при її киданні в середньому в половині випадків повинен випадати герб, а в половині випадків - решітка (решка, цифра). Але що означає "в середньому"? Якщо провести багато серій по 10 бросаний в кожній серії, то часто будуть зустрічатися серії, в яких монетка 4 рази випадає гербом. Для симетричною монети це буде відбуватися в 20,5% серій. А якщо на 100000 бросаний виявиться 40000 гербів, то чи можна вважати монету симетричною? процедура прийняття рішень будується на основі теорії ймовірностей і математичної статистики.

Розглянутий приклад може здатися недостатньо серйозним. Однак це не так. Жеребкування широко використовується при організації промислових техніко-економічних експериментів, наприклад, при обробці результатів вимірювання показника якості (моменту тертя) підшипників в залежності від різних технологічних факторів (впливу лепьохіна середовища, методів підготовки підшипників перед виміром, впливу навантаження підшипників в процесі вимірювання і т. п.). Припустимо, необхідно порівняти якість підшипників в залежності від результатів зберігання їх в різних консерваційних маслах, тобто в оліях складу і. При плануванні такого експерименту виникає питання, які підшипники слід помістити в масло складу, а які - в масло складу, але так, щоб уникнути суб'єктивізму і забезпечити об'єктивність прийнятого рішення.

Відповідь на це питання може бути отриманий за допомогою жереба. Аналогічний приклад можна привести і з контролем якості будь-якої продукції. Щоб вирішити, відповідає чи не відповідає контрольована партія продукції встановленим вимогам, робиться вибірка. За результатами контролю вибірки робиться висновок про всю партії. В цьому випадку дуже важливо уникнути суб'єктивізму при формуванні вибірки, тобто необхідно, щоб кожна одиниця продукції в контрольованій партії мала однакову ймовірність бути відібраної у вибірку. У виробничих умовах відбір одиниць продукції у вибірку зазвичай здійснюють не за допомогою жереба, а за спеціальними таблицями випадкових чисел або за допомогою комп'ютерних датчиків випадкових чисел.

Аналогічні проблеми забезпечення об'єктивності порівняння виникають при зіставленні різних схем організації виробництва, Оплати праці, при проведенні тендерів і конкурсів, підбору кандидатів на вакантні посади і т.п. Усюди потрібна жеребкування або подібні до неї процедури. Пояснимо на прикладі виявлення найбільш сильною і другий за силою команд при організації турніру за олімпійською системою (хто програв вибуває). Нехай завжди сильніша команда перемагає більш слабку. Ясно, що найсильніша команда однозначно стане чемпіоном. Друга за силою команда вийде в фінал тоді і тільки тоді, коли до фіналу у неї не буде ігор з майбутнім чемпіоном. Якщо така гра буде запланована, то друга за силою команда у фінал не потрапить. Той, хто планує турнір, може або достроково "вибити" другу за силою команду з турніру, звівши її в першій же зустрічі з лідером, або забезпечити їй друге місце, забезпечивши зустрічі з більш слабкими командами аж до фіналу. Щоб уникнути суб'єктивізму, проводять жеребкування. Для турніру з 8 команд ймовірність того, що в фіналі зустрінуться дві найсильніші команди, дорівнює 4/7. Відповідно з імовірністю 3/7 друга за силою команда покине турнір достроково.

При будь-якому вимірі одиниць продукції (за допомогою штангенциркуля, мікрометра, амперметра і т.п.) є похибки. Щоб з'ясувати, чи є систематичні похибки, необхідно зробити багаторазові вимірювання одиниці продукції, характеристики якої відомі (наприклад, стандартного зразка). При цьому слід пам'ятати, що крім систематичної присутній і випадкова похибка.

Тому постає питання, як за результатами вимірювань дізнатися, чи є систематична похибка. Якщо відзначати тільки, чи є отримана при черговому вимірі похибка позитивною або негативною, то це завдання можна звести до попередньої. Дійсно, можна порівняти вимір з киданням монети, позитивну похибка - з випаданням герба, негативну - решітки (нульова похибка при достатній кількості поділок шкали практично ніколи не зустрічається). Тоді перевірка відсутності систематичної похибки еквівалентна перевірці симетричності монети.

Метою цих міркувань є зведення завдання перевірки відсутності систематичної похибки до задачі перевірки симетричності монети. Проведені міркування призводять до так званого "критерієм знаків" в математичній статистиці.

При статистичному регулюванні технологічних процесів на основі методів математичної статистики розробляються правила і плани статистичного контролю процесів, спрямовані на своєчасне виявлення розладнання технологічних процесів, вжиття заходів до їх налагодження та запобігання випуску продукції, що не відповідає встановленим вимогам. Ці заходи спрямовані на скорочення витрат виробництва і втрат від постачання неякісних одиниць продукції. При статистичному приймальному контролі на основі методів математичної статистики розробляються плани контролю якості шляхом аналізу вибірок з партій продукції. Складність полягає в тому, щоб уміти правильно будувати ймовірносно-статистичні моделі прийняття рішень, На основі яких можна відповісти на поставлені вище питання. У математичній статистиці для цього розроблені імовірнісні моделі і методи перевірки гіпотез, зокрема, гіпотез про те, що частка дефектних одиниць продукції дорівнює певному числу, наприклад, (згадайте слова Струкова з роману А.Н. Толстого).

завдання оцінювання. У ряді управлінських, виробничих, економічних, народногосподарських ситуацій виникають завдання іншого типу - завдання оцінки характеристик і параметрів розподілів ймовірностей.

Розглянемо приклад. Нехай на контроль надійшла партія з N електроламп. З цієї партії випадковим чином відібрана вибірка обсягом n електроламп. Виникає ряд природних питань. Як за результатами випробувань елементів вибірки визначити середній термін служби електроламп і з якою точністю можна оцінити цю характеристику? Як зміниться точність, якщо взяти вибірку більшого обсягу? При якому числі годин можна гарантувати, що не менше 90% електроламп прослужать і більше годин?

Припустимо, що при випробуванні вибірки обсягом електроламп дефектними виявилися електроламп. Тоді виникають наступні питання. Які межі можна вказати для числа дефектних електроламп в партії, для рівня дефектності і т.п.?

Або при статистичному аналізі точності і стабільності технологічних процесів слід оцінити такі показники якості, Як середнє значення контрольованого параметра і ступінь його розкиду в даному процесі. Відповідно до теорії ймовірностей як середнє значення випадкової величини доцільно використовувати її математичне сподівання, а в якості статистичної характеристики розкиду - дисперсію, середньоквадратичне відхилення або коефіцієнт варіації. Звідси виникає питання: як оцінити ці статистичні характеристики за вибірковими даними і з якою точністю це вдається зробити? Аналогічних прикладів можна навести дуже багато. Тут важливо було показати, як теорія ймовірностей і математична статистика можуть бути використані у виробничому менеджменті при прийнятті рішень в області статистичного управління якістю продукції.

Що таке "математична статистика"? Під математичною статистикою розуміють "розділ математики, присвячений математичним методам збору, систематизації, обробки й інтерпретації статистичних даних, а також використання їх для наукових або практичних висновків. Правила і процедури математичної статистики спираються на теорію ймовірностей, що дозволяє оцінити точність і надійність висновків, одержуваних в кожного завдання на підставі наявного статистичного матеріалу "[[2.2], с. 326]. При цьому статистичними даними називаються відомості про кількість об'єктів в будь-якої більш-менш великої сукупності, що володіють тими чи іншими ознаками.

За типом вирішуваних завдань математична статистика зазвичай ділиться на три розділи: опис даних, оцінювання і перевірка гіпотез.

По виду оброблюваних статистичних даних математична статистика ділиться на чотири напрямки:

  • одномірна статистика (статистика випадкових величин), в якій результат спостереження описується дійсним числом;
  • багатовимірний статистичний аналіз, де результат спостереження над об'єктом описується декількома числами (вектором);
  • статистика випадкових процесів і часових рядів, де результат спостереження - функція;
  • статистика об'єктів нечислової природи, в якій результат спостереження має нечислову природу, наприклад, є безліччю (геометричною фігурою), упорядкуванням або отриманий в результаті вимірювання за якісною ознакою.

Історично першими з'явилися деякі області статистики об'єктів нечислової природи (зокрема, завдання оцінювання частки шлюбу і перевірки гіпотез про неї) і одномірна статистика. Математичний апарат для них простіше, тому на їх прикладі зазвичай демонструють основні ідеї математичної статистики.

Лише ті методи обробки даних, тобто математичної статистики, є доказовими, які спираються на імовірнісні моделі відповідних реальних явищ і процесів. Мова йде про моделі поведінки споживачів, виникнення ризиків, функціонування технологічного обладнання, отримання результатів експерименту, перебігу захворювання і т.п. Вірогідну модель реального явища слід вважати побудованої, якщо розглянуті величини і зв'язку між ними виражені в термінах теорії ймовірностей. Відповідність ймовірнісної моделі реальності, тобто її адекватність, доводять, зокрема, за допомогою статистичних методів перевірки гіпотез.

Невероятностной методи обробки даних є пошуковими, їх можна використовувати лише при попередньому аналізі даних, так як вони не дають можливості оцінити точність і надійність висновків, отриманих на підставі обмеженого статистичного матеріалу.

імовірнісні і статистичні методи застосовні скрізь, де вдається побудувати і обгрунтувати імовірнісну модель явища чи процесу. Їх застосування обов'язково, коли зроблені на основі вибіркових даних висновки переносяться на всю сукупність (наприклад, з вибірки на всю партію продукції).

У конкретних областях застосувань використовуються як вероятностно- статистичні методи широкого застосування, так і специфічні. Наприклад, в розділі виробничого менеджменту, присвяченого статистичних методів управління якістю продукції, використовують прикладну математичну статистику (включаючи планування експериментів). За допомогою її методів проводиться статистичний аналіз точності і стабільності технологічних процесів і статистична оцінка якості. До специфічних належать методи статистичного приймального контролю якості продукції, статистичного регулювання технологічних процесів, оцінки і контролю надійності та ін.

Широко застосовуються такі прикладні ймовірносно-статистичні дисципліни, як теорія надійності та теорія масового обслуговування. Зміст першої з них ясно з назви, друга займається вивченням систем типу телефонної станції, на яку в випадкові моменти часу надходять виклики - вимоги абонентів, що набирають номери на своїх телефонних апаратах. Тривалість обслуговування цих вимог, тобто тривалість розмов, також моделюється випадковими величинами. Великий внесок у розвиток цих дисциплін внесли член-кореспондент АН СРСР А.Я. Хинчин (1894-1959), академік АН УРСР Б.В. Гнеденко (1912-1995) та інші вітчизняні вчені.

Коротко про історію математичної статистики. Математична статистика як наука починається з робіт знаменитого німецького математика Карла Фрідріха Гаусса (1777-1855), який на основі теорії ймовірностей дослідив і обгрунтував метод найменших квадратів, Створений ним в 1795 р і застосований для обробки астрономічних даних (з метою уточнення орбіти малої планети Церера). Його ім'ям часто називають одне з найбільш популярних розподілів ймовірностей - нормальне, а в теорії випадкових процесів основний об'єкт вивчення - гаусові процеси.

В кінці XIX ст. - початку ХХ ст. великий внесок у математичну статистику внесли англійські дослідники, перш за все К. Пірсон (1857-1936) і Р.А. Фішер (1890-1962). Зокрема, Пірсон розробив критерій "хі-квадрат" перевірки статистичних гіпотез, а Фішер - дисперсійний аналіз, Теорію планування експерименту, метод максимальної правдоподібності оцінки параметрів.

У 30-ті роки ХХ ст. поляк Єжи Нейман (1894-1977) і англієць Е. Пірсон розвинули загальну теорію перевірки статистичних гіпотез, а радянські математики академік А.Н. Колмогоров (1903-1987) і член-кореспондент АН СРСР Н.В. Смирнов (1900-1966) заклали основи непараметричної статистики. У сорокові роки ХХ ст. румунів А. Вальд (1902-1950) побудував теорію послідовного статистичного аналізу.

Математична статистика бурхливо розвивається і в даний час. Так, за останні 40 років можна виділити чотири принципово нових напрямки досліджень [[2.16]]:

  • розробка та впровадження математичних методів планування експериментів;
  • розвиток статистики об'єктів нечислової природи як самостійного напрямку в прикладній математичній статистиці;
  • розвиток статистичних методів, стійких по відношенню до малих відхилень від використовуваної ймовірнісної моделі;
  • широке розгортання робіт зі створення комп'ютерних пакетів програм, призначених для проведення статистичного аналізу даних.

Ймовірносно-статистичні методи і оптимізація. Ідея оптимізації пронизує сучасну прикладну математичну статистику і інші статистичні методи. А саме - методи планування експериментів, статистичного приймального контролю, статистичного регулювання технологічних процесів та ін. З іншого боку, оптимізаційні постановки в теорії прийняття рішень, Наприклад, прикладна теорія оптимізації якості продукції та вимог стандартів, передбачають широке використання ймовірносно-статистичних методів, перш за все прикладної математичної статистики.

У виробничому менеджменті, зокрема, при оптимізації якості продукції та вимог стандартів особливо важливо застосовувати статистичні методи на початковому етапі життєвого циклу продукції, тобто на етапі науково-дослідної підготовки дослідно-конструкторських розробок (розробка перспективних вимог до продукції, аванпроекта, технічного завдання на дослідно-конструкторську розробку). Це пояснюється обмеженістю інформації, доступної на початковому етапі життєвого циклу продукції, і необхідністю прогнозування технічних можливостей та економічної ситуації на майбутнє. Статистичні методи повинні застосовуватися на всіх етапах виконання завдання оптимізації - при шкалировании змінних, розробці математичних моделей функціонування виробів і систем, проведенні технічних і економічних експериментів і т.д.

У завданнях оптимізації, в тому числі оптимізації якості продукції та вимог стандартів, використовують все області статистики. А саме - статистику випадкових величин, багатовимірний статистичний аналіз, Статистику випадкових процесів і часових рядів, статистику об'єктів нечислової природи. Вибір статистичного методу для аналізу конкретних даних доцільно проводити відповідно до рекомендацій [

Поділіться з друзями або збережіть для себе:

Завантаження ...