Яка особливість є характерною ознакою варіаційного ряду. Варіаційний ряд і його характеристики

Різні вибіркові значення назвемо варіантами ряду значень і позначимо: х 1 , х 2, .... Перш за все зробимо ранжування варіантів, тобто розташування їх у порядку зростання або зменшення. Для кожного варіанту вказується свою вагу, тобто число, яке характеризує внесок даного варіанту в загальну сукупність. Як терезів виступають частоти або частості.

частотою n i варіанти х i називається число, що показує скільки раз зустрічається даний варіант в даній вибіркової сукупності.

Частостей або відносною частотою w i варіанти х i називається число, яке дорівнює відношенню частоти варіанти до суми частот усіх варіантів. Частість показує, яка частина одиниць вибіркової сукупності має даний варіант.

Послідовність варіантів з відповідними їм вагами (частотами або частості), записана в порядку зростання (або зменшення), називається варіаційним рядом.

Варіаційні ряди бувають дискретними і інтервальними.

Для дискретного варіаційного ряду задаються точкові значення ознаки, для інтервального - значення ознаки задаються у вигляді інтервалів. Варіаційні ряди можуть показувати розподіл частот або відносних частот (частостей), в залежності від того, яка величина вказується для кожного варіанту - частота або частость.

Дискретний варіаційний ряд розподілу частот має вид:

Частості знаходяться за формулою, i \u003d 1, 2, ..., m.

w 1 + w 2 + … + w m \u003d 1.

приклад 4.1. Для даної сукупності чисел

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

побудувати дискретні варіаційні ряди розподілу частот і частостей.

Рішення . Обсяг сукупності дорівнює n \u003d 10. Дискретний ряд розподілу частот має вигляд

Аналогічну форму записи мають інтервальні ряди.

Інтервальний варіаційний ряд розподілу частот записується у вигляді:

Сума всіх частот дорівнює загальному числу спостережень, тобто обсягом сукупності: n = n 1 + n 2 + … + n m.

Інтервальний варіаційний ряд розподілу відносних частот (частостей)має вид:

Частість знаходиться за формулою, i \u003d 1, 2, ..., m.

Сума всіх частостей дорівнює одиниці: w 1 + w 2 + … + w m \u003d 1.

Найбільш часто на практиці застосовуються інтервальні ряди. Якщо статистичних вибіркових даних дуже багато і їх значення відрізняються один від одного на як завгодно малу величину, то дискретний ряд для цих даних буде достатньо громіздким і незручним для подальшого дослідження. У цьому випадку застосовують угруповання даних, тобто проміжок, що містить всі значення ознаки, розбивають на декілька часткових інтервалів і, підрахувавши частоту для кожного інтервалу, отримують інтервальний ряд. Запишемо більш детально схему побудови інтервального ряду, припустивши, що довжини часткових інтервалів будуть однаковими.

2.2 Побудова інтервального ряду

Для побудови інтервального ряду потрібно:

Визначити число інтервалів;

Визначити довжину інтервалів;

Визначити розташування інтервалів на осі.

Для визначення числа інтервалів k існує формула Стерджеса, по якій

,

де n - обсяг всієї сукупності.

Наприклад, якщо є 100 значень ознаки (варіант), то рекомендується для побудови інтервального ряду взяти число інтервалів рівним інтервалом.

Однак дуже часто на практиці число інтервалів вибирає сам дослідник, враховуючи, що це число не повинно бути дуже великим, щоб ряд не був громіздким, але і не дуже маленьким, щоб не втратити деяких властивостей розподілу.

довжина інтервалу h визначається за такою формулою:

,

де x max і x min - це відповідно найбільше і найменше значення варіантів.

величину називають розмахом ряду.

Для побудови самих інтервалів надходять по-різному. Один з найпростіших способів полягає в наступному. За початок першого інтервалу приймають величину
. Тоді решта межі інтервалів знаходяться за формулою. Очевидно, що кінець останнього інтервалу a m + 1 повинен задовольняти умові

Після того як знайдені всі межі інтервалів, визначають частоти (або частості) цих інтервалів. Для вирішення цього завдання переглядають всі варіанти і визначають число варіант, які потрапили в той чи інший інтервал. Повний побудова інтервального ряду розглянемо на прикладі.

приклад 4.2. Для таких статистичних даних, записаних в порядку зростання, побудувати інтервальний ряд з числом інтервалів, рівним 5:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Рішення. всього n\u003d 50 значень варіантів.

Число інтервалів задано в умові завдання, тобто k=5.

Довжина інтервалів дорівнює
.

Визначимо межі інтервалів:

a 1 = 11 − 8,5 = 2,5; a 2 = 2,5 + 17 = 19,5; a 3 = 19,5 + 17 = 36,5;

a 4 = 36,5 + 17 = 53,5; a 5 = 53,5 + 17 = 70,5; a 6 = 70,5 + 17 = 87,5;

a 7 = 87,5 +17 = 104,5.

Для визначення частоти інтервалів посчітиваем число варіантів, які потрапили в даний інтервал. Наприклад, в перший інтервал від 2,5 до 19,5 потрапляють варіанти 11, 12, 12, 14, 14, 15. Їх число дорівнює 6, отже, частота першого інтервалу дорівнює n 1 \u003d 6. Частість першого інтервалу дорівнює . У другій інтервал від 19,5 до 36,5 потрапляють варіанти 21, 21, 22, 23, 25, число яких дорівнює 5. Отже, частота другого інтервалу дорівнює n 2 \u003d 5, а частость . Знайшовши аналогічним чином частоти і частості для всіх інтервалів, отримаємо наступні інтервальні ряди.

Інтервальний ряд розподілу частот має вигляд:

Сума частот дорівнює 6 + 5 + 9 + 11 + 8 + 11 \u003d 50.

Інтервальний ряд розподілу частостей має вигляд:

Сума частостей дорівнює 0,12 + 0,1 + 0,18 + 0,22 + 0,16 + 0,22 \u003d 1. ■

При побудові інтервальних рядів, в залежності від конкретних умов даної задачі, можуть застосовуватися і інші правила, а саме

1. Інтервальні варіаційні ряди можуть складатися з часткових інтервалів різної довжини. Нерівні довжини інтервалів дозволяють виділити властивості статистичної сукупності з нерівномірним розподілом ознаки. Наприклад, якщо межі інтервалів визначають чисельність жителів в містах, то доцільно в даній задачі використовувати нерівні по довжині інтервали. Очевидно, що для невеликих міст має значення і невелика різниця в числі жителів, а для великих міст різниця в десятки і сотні жителів не має істотного значення. Інтервальні ряди з нерівними довжинами часткових інтервалів досліджуються, в основному, в загальній теорії статистики і їх розгляд виходить за рамки даного посібника.

2. У математичній статистиці іноді розглядають інтервальні ряди, для яких ліву межу першого інтервалу вважають рівною -∞, а праву межу останнього інтервалу + ∞. Це робиться для того, щоб наблизити статистичний розподіл до теоретичного.

3. При побудові інтервальних рядів може виявитися, що значення якогось варіанту збігається в точності з межею інтервалу. Найкраще в цьому випадку вчинити так. Якщо такий збіг тільки одне, то вважати, що даний варіант зі своєю частотою потрапив в інтервал, що знаходиться ближче до середини інтервального ряду, якщо таких варіантів декілька, то або всі їх віднести до правих від цих варіант інтервалах, або все - до лівих.

4. Після визначення числа інтервалів і їх довжини, розташування інтервалів можна виробляти і по іншим способом. Знаходять середнє арифметичне всіх розглянутих значень варіантів х пор. і будують перший інтервал таким чином, щоб це середнє вибіркове знаходилося б всередині якогось інтервалу. Таким чином, отримуємо інтервал від х пор. - 0,5 hдо х ср .. + 0,5 h. Потім вліво і вправо, додаючи довжину інтервалу, будуємо інші інтервали до тих пір, поки x min і x max не потраплять відповідно в перший і останній інтервали.

5. Інтервальні ряди при великому числі інтервалів зручно записувати вертикально, тобто інтервали записувати не в першому рядку, а в першому стовпці, а частоти (або частості) у другому стовпці.

Вибіркові дані можуть розглядатися як значення деякої випадкової величини Х. Випадкова величина має свій закон розподілу. З теорії ймовірностей відомо, що закон розподілу дискретної випадкової величини можна задати у вигляді ряду розподілу, а безперервної - за допомогою функції щільності розподілу. Однак існує універсальний закон розподілу, який має місце і для дискретної і для безперервної випадкових величин. Цей закон розподілу задається у вигляді функції розподілу F(x) = P(X<x). Для вибіркових даних можна вказати аналог функції розподілу - емпіричну функцію розподілу.

Статистичний ряд розподілу - це впорядкована розподіл одиниць сукупності на групи за певною варьирующему ознакою.
Залежно від ознаки, покладеної в основу утворення ряду розподілу, розрізняють атрибутивні і варіаційні ряди розподілу.

Наявність загальної ознаки є основою для утворення статистичної сукупності, яка представляє собою результати опису або вимірювання загальних ознак об'єктів дослідження.

Предметом вивчення в статистиці є змінюються (варіюють) ознаки або статистичні ознаками.

Види статистичних ознак.

Атрибутивними називають ряди розподілу, Побудовані за якісними ознаками. атрибутивний - це ознака, що має найменування, (наприклад професія: швачка, вчитель і т.д.).
Ряд розподілу прийнято оформляти у вигляді таблиць. У табл. 2.8 наведено атрибутивний ряд розподілу.
Таблиця 2.8 - Розподіл видів юридичної допомоги, наданої адвокатами громадянам одного з регіонів РФ.

варіаційний ряд - це значення ознаки (або інтервали значень) і їх частоти.
Варіаційними рядами називають ряди розподілу, Побудовані за кількісною ознакою. Будь-варіаційний ряд складається з двох елементів: варіантів і частот.
Варіантами вважаються окремі значення ознаки, які він приймає в варіаційному ряду.
Частоти - це чисельності окремих варіантів або кожної групи варіаційного ряду, тобто це числа, що показують, як часто зустрічаються ті чи інші варіанти в ряду розподілу. Сума всіх частот визначає чисельність всієї сукупності, її обсяг.
Частостей називаються частоти, виражені в частках одиниці або у відсотках до підсумку. Відповідно сума частостей дорівнює 1 або 100%. Варіаційний ряд дозволяє за фактичними даними оцінити форму закону розподілу.

Залежно від характеру варіації ознаки розрізняють дискретні та інтервальні варіаційні ряди.
Приклад дискретного варіаційного ряду наведено в табл. 2.9.
Таблиця 2.9 - Розподіл сімей за кількістю займаних кімнат в окремих квартирах у 1989 р в РФ.

У першій колонці таблиці представлені варіанти дискретного варіаційного ряду, в другій - поміщені частоти варіаційного ряду, в третій - показники частости.

варіаційний ряд

У генеральній сукупності досліджується деякий кількісний ознака. З неї випадковим чином витягується вибірка обсягу n, Тобто число елементів вибірки дорівнює n. На першому етапі статистичної обробки виробляють ранжування вибірки, тобто упорядкування чисел x 1, x 2, ..., x n за зростанням. Кожне бачимо значення x iназивається варіант. частота m i - це число спостережень значення x i у вибірці. Відносна частота (частость) w i- це відношення частоти m iдо обсягу вибірки n: .
При вивченні варіаційного ряду також використовують поняття накопиченої частоти і накопиченої частости. нехай x деяке число. Тоді кількість варіантів , значення яких менше x, Називається накопиченої частотою: для x i n називається накопиченої частостей w i max.
Ознака називається дискретно варійованим, якщо його окремі значення (варіанти) відрізняються один від одного на деяку кінцеву величину (зазвичай ціле число). Варіаційний ряд такої ознаки називається дискретним варіаційним рядом.

Таблиця 1. Загальний вигляд дискретного варіаційного ряду частот

значення ознакиx i x 1 x 2 x n
частотиm i m 1 m 2 m n

Ознака називається безперервно варьирующим, якщо його значення відрізняються один від одного на як завгодно малу величину, тобто ознака може приймати будь-які значення в деякому інтервалі. Безперервний варіаційний ряд для такого ознаки називається інтервальним.

Таблиця 2. Загальний вигляд інтервального варіаційного ряду частот

Таблиця 3. Графічні зображення варіаційного ряду

рядПолігон або гістограмаЕмпірична функція розподілу
дискретний
інтервальний
Переглядаючи результати проведених спостережень, визначають, скільки значень варіантів потрапило в кожен конкретний інтервал. Передбачається, що кожному інтервалу належить один з його кінців: або у всіх випадках ліві (частіше), або у всіх випадках праві, а частоти або частості показують число варіантів, укладених в зазначених межах. різниці a i - a i +1називаються частковими інтервалами. Для спрощення подальших розрахунків інтервальний варіаційний ряд можна замінити умовно дискретним. В цьому випадку серединне значення i-го інтервалу приймають за варіант x i, А відповідну интервальную частоту m i - за частоту цього інтервалу.
Для графічного зображення варіаційних рядів найбільш часто використовуються полігон, гістограма, кумулятивна крива і емпірична функція розподілу.

У табл. 2.3 (Угрупування населення Росії за розміром середньодушового доходу в квітні 1994р.) Представлений інтервальний варіаційний ряд.
Зручно ряди розподілу аналізувати за допомогою графічного зображення, що дозволяє судити і про форму розподілу. Наочне уявлення про характер зміни частот варіаційного ряду дають полігон і гістограма.
Полігон використовується при зображенні дискретних варіаційних рядів.
Зобразимо, наприклад графічно розподіл житлового фонду по типу квартир, (табл. 2.10).
Таблиця 2.10 - Розподіл житлового фонду міського району за типом квартир (цифри умовні).


Мал. Полігон розподілу житлового фонду


На осі ординат можуть наноситися не тільки значення частот, але і частостей варіаційного ряду.
Гістограма приймається для зображення інтервального варіаційного ряду. При побудові гістограми на осі абсцис відкладаються величини інтервалів, а частоти зображуються прямокутниками, побудованими на відповідних інтервалах. Висота стовпчиків в разі рівних інтервалів повинна бути пропорційна частотам. Гістограма - графік, на якому ряд зображений у вигляді суміжних один з одним стовпчиків.
Зобразимо графічно інтервальний ряд розподілу, наведений в табл. 2.11.
Таблиця 2.11 - Розподіл сімей за розміром житлової площі, що припадає на одну людину (цифри умовні).
N п / п Групи сімей за розміром житлової площі, що припадає на одну людину Число сімей з даними розміром житлової площі Накопичене число сімей
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ВСЬОГО 115 ----


Мал. 2.2. Гістограма розподілу сімей за розміром житлової площі, що припадає на одну людину


Використовуючи дані накопиченого ряду (табл. 2.11), побудуємо кумуляту розподілу.


Мал. 2.3. Кумулята розподілу сімей за розміром житлової площі, що припадає на одну людину


Зображення варіаційного ряду у вигляді кумуляти особливо ефективно для варіаційних рядів, частоти яких виражені в частках або відсотках до суми частот ряду.
Якщо при графічному зображенні варіаційного ряду у вигляді кумуляти осі поміняти, то ми отримаємо огіви. На рис. 2.4 приведена огива, побудована на основі даних табл. 2.11.
Гістограма може бути перетворена в полігон розподілу, якщо знайти середини сторін прямокутників і потім ці точки з'єднати прямими лініями. Отриманий полігон розподілу зображений на рис. 2.2 пунктирною лінією.
При побудові гістограми розподілу варіаційного ряду з нерівними інтервалами по осі ординат завдають не частоти, а щільність розподілу ознаки у відповідних інтервалах.
Щільність розподілу - це частота, розрахована на одиницю ширини інтервалу, тобто скільки одиниць в кожній групі доводиться на одиницю величини інтервалу. Приклад розрахунку щільності розподілу представлений в табл. 2.12.
Таблиця 2.12 - Розподіл підприємств за кількістю зайнятих (цифри умовні)
N п / п Групи підприємств за кількістю зайнятих, чол. число підприємств Величина інтервалу, чол. щільність розподілу
А 1 2 3=1/2
1 до 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ВСЬОГО 147 ---- ----

Для графічного зображення варіаційних рядів може також використовуватися кумулятивна крива. За допомогою кумуляти (кривої сум) зображується ряд накопичених частот. Накопичені частоти визначаються шляхом послідовно підсумовування частот по групах і показують, скільки одиниць сукупності мають значення ознаки не більше, ніж розглядається значення.


Мал. 2.4. Огіва розподілу сімей за розміром житлової площі, що припадає на одну людину

При побудові кумуляти інтервального варіаційного ряду по осі абсцис відкладаються варіанти ряду, а по осі ординат накопичені частоти.

Безперервний варіаційний ряд

Безперервний варіаційний ряд - ряд, побудований на основі кількісного статистичного ознаки. Приклад. Середня тривалість захворювань засуджених (днів на одну людину) в осінньо-зимовий період в поточному рік склала:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5

РОСІЙСЬКА АКАДЕМІЯ НАРОДНОГО ГОСПОДАРСТВА ТА ДЕРЖАВНОЇ СЛУЖБИ при ПРЕЗИДЕНТОВІ РОСІЙСЬКОЇ ФЕДЕРАЦІЇ

ОРЛОВСЬКИЙ ФІЛІЯ

кафедра математики і математичних методів в управлінні

Самостійна робота

З математики

на тему «Варіаційний ряд і його характеристики»

для студентів денної форми навчання факультету «Економіка і менеджмент»

напряму підготовки «Управління персоналом»


Мета роботи:Освоєння понять математичної статистики і прийомів первинної обробки даних.

Приклад вирішення типових задач.

Завдання 1.

Шляхом опитування отримані наступні дані ():

1 2 3 2 2 4 3 3 5 1 0 2 4 3 2 2 3 3 1 3 2 4 2 4 3 3 3 2 0 6

3 3 1 1 2 3 1 4 3 1 7 4 3 4 2 3 2 3 3 1 4 3 1 4 5 3 4 2 4 5

3 6 4 1 3 2 4 1 3 1 0 0 4 6 4 7 4 1 3 5

необхідно:

1) Скласти варіаційний ряд (статистичний розподіл вибірки), попередньо записавши ранжируваних дискретний ряд варіантів.

2) Побудувати полігон частот і кумуляту.

3) Скласти ряд розподілу відносних частот (частостей).

4) Знайти основні числові характеристики варіаційного ряду (використовувати спрощені формули для їх знаходження): а) середню арифметичну, б) медіану ме і моду Мо, В) дисперсію s 2, Г) середнє квадратичне відхилення s, Д) коефіцієнт варіації V.

5) Пояснити сенс отриманих результатів.

Рішення.

1) для складання ранжированного дискретного ряду варіантів відсортуємо дані опитування за величиною і розташуємо їх у порядку зростання

0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2

3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

5 5 5 5 6 6 6 7 7.

Складемо варіаційний ряд, записавши в перший рядок таблиці спостережувані значення (варіанти), а в другу відповідні їм частоти (таблиця 1)

Таблиця 1.

2) Полігон частот являє собою ламану, що сполучає точки ( х i; n i), i=1, 2,…, m, де m X.

Зобразимо полігон частот варіаційного ряду (рис. 1).

Рис.1. полігон частот

Кумулятивна крива (кумулята) для дискретного варіаційного ряду являє ламану, що сполучає точки ( х i; n i нак), i=1, 2,…, m.

Знайдемо накопичені частоти n i нак (Накопичена частота показує, скільки спостерігалося варіантів зі значенням ознаки меншим х). Знайдені значення заносимо в третій рядок таблиці 1.



Побудуємо кумуляту (рис. 2).

Рис.2. кумулята

3) Знайдемо відносні частоти (частості), де, де m - число різних значень ознаки X, Які будемо обчислювати з однаковою точністю.

Запишемо ряд розподілу відносних частот (частостей) у вигляді таблиці 2

Таблиця 2

4) Знайдемо основні числові характеристики варіаційного ряду:

а) Середню арифметичну знайдемо, використовуючи спрощену формулу:

,

де - умовні варіанти

покладемо з\u003d 3 (одне з середніх спостережуваних значень), k\u003d 1 (різниця між двома сусідніми варіантами) і складемо розрахункову таблицю (табл. 3).

Таблиця 3.

x i n i u i u i n i u i 2 n i
-3 -12
-2 -26
-1 -14
сума -11

Тоді середня арифметична

б) Медианой ме варіаційного ряду називається значення ознаки, що припадає на середину рангового ряду спостережень. Даний дискретний варіаційний ряд містить парне число членів ( n\u003d 80), значить, медіана дорівнює напівсумі двох серединних варіантів.

модою Мо варіаційного ряду називається варіант, якому відповідає найбільша частота. Для даного варіаційного ряду найбільша частота n max \u003d 24 відповідає варіанту х \u003d 3, отже мода Мо=3.

в) дисперсію s 2, Яка є мірою розсіювання можливих значень показника X навколо свого середнього значення, знайдемо, використовуючи спрощену формулу:

, де u i - умовні варіанти

Проміжні обчислення також занесемо в таблицю 3.

тоді дисперсія

г) Середнє квадратичне відхилення s знайдемо за формулою:

.

д) Коефіцієнт варіації V: (),

Коефіцієнт варіації є безмірною величиною, тому він придатний для порівняння розсіювання варіаційних рядів, варіанти яких мають різну розмірність.

Коефіцієнт варіації

.

5) Сенс отриманих результатів полягає в тому, що величина характеризує середнє значення ознаки X в межах розглянутої вибірки, тобто середнє значення склало 2,86. Середнє квадратичне відхилення s описує абсолютний розкид значень показника X і в даному випадку становить s ≈ 1,55. Коефіцієнт варіації V характеризує відносну мінливість показника X, Тобто відносний розкид навколо його середнього значення, і в даному випадку становить.

відповідь: ; ; ; .

Завдання 2.

Є такі дані про власний капітал 40 найбільших банків Центральної Росії:

12,0 49,4 22,4 39,3 90,5 15,2 75,0 73,0 62,3 25,2
70,4 50,3 72,0 71,6 43,7 68,3 28,3 44,9 86,6 61,0
41,0 70,9 27,3 22,9 88,6 42,5 41,9 55,0 56,9 68,1
120,8 52,4 42,0 119,3 49,6 110,6 54,5 99,3 111,5 26,1

необхідно:

1) Побудувати інтервальний варіаційний ряд.

2) Обчислити середню вибіркову і вибіркову дисперсію

3) Знайти середньоквадратичне відхилення, і коефіцієнт варіації.

4) Побудувати гістограму частот розподілу.

Рішення.

1) Виберемо довільне число інтервалів, наприклад, 8. Тоді ширина інтервалу:

.

Складемо розрахункову таблицю:

Інтервал варіант, х k -x k +1 частота, n i середина інтервалу х i Умовна варіанту, і i і i n i і i 2 n i (і i +1) 2 n i
10 – 25 17,5 – 3 – 12
25 – 40 32,5 – 2 – 10
40 – 55 47,5 – 1 – 11
55 – 70 62,5
70 – 85 77,5
85 – 100 92,5
100 – 115 107,5
115 – 130 122,5
сума – 5

Як помилкового нуля вибрано значення з \u003d62,5 (ця варіанти розташована приблизно в середині варіаційного ряду) .

Умовні варіанти визначаються за формулою

Приклад рішення контрольної роботи по математичній статистиці

завдання 1

Початкові дані : Студенти деякої групи, що складається з 30 чоловік склали іспит з курсу «Інформатика». Отримані студентами оцінки утворюють наступний ряд чисел:

I. Складемо варіаційний ряд

m x

w x

m x нак

w x нак

Разом:

II. Графічне представлення статистичних відомостей.

III. Числові характеристики вибірки.

1. Середнє арифметичне

2. Середнє геометричне

3. Мода

4. Медіана

222222333333333 | 3 34444444445555

5. Вибіркова дисперсія

7. Коефіцієнт варіації

8. Асиметрія

9. Коефіцієнт асиметрії

10. Ексцес

11. Коефіцієнт ексцесу

завдання 2

Початкові дані : Студенти деякої групи написали випускну контрольну роботу. Група складається з 30 чоловік. Набрані студентами бали утворюють наступний ряд чисел

Рішення

I. Так як ознака приймає багато різних значень, то для нього побудуємо інтервальний варіаційний ряд. Для цього спочатку поставимо величину інтервалу h. Скористаємося формулою Стерджера

Складемо шкалу інтервалів. При цьому за верхню межу першого інтервалу приймемо величину, яка визначається за формулою:

Верхні межі наступних інтервалів визначимо за такою рекуррентной формулою:

, тоді

Побудова шкали інтервалів закінчуємо, так як верхня межа чергового інтервалу стала більше або дорівнює максимальному значенню вибірки
.

II. Графічне відображення інтервального варіаційного ряду

III. Числові характеристики вибірки

Для визначення числових характеристик вибірки складемо допоміжну таблицю

сума:

1. Середнє арифметичне

2. Середнє геометричне

3. Мода

4. Медіана

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Вибіркова дисперсія

6. Вибіркове стандартне відхилення

7. Коефіцієнт варіації

8. Асиметрія

9. Коефіцієнт асиметрії

10. Ексцес

11. Коефіцієнт ексцесу

завдання 3

Умова : Ціна ділення шкали амперметра дорівнює 0,1 А. Показання округлюють до найближчого цілого ділення. Знайти ймовірність того, що при відліку буде зроблена помилка, що перевищує 0,02 А.

Рішення.

Помилку округлення відліку можна розглядати як випадкову величину Х, Яка розподілена рівномірно в інтервалі між двома сусідніми цілими поділами. Щільність рівномірного розподілу

,

де
- довжина інтервалу, в якому укладені можливі значення Х; поза цим інтервалом
У цьому завданню довжина інтервалу, в якому укладені можливі значення Х, Дорівнює 0,1, тому

Помилка відліку перевищить 0,02 якщо вона буде укладена в інтервалі (0,02; 0,08). тоді

відповідь: р=0,6

завдання 4

Початкові дані: математичне очікування і стандартне відхилення нормально розподіленої ознаки Х відповідно рівні 10 і 2. Знайти ймовірність того, щов результаті випробування Х прийме значення, укладену в інтервалі (12, 14).

Рішення.

скористаємося формулою

І теоретичними частотами

Рішення

Для Х її математичне сподівання M (X) і дисперсію D (X). Рішення. Знайдемо функцію розподілу F (x) випадкової величини ... помилка вибірки). складемо варіаційний ряд Ширина інтервалу складе: Для кожного значення ряду підрахуємо, скільки ...

  • Рішення: рівняння із перемінними

    Рішення

    У вигляді Для знаходження приватного рішення неоднорідного рівняння складемо систему Вирішимо отриману систему ...; +47; +61; +10; -8. побудувати інтервальний варіаційний ряд. Дати статистичні оцінки середнього значення ...

  • Рішення: Проведемо розрахунок ланцюгових і базисних абсолютних приростів, темпів зростання, темпів приросту. Отримані значення зведемо в таблицю 1

    Рішення

    Обсяг виробництва продукції. Рішення: Середня арифметична інтервального варіаційного ряду обчислюється таким чином: за ... Гранична помилка вибірки з ймовірністю 0,954 (t \u003d 2) складе: Δ w \u003d t * μ \u003d 2 * 0,0146 \u003d 0,02927 Визначимо кордону ...

  • Рішення. ознака

    Рішення

    Про трудовий стаж яких і склали вибірку. Середній по вибірці стаж ... робочого дня цих співробітників і склали вибірку. Середня по вибірці тривалість ... 1,16, рівень значущості α \u003d 0,05. Рішення. варіаційний ряд даної вибірки має вигляд: 0,71 ...

  • Робоча навчальна програма з біології для 10-11 класів Упорядник: Полікарпова С. В

    Робоча навчальна програма

    Найпростіших схем схрещування »5 Л.Р. « Рішення елементарних генетичних завдань »6 Л.Р. « Рішення елементарних генетичних завдань »7 Л.Р. «..., 110, 115, 112, 110. Складіть варіаційний ряд, накресліть вариационную криву, знайдіть середню величину ознаки ...

  • Особливе місце в статистичному аналізі належить визначенню середнього рівня досліджуваного ознаки або явища. Середній рівень ознаки вимірюють середніми величинами.

    Середня величина характеризує загальний кількісний рівень досліджуваного ознаки і є груповим властивістю статистичної сукупності. Вона нівелює, послаблює випадкові відхилення індивідуальних спостережень в ту чи іншу сторону і висуває на перший план основне, типове властивість досліджуваного ознаки.

    Середні величини широко використовуються:

    1. Для оцінки стану здоров'я населення: характеристики фізичного розвитку (ріст, вага, окружність грудної клітини та ін.), Виявлення поширеності і тривалості різних захворювань, аналізу демографічних показників (природного руху населення, середньої тривалості майбутнього життя, відтворення населення, середньої чисельності населення та ін.).

    2. Для вивчення діяльності лікувально-профілактичних установ, медичних кадрів і оцінки якості їх роботи, планування та визначення потреби населення в різних видах медичної допомоги (середнє число звернень або відвідувань на одного жителя в рік, середня тривалість перебування хворого в стаціонарі, середня тривалість обстеження хворого, середня забезпеченість лікарями, кийками та ін.).

    3. Для характеристики санітарно-епідеміологічного стану (середня запиленість повітря в цеху, середня площа на одну людину, середні норми споживання білків, жирів і вуглеводів і т. Д.).

    4. Для визначення медико-фізіологічних показників в нормі та патології, при обробці лабораторних даних, для встановлення достовірності результатів вибіркового дослідження в соціально-гігієнічних, клінічних, експериментальних дослідженнях.

    Обчислення середніх величин виконується на основі варіаційних рядів. варіаційний ряд - це однорідна в якісному відношенні статистична сукупність, окремі одиниці якої характеризують кількісні відмінності досліджуваного ознаки або явища.

    Кількісна варіація може бути двох типів: безперервна (дискретна) і безперервна.

    Перериваний (дискретний) ознака виражається тільки цілим числом і не може мати ніяких проміжних значень (наприклад, число відвідувань, чисельність населення дільниці, кількість дітей в сім'ї, ступінь тяжкості хвороби в балах і ін.).

    Безперервний ознака може приймати будь-які значення в певних межах, в тому числі і дробові, і виражається лише приблизно (наприклад, вага - для дорослих можна обмежитися кілограмами, а для новонароджених - грамами; зростання, артеріальний тиск, час, витрачений на прийом хворого, і т. д.).



    Цифрове значення кожного окремого ознаки або явища, що входить в варіаційний ряд, називається варіант і позначається буквою V . У математичній літературі зустрічаються і інші позначення, наприклад x або y.

    Варіаційний ряд, де кожна варіанта вказана один раз, називається простим. Такі ряди використовуються в більшості статистичних задач в разі комп'ютерної обробки даних.

    При збільшенні числа спостережень, як правило, зустрічаються повторювані значення варіант. У цьому випадку створюється згрупований варіаційний ряд, Де вказується число повторень (частота, позначається буквою « р »).

    Ранжируваний варіаційний ряд складається з варіант, розташованих в порядку зростання або зменшення. Як простий, так і згрупований ряди можуть бути складені з ранжируванням.

    Інтервальний варіаційний ряд складають з метою спрощення подальших обчислень, виконуваних без використання комп'ютера, при дуже великому числі одиниць спостереження (більше 1000).

    Безперервний варіаційний ряд включає значення варіант, які можуть виражатися будь-якими значеннями.

    Якщо в варіаційному ряді значення ознаки (варіанти) задані в вигляді окремих конкретних чисел, то такий ряд називають дискретним.

    Спільними характеристиками значень ознаки, що відбивається в варіаційному ряду, є середні величини. Серед них найбільш вживані: середня арифметична величина М,мода Моі медіана Me.Кожна з цих характеристик своєрідна. Вони не можуть підмінити один одного і лише в сукупності досить повно і в стислій формі представляють собою особливості варіаційного ряду.

    модою (Мо) називають значення найбільш часто зустрічається варіанти.

    медіана (Me) - це значення варіанти, що ділить ранжируваний варіаційний ряд навпіл (з кожного боку медіани знаходиться половина варіант). У рідкісних випадках, коли є симетричний варіаційний ряд, мода і медіана рівні між собою і збігаються зі значенням середньої арифметичної.

    Найбільш типовою характеристикою значень варіант є середня арифметична величина ( М ). У математичній літературі вона позначається .

    Середня арифметична величина (M, ) - це загальна кількісна характеристика певної ознаки досліджуваних явищ, складових якісно однорідну статистичну сукупність. Розрізняють середню арифметичну просту і зважену. Середня арифметична проста обчислюється для простого варіаційного ряду шляхом підсумовування всіх варіант і діленням цієї суми на загальну кількість варіант, що входять в даний варіаційний ряд. Обчислення проводяться за формулою:

    де: М - середня арифметична проста;

    Σ V - сума варіант;

    n - число спостережень.

    У сгруппированном варіаційному ряду визначають зважену середню арифметичну. Формула її обчислення:

    де: М - середня арифметична зважена;

    Σ Vp - сума творів варіант на їх частоти;

    n - число спостережень.

    При великій кількості спостережень в разі ручних обчислень може застосовуватися спосіб моментів.

    Середня арифметична має такі властивості:

    · Сума відхилень варіант від середньої ( Σ d ) Дорівнює нулю (див. Табл. 15);

    · При множенні (діленні) всіх варіант на один і той же множник (дільник) середня арифметична збільшується (ділиться) на той же множник (дільник);

    · Якщо додати (відняти) до всіх варіантів одне і те ж число, середня арифметична збільшується (зменшується) на це ж число.

    Середні арифметичні величини, взяті самі по собі, без урахування варіабельності рядів, з яких вони обчислені, можуть не повною мірою відображати властивості варіаційного ряду, особливо коли необхідно зіставлення з іншими середніми. Близькі за значенням середні можуть бути отримані з лав з різним ступенем розсіювання. Чим ближче один до одного окремі варіанти по своїй кількісну характеристику, тим менше розсіювання (коливання, варіабельність) ряду, тим типовіше його середня.

    Основними параметрами, які дозволяють оцінити варіабельність ознаки, є:

    · Розмах;

    · Амплітуда;

    · Середнє квадратичне відхилення;

    · Коефіцієнт варіації.

    Приблизно про коливання ознаки можна судити за розмахом і амплітуді варіаційного ряду. Розмах вказує на максимальну (V max) і мінімальну (V min) варіанти в ряду. Амплітуда (A m) є різницею цих варіант: A m \u003d V max - V min.

    Основний, загальноприйнятою мірою коливання варіаційного ряду є дисперсія (D ). Але найбільш часто застосовується більш зручний параметр, який вираховується на основі дисперсії - середньоквадратичне відхилення ( σ ). Воно враховує величину відхилення ( d ) Кожної варіанти варіаційного ряду від його середньої арифметичної ( d \u003d V - M ).

    Оскільки відхилення варіант від середньої можуть бути позитивними і негативними, то при підсумовуванні вони дають значення «0» (S d \u003d 0). Щоб уникнути цього, величини відхилення ( d) Зводяться до другого степеня і усереднюються. Таким чином, дисперсія варіаційного ряду є середнім квадратом відхилень варіант від середньої арифметичної і обчислюється за формулою:

    Вона є найважливішою характеристикою варіабельності і застосовується для обчислення багатьох статистичних критеріїв.

    Оскільки дисперсія виражається квадратом відхилень, її величина не може використовуватися в зіставленні із середньою арифметичною. Для цих цілей застосовується середньоквадратичне відхилення, Яке позначається знаком «Сигма» ( σ ). Воно характеризує середнє відхилення всіх варіант варіаційного ряду від середньої арифметичної величини в тих же одиницях, що і сама середня величина, тому вони можуть використовуватися спільно.

    Середнє квадратичне відхилення визначають за формулою:

    Зазначена формула застосовується при числі спостережень ( n ) Більше 30. При меншій кількості n значення середнього квадратичного відхилення матиме похибка, пов'язану з математичним зміщенням ( n - 1). У зв'язку з цим, більш точний результат може бути отриманий за допомогою обліку такого зміщення у формулі розрахунку стандартного відхилення:

    стандартне відхилення (s ) - це оцінка середньоквадратичного відхилення випадкової величини Х щодо її математичного очікування на основі несмещённой оцінки її дисперсії.

    при значеннях n \u003e 30 середньоквадратичне відхилення ( σ ) І стандартне відхилення ( s ) Будуть однаковими ( σ \u003d s ). Тому в більшості практичних посібників ці критерії розглядаються як разнозначних. У програмі Excel обчислення стандартного відхилення може бути виконано функцією \u003d СТАНДОТКЛОН (діапазон). А з метою розрахунку середнього квадратичного відхилення потрібно створити відповідну формулу.

    Середнє квадратичне або стандартне відхилення дозволяє визначити, наскільки значення ознаки можуть відрізнятися від середнього значення. Припустимо, існують два міста з однаковою середньою денною температурою в літній період. Один з цих міст розташований на узбережжі, а інший на континенті. Відомо, що в містах, розташованих на узбережжі, відмінності денних температур менше, ніж у міст, розташованих усередині континенту. Тому середнє відхилення денних температур у прибережного міста буде менше, ніж у другого міста. На практиці це означає, що середня температура повітря кожного конкретного дня в місті, розташованого на континенті буде сильніше відрізнятися від середнього значення, ніж в місті на узбережжі. Крім того стандартне відхилення дозволяє оцінити можливі відхилення температури від середньої з необхідним рівнем імовірності.

    Відповідно до теорії ймовірності, в явищах, що підкоряються нормальному закону розподілу, між значеннями середньої арифметичної, середнього квадратичного відхилення і варіантами існує сувора залежність ( правило трьох сигм). Наприклад, 68,3% значень варьирующего ознаки знаходяться в межах М ± 1 σ , 95,5% - в межах М ± 2 σ і 99,7% - в межах М ± 3 σ .

    Величина середнього квадратичного відхилення дозволяє судити про характер однорідності варіаційного ряду і досліджуваної групи. Якщо величина середнього квадратичного відхилення невелика, то це свідчить про досить високу однорідності досліджуваного явища. Середню арифметичну в такому випадку слід визнати цілком характерною для даного варіаційного ряду. Однак занадто мала величина сигми змушує думати про штучне підборі спостережень. При дуже великий сигмі середня арифметична в меншій мірі характеризує варіаційний ряд, що говорить про значну варіабельності досліджуваного ознаки або явища або про неоднорідність досліджуваної групи. Однак зіставлення величини середнього квадратичного відхилення можливо тільки для ознак однаковою розмірності. Дійсно, якщо порівнювати різноманітність ваги новонароджених дітей і дорослих, ми завжди отримаємо більш високі значення сигми у дорослих.

    Порівняння варіабельності ознак різної розмірності може бути виконано за допомогою коефіцієнта варіації. Він висловлює різноманітність у відсотках від середньої величини, що дозволяє проводити порівняння різних ознак. Коефіцієнт варіації в медичній літературі позначається знаком « З », А в математичній« v»І обчислюється за формулою:

    Значення коефіцієнта варіації менш 10% свідчить про малий розсіянні, від 10 до 20% - про повну загальну середню, більше 20% - про сильне розсіянні варіант навколо середньої арифметичної.

    Середня арифметична величина, як правило, обчислюється на основі даних вибіркової сукупності. При повторних дослідженнях під впливом випадкових явищ середня арифметична може змінюватися. Це обумовлено тим, що досліджується, як правило, тільки частина можливих одиниць спостереження, тобто вибіркова сукупність. Інформація про всі можливі одиницях, що представляють досліджуване явище, може бути отримана при вивченні всієї генеральної сукупності, що не завжди можливо. У той же час з метою узагальнення даних експерименту становить інтерес величина середньої в генеральній сукупності. Тому для формулювання загального висновку про досліджуваному явищі, результати, отримані на основі вибіркової сукупності, повинні бути, перенесені на генеральну сукупність статистичними методами.

    Щоб визначити ступінь збігу вибіркового дослідження та генеральної сукупності, необхідно оцінити величину помилки, яка неминуче виникає при вибірковому спостереженні. Така помилка називається « помилкою репрезентативності»Або« Середньої помилкою середньої арифметичної ». Вона фактично є різницею між середніми, отриманими при вибірковому статистичному спостереженні, і аналогічними величинами, які були б отримані при суцільному дослідженні того ж об'єкта, тобто при вивченні генеральної сукупності. Оскільки вибіркова середня є випадковою величиною, такий прогноз виконується з прийнятним для дослідника рівнем імовірності. У медичних дослідженнях він становить не менше 95%.

    Помилку репрезентативності не можна змішувати з помилками реєстрації або помилками уваги (описки, прорахунки, помилки і ін.), Які повинні бути зведені до мінімуму адекватної методикою і інструментами, застосовуваними при проведенні експерименту.

    Величина помилки репрезентативності залежить як від обсягу вибірки, так і від варіабельності ознаки. Чим більше число спостережень, тим ближче вибірка до генеральної сукупності і тим менше помилка. Чим більш мінливий ознака, тим більше величина статистичної похибки.

    На практиці для визначення помилки репрезентативності в варіаційних рядах користуються такою формулою:

    де: m - помилка репрезентативності;

    σ - середньоквадратичне відхилення;

    n - число спостережень у вибірці.

    З формули видно, що розмір середньої помилки прямо пропорційний середньому квадратичному відхиленню, т. Е. Варіабельності досліджуваного ознаки, і обернено пропорційний кореню квадратному з числа спостережень.

    При виконанні статистичного аналізу на основі обчислення відносних величин побудова варіаційного ряду не є обов'язковим. При цьому визначення середньої помилки для відносних показників може виконуватися за спрощеною формулою:

    де: Р- величина відносного показника, вираженого у відсотках, проміле і т.д .;

    q - величина, зворотна Р і виражена як (1-Р), (100-Р), (1000-Р) і т. Д., В залежності від підстави, на яке розрахований показник;

    n - число спостережень в вибіркової сукупності.

    Однак, зазначена формула обчислення помилки репрезентативності для відносних величин може застосовуватися тільки в тому випадку, коли значення показника менше його заснування. У ряді випадків розрахунку інтенсивних показників така умова не дотримується, і показник може виражатися числом більше 100% або 1000% о. У такій ситуації виконується побудова варіаційного ряду і обчислення помилки репрезентативності за формулою для середніх величин на основі середнього квадратичного відхилення.

    Прогнозування величини середньої арифметичної в генеральної сукупності виконується із зазначенням двох значень - мінімального і максимального. Ці крайні значення можливих відхилень, в межах яких може коливатися шукана середня величина генеральної сукупності, називаються « довірчі кордону».

    Постулатами теорії ймовірностей доведено, що при нормальному розподілі ознаки з ймовірністю 99,7%, крайні значення відхилень середньої будуть не більше величини потроєною помилки репрезентативності ( М ± 3 m ); в 95,5% - не більш величини подвоєною середньої помилки середньої величини ( М ± 2 m ); в 68,3% - не більш величини однієї середньої помилки ( М ± 1 m ) (Рис. 9).

    P%

    Мал. 9. Щільність ймовірностей нормального розподілу.

    Відзначимо, що наведене вище твердження справедливе лише для ознаки, який підпорядковується нормальному закону розподілу Гауса.

    Більшість експериментальних досліджень, в тому числі і в галузі медицини, пов'язане з вимірами, результати яких можуть брати практично будь-які значення в заданому інтервалі, тому, як правило, описуються моделлю неперервних випадкових величин. У зв'язку з цим в більшості статистичних методів розглядаються безперервні розподілу. Одним з таких розподілів, які мають основну роль в математичній статистиці, є нормальне, або гауссово, розподіл.

    Це пояснюється цілою низкою причин.

    1. Перш за все, багато експериментальні спостереження можна успішно описати за допомогою нормального розподілу. Слід відразу ж зазначити, що не існує розподілів емпіричних даних, які були б в точності нормальними, оскільки нормально розподілена випадкова величина знаходиться в межах від до, чого ніколи не зустрічається на практиці. Однак нормальний розподіл дуже часто добре підходить як наближення.

    Чи проводяться вимірювання ваги, росту та інших фізіологічних параметрів організму людини - всюди на результати впливає дуже велике число випадкових факторів (природні причини і помилки виміру). Причому, як правило, дія кожного з цих факторів незначно. Досвід показує, що результати саме в таких випадках будуть розподілені приблизно нормально.

    2. Багато розподілу, пов'язані з випадковою вибіркою, при збільшенні обсягу останньої переходять в нормальне.

    3. Нормальний розподіл добре підходить в якості наближеного опису інших безперервних розподілів (наприклад, асиметричних).

    4. Нормальний розподіл має низку сприятливих математичних властивостей, багато в чому забезпечили його широке застосування в статистиці.

    У той же час слід зазначити, що в медичних даних зустрічається багато експериментальних розподілів, опис яких моделлю нормального розподілу неможливо. Для цього в статисткою розроблені методи, які прийнято називати «Непараметрична».

    Вибір статистичного методу, який підходить для обробки даних конкретного експерименту, повинен проводитися в залежності від приналежності отриманих даних до нормального закону розподілу. Перевірка гіпотези на підпорядкування ознаки нормальному закону розподілу виконується за допомогою гістограми розподілу частот (графіка), а також ряду статистичних критеріїв. Серед них:

    Критерій асиметрії ( b );

    Критерій перевірки на ексцес ( g );

    Критерій Шапіро - Уїлкса ( W ) .

    Аналіз характеру розподілу даних (його ще називають перевіркою на нормальність розподілу) здійснюється по кожному параметру. Щоб впевнено судити про відповідність розподілу параметра нормальному закону, необхідно досить велика кількість одиниць спостереження (не менше 30 значень).

    Для нормального розподілу критерії асиметрії і ексцесу приймають значення 0. Якщо розподіл зміщене вправо b \u003e 0 (позитивна асиметрія), при b < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона g \u003d 0. при g \u003e 0 крива розподілу гостріше, якщо g < 0 пик более сглаженный, чем функция нормального распределения.

    Для перевірки на нормальність за критерієм Шапіро - Уїлкса потрібно знайти значення цього критерію за статистичними таблицями при необхідному рівні значущості і в залежності від числа одиниць спостереження (ступенів свободи). Додаток 1. Гіпотеза про нормальність відкидається при малих значеннях цього критерію, як правило, при w <0,8.

    Поділіться з друзями або збережіть для себе:

    Завантаження ...