Показники варіації. Розрахунок дисперсії альтернативної ознаки За якою залежністю розраховується дисперсія альтернативної ознаки

Середнє значення альтернативної ознаки та її дисперсія :

Середнє значення альтернативної ознаки

Дисперсія альтернативної ознаки

Підставивши у формулу дисперсії q= 1 - p, Отримаємо:

Таким чином, дисперсія альтернативної ознакидорівнює твору частки одиниць, які мають даною ознакою і частки одиниць, що не мають даної ознаки.

Середнє квадратичне відхилення альтернативної ознаки:

Варіація альтернативної ознаки полягає в наявності або відсутності досліджуваної властивості одиниць сукупності. Кількісно варіація альтернативної ознаки виражається двома значеннями: наявність у одиниці досліджуваної властивості позначається одиницею (1), яке відсутність - нулем (0). Частку одиниць, що мають досліджувану ознаку, позначають буквою , а частку одиниць, що не мають цієї ознаки - через . Враховуючи, що p + q = 1 (звідси q = 1 - p), а середнє значення альтернативної ознаки дорівнює

,

середній квадрат відхилень

Таким чином, дисперсія альтернативної ознаки дорівнює добутку частки одиниць, що мають дану властивість (), на частку одиниць, даною властивістю не мають ().

Максимальне значення середній квадрат відхилення (дисперсія) набуває у разі рівності часток, тобто. коли тобто. . Нижня межа цього показника дорівнює нулю, що відповідає ситуації, коли у сукупності відсутня варіація. Середнє квадратичне відхилення альтернативної ознаки:

Вибіркове спостереження, переваги та недоліки.

Вибіркове спостереження – одне з найсучасніших видів статистичного спостереження, у якому обстеженню піддається частина одиниць вивченої сукупності, відібраних з урахуванням науково розроблених принципів, які забезпечують отримання достатньої кількості достовірних даних, щоб охарактеризувати всю сукупність загалом.

Середні та відносні показники, отримані на основі вибіркових даних, мають достатньо повно відтворювати відповідні показники сукупності загалом.

Основні переваги вибіркового спостереження в тому, що його можна здійснити за ширшою програмою, воно дешевше з погляду витрат на його проведення, і його можна організувати тоді й у тих випадках, коли звітністю ми скористатися не можемо.

Основними недоліками є те, що отримані дані завжди містять у собі помилку, і про результати спостереження можна судити лише з певним ступенем достовірності. А також для його проведення потрібні кваліфіковані кадри.

Способи формування вибіркової сукупності.

У статистиці застосовуються різні способи формування вибіркових сукупностей, що обумовлюється завданнями дослідження та залежить від специфіки об'єкта вивчення.

Основною умовою проведення вибіркового обстеження є запобігання виникненню систематичних помилок, що виникають внаслідок порушення принципу рівних можливостей потрапляння у вибірку кожної одиниці генеральної сукупності. Попередження систематичних помилок досягається внаслідок застосування науково обґрунтованих способів формування вибіркової сукупності.

Існують такі способи відбору одиниць із генеральної сукупності:

1) індивідуальний відбір - у вибірку відбираються окремі одиниці;

2) груповий відбір - у вибірку потрапляють якісно однорідні групи або серії одиниць, що вивчаються;

3) комбінований відбір - це комбінація індивідуального та групового відбору.

Способи відбору визначаються правилами формування вибіркової сукупності.

Вибірка може бути:

Власне-випадкова у тому, що вибіркова сукупність утворюється внаслідок випадкового (ненавмисного) відбору окремих одиниць із генеральної сукупності. При цьому кількість відібраних у вибіркову сукупність одиниць зазвичай визначається, виходячи з прийнятої частки вибірки. Частка вибірки є відношення числа одиниць вибіркової сукупності n чисельності одиниць генеральної сукупності N, тобто.

механічна полягає в тому, що відбір одиниць у вибіркову сукупність проводиться з генеральної сукупності, розбитої на рівні інтервали (групи). При цьому розмір інтервалу в генеральній сукупності дорівнює зворотній величині частки вибірки. Так, при 2% вибірці відбирається кожна 50-а одиниця (1:0,02), при 5% вибірці - кожна 20 одиниця (1:0,05) і т.д. Таким чином, відповідно до прийнятої частки відбору, генеральна сукупність механічно розбивається на рівновеликі групи. З кожної групи у вибірку відбирається лише одна одиниця.

§ типова – коли генеральна сукупність спочатку розчленовується на однорідні типові групи. Потім із кожної типової групи власне-випадковою або механічною вибіркою проводиться індивідуальний відбір одиниць у вибіркову сукупність. Важливою особливістю типової вибірки і те, що вона дає точніші результати проти іншими способами відбору одиниць у вибіркову сукупність;

§ серійна - за якої генеральну сукупність ділять на однакові за обсягом групи - серії. У вибіркову сукупність відбираються серії. Усередині серій проводиться суцільне спостереження одиниць, що потрапили до серії;

Комбінована – вибірка може бути двоступінчастою. У цьому генеральна сукупність спочатку розбивається групи. Потім здійснюють відбір груп, а всередині останніх здійснюється відбір окремих одиниць.

У статистиці розрізняють такі методи відбору одиниць у вибіркову сукупність:

§ одноступінчаста вибірка - кожна відібрана одиниця відразу ж піддається вивченню за заданою ознакою (власне-випадкова та серійна вибірки);

Багатоступінчаста вибірка - роблять підбір з генеральної сукупності окремих груп, та якщо з груп вибираються окремі одиниці (типова вибірка з механічним способом відбору одиниць у вибіркову сукупність).

Крім того розрізняють:

§ повторний відбір - за схемою повернутої кулі. При цьому кожна одиниця, що потрапила у вибірку, іди серія повертається в генеральну сукупність і тому має шанс знову потрапити у вибірку;

Варіація- Це відмінності індивідуальних значень ознаки в одиниць сукупності, що вивчається. Дослідження варіації має велике практичне значення та є необхідною ланкою в економічному аналізі. Необхідність вивчення варіації пов'язана з тим, що середня, будучи рівнодією, виконує своє основне завдання з різним ступенем точності: чим менше відмінності індивідуальних значень ознаки, що підлягають опосередковенню, тим однорідніша сукупність, а, отже, точніша і надійніша середня, і навпаки. Отже за рівнем варіації можна будувати висновки про межі варіації ознаки, однорідності сукупності за цією ознакою, типовості середньої, взаємозв'язку чинників, визначальних варіацію.

Зміна варіації ознаки в сукупності здійснюється за допомогою абсолютних та відноснихпоказників.

Абсолютні показники варіації включають:

Розмах варіації (R)

Розмах варіації— це різниця між максимальним та мінімальним значеннями ознаки

Він показує межі, у яких змінюється величина ознаки в досліджуваній .

приклад. Досвід роботи у п'яти претендентів на попередній роботі складає: 2,3,4,7 та 9 років.
Рішення: розмах варіації = 9 - 2 = 7 років.

Для узагальненої характеристики відмінностей значення ознаки обчислюють середні показники варіації, засновані на обліку відхилень від середньої арифметичної. За відхилення від середньої приймається різниця.

При цьому, щоб уникнути перетворення на нуль суми відхилень варіантів ознаки від середньої (нульова властивість середньої) доводиться або не враховувати знаки відхилення, тобто брати цю суму за модулем , або зводити значення відхилень у квадрат

Середнє лінійне та квадратичне відхилення

Середнє лінійне відхилення- Це з абсолютних відхилень окремих значень ознаки від середньої.

Середнє лінійне відхилення просте:

Досвід роботи у п'яти претендентів на попередній роботі складає: 2,3,4,7 та 9 років.

У прикладі: років;

Відповідь: 2,4 роки.

Середнє лінійне відхилення зваженезастосовується для згрупованих даних:

Середнє лінійне відхилення з його умовності застосовується практично порівняно рідко (зокрема, для характеристики виконання договірних зобов'язань щодо рівномірності поставки; в аналізі якості продукції з урахуванням технологічних особливостей виробництва).

Середнє квадратичне відхилення

Найбільш досконалою характеристикою варіації є середнє квадратичне відкладення, яке називають стандартом (або стандартним відхиленням). () дорівнює квадратному кореню із середнього квадрата відхилень окремих значень ознаки від :

Середнє квадратичне відхилення просте:

Середнє зважене квадратичне відхилення застосовується для згрупованих даних:

Між середнім квадратичним та середнім лінійним відхиленнями в умовах нормального розподілу має місце таке співвідношення: ~ 1,25.

Середнє квадратичне відхилення, будучи основною абсолютною мірою варіації, використовується щодо значень ординат кривої нормального розподілу, в розрахунках, пов'язаних з організацією вибіркового спостереження і встановленням точності вибіркових характеристик, і навіть в оцінці меж варіації ознаки в однорідної сукупності.

Дисперсія

Дисперсія- є середнім квадратом відхилень індивідуальних значень ознаки від їх середньої величини.

Дисперсія проста:

У нашому прикладі:

Дисперсія зважена:

Більш зручно обчислювати дисперсію за такою формулою:

яка виходить із основним шляхом нескладних перетворень. У цьому випадку середній квадрат відхилень дорівнює середній із квадратів значень ознаки мінус квадрат середньої.

Для несгрупованих даних:

Для згрупованих даних:

Варіація альтернативної ознакиполягає в наявності або відсутності досліджуваної властивості одиниць сукупності. Кількісно варіація альтернативної ознаки виражається двома значеннями: наявність у одиниці досліджуваної властивості позначається одиницею (1), яке відсутність — нулем (0). Частку одиниць, що мають досліджувану ознаку, позначають буквою , а частку одиниць, що не мають цієї ознаки - через . Враховуючи, що p + q = 1 (звідси q = 1 - p), а середнє значення альтернативної ознаки дорівнює

,

середній квадрат відхилень

Таким чином, дисперсія альтернативної ознаки дорівнює добутку частки одиниць, що мають дану властивість (), на частку одиниць, даною властивістю не мають ().

Максимальне значення середній квадрат відхилення (дисперсія) набуває у разі рівності часток, тобто. коли тобто. . Нижня межа цього показника дорівнює нулю, що відповідає ситуації, коли у сукупності відсутня варіація. Середнє квадратичне відхилення альтернативної ознаки:

Тож якщо у виготовленої партії 3% виробів виявилися нестандартними, то дисперсія частки нестандартних виробів , а середнє квадратичне відхилення чи 17,1%.

Середнє квадратичне відхиленнядорівнює квадратному кореню із середнього квадрата відхилень окремих значень ознаки від середньої арифметичної.

Відносні показники варіації

Відносні показники варіації включають:

Порівняння варіації кількох сукупностей за однією й тому ознакою, а тим більше за різними ознаками з допомогою абсолютних показників неможливо. У таких випадках для порівняльної оцінки ступеня відмінності будують відносні показники варіації. Вони обчислюються як відношення абсолютних показників варіації до середньої:

Розраховуються інші відносні характеристики. Наприклад, для оцінки варіації у разі асиметричного розподілу обчислюють відношення середнього лінійного відхилення до медіан.

оскільки завдяки властивості медіани сума абсолютних відхилень ознаки від її величини завжди менша, ніж від будь-якої іншої.

Як відносна міра розсіювання, що оцінює варіацію центральної частини сукупності, обчислюють відносне квартильне відхилення , де - середній квартиль напівсуми різниці третього (або верхнього) квартилю () і першого (або нижнього) квартилю ().

Насправді найчастіше обчислюють коефіцієнт варіації. Нижньою межею цього показника є нуль, верхньої межі він не має, проте відомо, що зі збільшенням варіації ознаки збільшується його значення. Коефіцієнт варіації є у ​​сенсі критерієм однорідності сукупності (у разі нормального розподілу).

Розрахуємо коефіцієнт варіації на основі середнього відхилення квадратичного для наступного прикладу. Витрата сировини на одиницю продукції склав (кг): за однією технологією при , а за іншою — за. Безпосереднє порівняння величини середніх квадратичних відхилень могло б призвести до невірного уявлення про те, що варіація витрати сировини за першою технологією інтенсивніша, ніж за другою (. Відносна міра варіації (дозволяє зробити протилежний висновок)

Приклад розрахунку показників варіації

На етапі відбору кандидатів до участі у здійсненні складного проекту фірма оголосила конкурс професіоналів. Розподіл претендентів з досвіду роботи показав середні результати:

Обчислимо середній виробничий досвід роботи, років

Розрахуємо дисперсію щодо тривалості досвіду роботи

Такий самий результат виходить, якщо використовувати для розрахунку іншу формулу розрахунку дисперсії

Обчислимо середнє квадратичне відхилення, років:

Визначимо коефіцієнт варіації, %:

Правило складання дисперсій

Для оцінки впливу факторів, що визначають варіацію, використовують прийом угруповання: сукупність розбивають на групи, вибравши як групувальну ознаку один із визначальних факторів. Тоді поряд із загальною дисперсією, розрахованою по всій сукупності, обчислюють внути групову дисперсію (або середню з групових) та міжгрупову дисперсію (або дисперсію групових середніх).

Загальна дисперсіяхарактеризує варіацію ознаки у всій сукупності, що склалася під впливом всіх факторів та умов.

Міжгрупова дисперсіявимірює систематичну варіацію, обумовлену впливом фактора, за яким проведено угруповання:

Внутрішньогрупова дисперсіяоцінює варіацію ознаки, що склалася за впливом інших факторів, що не враховуються в даному дослідженні і незалежну від фактора угруповання. Вона визначається як середня із групових дисперсій.

Всі три дисперсії () пов'язані між собою наступною рівністю, яка відома як правило складання дисперсій:

у цьому співвідношенні будуються показники, оцінюють вплив ознаки угруповання освіту загальної варіації. До них відносяться емпіричний коефіцієнт детермінації () та емпіричне кореляційне відношення ().

() характеризує частку міжгрупової дисперсії у спільній дисперсії:

і показує, наскільки варіація ознаки в сукупності обумовлена ​​фактором угруповання.

Емпіричне кореляційне ставлення(!!\eta = \sqrt( \frac(\delta^2)(\sigma^2) )

оцінює тісноту зв'язку між досліджуваним та групувальним ознаками. Граничними значеннями є нуль та одиниця. Чим ближче до одиниці, тим тісніше зв'язок.

приклад. Вартість 1 кв.м загальної площі (усл.од) на ринку житла по десяти 17-м будинкам покращеного планування становила:

При цьому відомо, що перші п'ять будинків було збудовано поблизу ділового центру, а решта — на значній відстані від нього.

Для розрахунку загальної дисперсії обчислимо середню вартість 1 кв. загальної площі: Загальну дисперсію визначимо за формулою :

Обчислимо середню вартість 1 кв. та дисперсію за цим показником для кожної групи будинків, що відрізняються місцем розташування щодо центру міста:

а)для будинків, збудованих поблизу центру:

б)для будинків, збудованих далеко від центру:

Варіація вартості 1 кв. загальної площі, викликана зміною розташування будинків, визначається величиною міжгрупової дисперсії:

Варіація вартості 1 кв. загальної площі, обумовлена ​​зміною інших показників, що не враховуються нами, вимірюється величиною внутрішньогрупової дисперсії

Знайдені дисперсії у сумі дають величину загальної дисперсії

Емпіричний коефіцієнт детермінації:

показує, що дисперсія вартості 1. кв.м. загальної площі на ринку житла на 81,8% пояснюється відмінностями в розташуванні новобудов по відношенню до ділового центру та на 18,2% іншими факторами.

Емпричне кореляційне ставлення свідчить про суттєвий вплив на вартість житла розташування будинків.

Правило складання дисперсій для часткиознаки записується так:

а три види дисперсій частки для згрупованих даних визначається за такими формулами:

загальна дисперсія:

Формули міжгрупової та внутрішньогрупової дисперсій:

Характеристики форми розподілу

Для отримання уявлення про форму розподілу використовуються показники середнього рівня ( , ), Показники варіації, асиметрії та ексцесу.

У симетричних розподілах середня арифметична, мода та медіана збігаються. Якщо ця рівність порушується — розподіл асиметричний.

Найпростішим показником асиметрії є різниця, яка у разі правосторонньої асиметрії позитивна, а при лівосторонній – негативна.

Асиметричний розподіл

Для порівняння асиметрії кількох рядів обчислюється відносний показник

Як узагальнюючі характеристики варіації використовуються центральні моменти розподілу-го порядку , відповідні ступеня, у якому зводяться відхилення окремих значень ознаки від середньої арифметичної:

Для несгрупованих даних:

Для згрупованих даних:

Момент першого порядку відповідно до властивості середньої арифметичної дорівнює нулю.

Момент другого порядку є дисперсією.

Моменти третього та четвертого порядків використовуються для побудови показників, що оцінюють особливості форми емпіричних розподілів.

За допомогою моменту третього порядку вимірюють ступінь скошеності чи асиметричності розподілу.

- Коефіцієнт асиметрії

У симетричних розподілах, як і всі центральні моменти непарного порядку. Нерівність нулю центрального моменту третього порядку вказує на асиметричність розподілу. При цьому, якщо асиметрія правостороння і відносно максимальної ординати витягнута права гілка; якщо , то асиметрія лівостороння (на графіці це відповідає витягнутості лівої гілки).

Для характеристики гостроверхості або плосковершинності розподілу обчислюють відношення моменту четвертого порядку () до середньоквадратичного відхилення в четвертому ступені (). Для нормального розподілу, тому ексцес знаходять за формулою:

Для нормального розподілу перетворюється на нуль. Для гостроверхих розподілів, для плосковершинних.

Ексцес розподілу

Крім показників, розглянутих вище, узагальнюючою характеристикою варіації в однорідній сукупності служить певний порядок у зміні частот розподілу відповідно до змін величини ознаки, що вивчається, званий закономірністю розподілу.

Характер (тип) закономірності розподілу може бути виявлений шляхом побудови варіаційного ряду на підставі великого обсягу спостережень, а також вибору числа груп і величини інтегралів, при якому найбільш чітко могла б проявитися закономірність.

Аналіз варіаційних рядів передбачає виявлення характеру розподілу (як результату дії механізму варіації), встановлення функції розподілу, перевірку відповідності емпіричного розподілу теоретичному.

Емпіричний розподіл, отримане на основі даних спостереження, графічно зображується кривою емпіричної розподілу за допомогою полігону.

На практиці зустрічаються різні типи розподілів, серед яких можна виділити симетричні та асиметричні, одновершинні та багатовершинні.

Встановити тип розподілу означає виразити механізм формування закономірності в аналітичній формі. Багатьом явищам та його ознакам властиві характерні форми розподілу, які апроксимуються відповідними кривими. При всьому різноманітті форм розподілу найбільшого поширення як теоретичні набули нормальний розподіл, розподіл Пауссона, біномінальний розподіл та ін.

Особливе місце у вивченні варіації належить нормальному закону завдяки його математичним властивостям. Для нормального закону виконується правило трьох сигм, яким варіація індивідуальних значень ознаки перебуває у межах від величини середньої. При цьому в межах знаходиться близько 70% усіх одиниць, а в межах 95%.

Оцінка відповідності емпіричного та теоретичного розподілів здійснюється за допомогою критеріїв згоди, серед яких широко відомі критерії Пірсона, Романовського, Ястремського, Колмогорова.

ПОКАЗНИКИ ВАРІАЦІЇ

Методичні вказівки до вирішення завдань

На тему «Показники варіації»

Для вимірювання ступеня варіювання (коливання) ознаки служить варіація, показниками якої є: розмах варіації, середнє лінійне відхилення, середнє квадратичне відхилення, середній квадрат відхилень (дисперсія), коефіцієнт варіації.

Розмах варіації

Розмах варіації ( R) характеризує межі варіації (зміни) індивідуальних значень (або варіантів) ознаки ( x) у статистичній сукупності

де - найбільше та найменше значення ознаки.

Середнє лінійне відхилення

Середнє лінійне відхилення обчислюється за формулами середньої арифметичної:

Простий (невиваженої)

,

де - i-е значення ознаки x ;

Середня величина ознаки x ;

Статистична вага i-го значення ознаки;

n- Число членів сукупності;

Виваженою

Середнє квадратичне відхилення

Середнє квадратичне відхилення розраховується за формулами:

Незваженою

Виваженою

Дисперсія кількісної ознаки

Дисперсіякількісної ознаки визначається за формулами середньої арифметичної:

Незваженою

Виваженою

Дисперсія може бути розрахована наступним чином:

де – середній квадрат значень ознаки;

Квадрат середньої величини ознаки.

Властивості дисперсії кількісної ознаки

1. При зменшенні або збільшенні ваг (частот) варіюючої ознаки Kякщо дисперсія не змінюється

2. При зменшенні або збільшенні кожного значення ознаки на ту саму постійну величину Адисперсія не змінюється

де - Середнє значення ознаки ( x- A).

3. При зменшенні або збільшенні кожного значення ознаки в однакове число Kраз дисперсія зменшується або збільшується в K 2 рази, а середнє квадратичне відхилення - у Kраз



де – середнє значення ознаки xK.

4. Дисперсія ознаки щодо довільної величини Aзавжди більше дисперсії щодо середньої арифметичної на квадрат різниці між середньою та довільною величиною

Доведення:

Дисперсія щодо середньої величини

Обчислення дисперсії способом моментів

Метод спрощеного розрахунку дисперсії здійснюється за формулою

і називається способом моментів.

Показники m 1 , m 2 являють собою моменти першого та другого порядку та розраховуються наступним чином

Доведення:

Дисперсії кількісної ознаки в сукупності,

Поділеної на групи

Для аналізу зв'язків кількісних ознак у статистичній сукупності, розділеній на групи, розраховуються такі дисперсії: групова, міжгрупова, внутрішньогрупова та загальна.

Групова дисперсія (приватна) характеризує варіацію ознаки в групі, обумовлену дією на нього всіх інших факторів, крім ознаки, покладеної в основу угруповання (групувальної ознаки):

де - i-е значення ознаки в j-ї групи;

Приватна (групова) середня величина ознаки j-ї групи;

Статистична вага i-го значення ознаки в j-ї групи;

Число різних значень ознаки в j-ї групи.

Міжгрупова дисперсія вимірює ступінь коливання (варіацію) ознаки у всій статистичній сукупності за рахунок фактора, покладеного в основу угруповання (групувальної ознаки):

де - Середнє значення ознаки в сукупності (загальна середня);

Вага j-ї групи, що є чисельністю одиниць j

J- кількість груп у статистичній сукупності.

Внутрішньогрупова дисперсія (середня групових дисперсій) вимірює ступінь коливання ознаки у всій сукупності в цілому за рахунок дії на нього всіх інших факторів (ознак), крім групувальної ознаки:

Загальна дисперсія вимірює ступінь коливання ознаки, за рахунок впливу всіх факторів, що діють на нього:

Загальна дисперсія ознаки у статистичній сукупності, розділеної на групи, може бути визначена за основною формулою дисперсії

Міжгрупова і загальна дисперсії застосовуються визначення показників тісноти зв'язку показників у сукупності, розділеної на групи.

Дисперсія якісної альтернативної ознаки

Для визначення дисперсії альтернативної ознаки припустимо, що загальна кількість одиниць сукупності дорівнює n. Число одиниць, що володіють ознакою, що вивчається - f, Тоді число одиниць, які не мають досліджуваної ознаки, дорівнює ( n- f). Ряд розподілу якісної (альтернативної) ознаки має такий вигляд

Значення змінної Частота повторень
f n-f
Разом n

Середня арифметична такого ряду дорівнює:

тобто дорівнює відносній частоті (частини) появи досліджуваної ознаки, яку можна позначити через pтоді

Частка одиниць, які мають досліджувану ознаку дорівнює p, частка одиниць, які не мають досліджуваної ознаки, дорівнює qтоді p + q = 1.

Дисперсія альтернативної ознаки

Окремий випадок атрибутивної (кількісної) ознаки - ознака альтернативна. Коли одиниці сукупності або мають цю ознаку, що вивчається, або не мають його. Прикладом таких ознак є: бракована продукція, науковий ступінь у викладачів вузу, робота з отриманої спеціальності, перевищення середньодушових грошових доходів їх загальноросійського рівня, наявність дітей у сім'ї і т.д.

У разі альтернативної ознаки одиниці сукупності присвоюється значення «1». У разі відсутності – «0».

Терезами в розрахунках служать:

Частка одиниць, що мають дану ознаку;

Частка одиниць, які не мають даної ознаки

Тоді середня величина альтернативної ознаки дорівнює:

дисперсія набуде вигляду:

Дисперсія альтернативної ознаки змінюється від 0 до 0,25. Максимального значення 0,25 досягає 0,5

Приклад 4.11. При вибірковому опитуванні 300 жителів Курська 60 із них висловилися позитивно щодо зберігання особистих грошових заощаджень у комерційних банках міста

Визначити середній рівень, дисперсію та середнє квадратичне відхилення ознаки

Практичне застосування варіації альтернативної ознаки переважно полягає у побудові довірчих інтервалів під час проведення вибіркового спостереження.

Вивчення форми розподілу ознаки. Основні характеристики закономірностей розподілу

Неодмінним умовою успішності побудов, обчислень і висновків з урахуванням варіаційних рядів є однорідність узагальнюваних у яких сукупностей, встановлювана з урахуванням глибокого теоретичного аналізу.

Чітко виражений порядок зміни частот відповідно до зміни величини ознаки називають закономірністю розподілу.

Знання типу закономірності розподілу, (отже, і форми кривої) необхідно передусім:

1. Для з'ясування типовості умов одержання первинного статистичного матеріалу. Так, поява багатовершинної або суттєво асиметричної кривої говорить про різнотипний склад сукупності та необхідність перегрупування даних з метою виявлення більш однорідних груп.

2. Для забезпечення правильності виконання практичних розрахунків та прогнозів. Так, застосування формули Г. Стерджесса для розрахунку оптимальної кількості груп інтервального ряду, правила «трьох сигм», коефіцієнта варіації Vу як індикатора однорідності сукупності, методу найменших квадратів при моделюванні кореляційного зв'язку явищ, методів дисперсійного аналізу та інших правомочно лише в умовах нормального і близьких щодо нього розподілів.

Закономірності варіаційних рядів, що виражають у типі розподілу їх частот, наочно виступають на графіках - гістограмі та полігоні розподілу частот. Їх розгляд показує, що у гістограмі спостерігається велика стрибкоподібність розподілу, а полігоні виявляється поступовість переходу від однієї групи до іншої. Ламана лінія полігону частково згладжує стрибкоподібність гістограми, є узагальненим прийомом аналізу розподілу.

При збільшенні рядків інтервального варіаційного ряду та відповідному зменшенні величини його інтервалів кількість сторін полігону розподілу зростатиме і ламаною лінії буде властива тенденція перетворитися на межу на якусь криву. Така крива називається кривою розподілу. У ньому відбувається найбільше звільнення даних від впливу випадкових чинників. Вона виявляє і показує максимально узагальненому вигляді характер варіації, закономірність розподілу частот всередині одноякісної сукупності явищ.

Криві розподіли можуть бути різних типів. У практиці соціально-економічних досліджень широко застосовується крива нормального розподілу. Вона є одновершинною симетричною дзвоноподібною фігурою, права і ліва гілки якої рівномірно і симетрично спадають, асимптотично наближаючись до осі абсцис.

Відмінною особливістю цієї кривої є збіг у ній середньої арифметичної, моди та медіани. Якщо всю площу між кривою та віссю абсцис прийняти за 100%, то в межах укладено 68,3% частот, у межах – 95,4%, у межах 99,7% («правило трьох сигм»).

Хоча нормальне, чи симетричне, розподіл відповідає природі низки явищ, проте громадських явищ воно нехарактерно, оскільки у ньому відбиваються відмінності, викликані зовнішніми впливами, властиві не що розвивається, лише коливається сукупності одиниць. Для соціальних явищ характерний розвиток, динамізм. Тому ряди та криві розподілу частот суспільних явищ, як правило, асиметричні, у них частоти зростають до максимуму та зменшуються від нього нерівномірно. Саме наявність асиметрії, чи скошеності, у лавах однорідних сукупностей служить непрямим вказівкою те що, що досліджуваний процес проходить активну стадію розвитку.

Асиметричні ряди та відповідні криві мають різні форми розподілів, досліджені математичною статистикою. Такими формами є розподіл Пуассона, розподіл Максвелла, розподіл Пірсона та ін Тут асиметричність розглядається в цілому як єдиний тип розподілу. При цьому розрізняють правосторонню та лівосторонню асиметрію (скошеність).

Якщо довга гілка кривої розташована правіше вершини, то асиметрія називається правосторонньою, якщо ця гілка розташована лівіше за вершину - лівосторонню. При правосторонній асиметрії при лівій. Тому різницю між ними, віднесену до, називають коефіцієнтом К. Пірсона і використовують як коефіцієнт асиметрії:

При правосторонній асиметрії цей коефіцієнт позитивний, при лівосторонній - негативний. Якщо = 0, варіаційний ряд симетричний. Чим більша абсолютна величина коефіцієнта, тим більший ступінь скошеності.

Найбільш точним показником асиметрії розподілу є коефіцієнт асиметрії, що обчислюється за формулою

де n – число одиниць сукупності. Як і у випадку коефіцієнта Пірсона, при > 0 має місце правостороння асиметрія, при< 0 левосторонняя. В симметричных распределениях = 0.

Чим більша величина ||, тим більше асиметричний розподіл. Встановлено наступну оцінну шкалу асиметричності:

|| - асиметрія незначна;

0,25 < || - асимметрия заметная (умеренная);

|| > 0,5 – асиметрія суттєва.

Оскільки коефіцієнти є відносними безрозмірними величинами, вони часто застосовуються для порівняльного аналізу асиметричності різних рядів розподілу.

Характер асиметрії іноді свідчить про напрям розвитку. При дослідженні варіації ознак, щодо яких є зацікавленість у їх збільшенні (виконання норм, випуск продукції тощо), правостороння асиметрія свідчить про прогресивність розвитку, у тому, що йде у бік збільшення показника, а лівостороння асиметрія свідчить про наявність великої кількості ділянок, що відстають.

При дослідженні варіації ознак, щодо яких є зацікавленість у їх зменшенні (собівартість, трудомісткість, витрата сировини на одиницю продукції тощо), правостороння асиметрія свідчить про недоліки у розвитку досліджуваного процесу, лівостороння – про прогресивність його розвитку, у тому, що останнє йде у бік зменшення показника. У розподілі працівників за стажем (див. приклад 4.9 = 5,75) спостерігається правостороння асиметрія, оскільки коефіцієнт асиметрії позитивний: (5,955-5,75):2,47=0,095. Така асиметрія для цього ряду прогресивна, вона свідчить про розвиток низки у бік збільшення досліджуваного показника.

Форму розподілу можна орієнтовно визначити безпосередньо розглядом емпіричних даних ряду, якщо вони зображені гістограмою і полігоном. Щоб переконатися у правильності орієнтовного визначення форми розподілу, емпіричні дані ряду досліджуються з їхньої близькість до теоретичного розподілу, встановлюваного з допомогою побудови відповідної кривої розподілу. Однак у багатьох випадках ні теорія, ні безпосередній розгляд емпіричних даних не дають відповіді на питання про форму розподілу. Тоді зазвичай ведеться дослідження на близькість емпіричних даних до нормального розподілу, тому що розподіли з невеликою або помірною асиметричністю в більшості випадків за своїм типом належать до нормальних.

Для об'єктивного судження про рівень відповідності емпіричного розподілу нормальному у статистиці використовується ряд критеріїв, званих критеріями згоди чи відповідності.

До них відносяться критерії Пірсона, Романовського, Ястремського, Колмогорова, що ґрунтуються на використанні різних теоретичних уявлень.

Наприклад, найбільш використовуваний критерій згоди Пірсона («хі-квадрат») визначається за такою формулою:

де – емпіричні частоти (частини)

Теоретичні частоти (частини)

Для оцінки близькості емпіричного розподілу до теоретичного визначається можливість досягнення цим критерієм даної величини. Якщо ця можливість перевищує 0,05, то відхилення фактичних частот від теоретичних вважаються випадковими, несуттєвими. Якщо ж, то відхилення вважаються суттєвими, а емпіричний розподіл - принципово відмінним від теоретичного.

Для характеристики ступеня відхилення симетричного розподілу нормального розраховується показник ексцесу. Він приблизно може бути визначений за допомогою коефіцієнта Ліндберга.

де - частка (в%) кількості варіантів, що лежать в інтервалі рівному половинісереднього квадратичного відхилення (у той і інший бік від величини середньої) у загальній кількості варіант даного ряду;

38,29 - частка (у %) кількості варіант, що лежать в інтервалі, що дорівнює половинісереднього квадратичного відхилення (в той і інший бік від величини середньої) у загальній кількості варіант ряду нормального розподілу

Ексцес може бути позитивним, негативним та рівним нулю.

У високовершинних кривих показник ексцесу має позитивний знак, низьковершинних кривих - негативний знак. Для кривої нормального розподілу його величина дорівнює нулю.

Для більш точної характеристики ступеня відхилення симетричного розподілу від нормального розраховується показник гострості (показник ексцесу) (Ek) за формулою:

Він, як і коефіцієнт Ліндберга, може бути позитивним, негативним та рівним нулю. Показник ексцесу, як і показник асиметрії, - абстрактне число. Граничним значенням негативного ексцесу є значення Ek = -2; величина ж позитивного ексцесу є нескінченною величиною.

Визначення показників асиметрії та ексцесу має не тільки описове значення, часто їх величини дають певні вказівки для подальшого дослідження явищ, що вивчаються. Так, наприклад, поява значного негативного ексцесу може вказувати на якісну неоднорідність досліджуваної сукупності.

Сучасні комп'ютерні технології відкривають широкі можливості виконання громіздких обчислювальних операцій із аналізу варіаційних рядів. Якщо матеріал теоретично осмислений і висунута розумна гіпотеза про форму розподілу (останнє, до речі, ЕОМ теж може перевірити), обчислювальні пристрої можуть швидко обчислити різні узагальнюючі показники та критерії, побудувати графіки тощо. Це можливо, оскільки показники варіації порівняно нескладні і добре формалізовані.

Поняття варіації

Середня дає узагальнюючу характеристику всієї сукупності досліджуваного явища.

Варіацією ознакиназивається відмінність індивідуальних значень ознаки всередині досліджуваної сукупності.

Середня величина є абстрактною, узагальнюючою характеристикою ознаки сукупності, що вивчається, але вона не показує будову сукупності.

Середня величина не дає уявлення про те, як окремі значення ознаки, що вивчається, групуються навколо середньої, зосереджені вони поблизу або значно відхиляються від неї.

Якщо окремі значення ознаки близькі до середньої арифметичної, то цьому випадку середня добре представляє всю сукупність. І навпаки.

Коливання окремих значень характеризують показники варіації.

Термін «варіація» походить від латинського variatio – зміна, коливання, відмінність. Однак не всі відмінності прийнято називати варіацією.

Під варіацієюу статистиці розуміють такі кількісні зміни величини досліджуваної ознаки в межах однорідної сукупності, які обумовлені впливом дії різних факторів, що перехрещується. Розрізняють варіацію ознаки в абсолютних та відносних величинах. Абсолютна - R, L, σ, σ 2 .

Показники варіації

1 сукупність 2 сукупність
n=5 80, 100, 120, 200, 300 n=8 145, 150, 155, 160, 160, 162, 168, 180

80 100 120 x 200 300

Тож у разі виникає необхідність визначити варіацію ознаки, тобто. співвідношення окремих значень ряду щодо один одного.

Показники варіації

1. Розмах варіації являє собою різницю між максимальним і мінімальним значенням ознаки.

R = X max - X min

R 1 = 300-80 = 220 R 2 = 180-145 = 35

Практика: для однорідної сукупності, контролю якості продукції.

2. Показники, що враховують відхилення всіх варіантів від середньої арифметичної.

а) Середнє лінійне відхилення

б) Середнє квадратичне відхилення

Середнє лінійне відхиленняє середнє арифметичне з абсолютних значень відхилень окремих варіантів від середньої.

для не згрупованих:

;

для згрупованих:

Практика:з його допомогою аналізується:

1. Склад працюючих

2. Ритмічність виробництва

3. Рівномірність постачання матеріалів

Недолік:цей показник ускладнює розрахунки ймовірного типу, ускладнює застосування методів математичної статистики

Середнє квадратичне відхилення (стандартне)– це

для не згрупованих даних

для згрупованих даних

Для помірно асиметричних розподілів

Середнє квадратичне відхилення, як і середнє лінійне відхилення - це абсолютний показник, що виражається в тих самих одиницях, що і середнє арифметичне.

Показники середнього квадратичного або середнього лінійного відхилень для двох сукупностей виявляються непорівнянними, якщо самі ознаки цих сукупностей неоднакові. Несопоставляются ці показники й у різних ознак однієї сукупності. Тобто. коли середні в обох сукупностях виражені в одних і тих самих одиницях виміру і однакові, зіставлення можливе і відобразить відмінності в варіації ознаки.

Середнє квадратичне відхилення є мірилом середньої надійності. Чим менше σ, тим краще середнє арифметичне відбиває собою всю сукупність, що представляється.

3. Дисперсіявикористовується для вимірювання коливання ознаки. Цей показник більш об'єктивно відображає міру варіації

для не згрупованих

для згрупованих

Відмінною особливістю даного показника є те, що при зведенні у квадрат питома вага малих відхилень падає, а великих збільшується у загальній сумі відхилень.

Це також абсолютний показник

Дисперсія має ряд властивостей, деякі з них дозволяють спростити її обчислення:

1. Дисперсія постійної величини дорівнює 0

2. Якщо всі варіанти значень ознаки (x) ↓ на те саме число, то дисперсія не зменшується

3. Якщо всі варіанти ↓ в одне і те ж число разів (K разів), то дисперсія ↓ у 2 рази

x f x "

x у 100 разів

Дисперсія σ дорівнює 0,909 * 10000 = 9090

Вище було розглянуто розрахунок показників варіації для кількісних ознак, але може ставитися завдання оцінки варіації якісних ознак. Наприклад, щодо якості виготовленої продукції можна розділити на придатну і браковану.

У такому разі йдеться про альтернативні ознаки.

Дисперсія альтернативної ознаки

Альтернативними ознакаминазиваються такі, якими одні одиниці сукупності мають, а інші ні. Наприклад, наявність виробничого стажу в абітурієнтів, науковий ступінь у викладачів ВНЗ тощо. Наявність ознаки одиниць сукупності умовно позначаємо через 1, а відсутність – 0. x 1 =1, x 2 =0. Частку одиниць, які мають ознакою (загалом) позначаємо через р, а частку одиниць, які мають – через q. Тобто. p+q=1, q=1-p.

Розрахуємо середнє значення альтернативної ознаки

; ;

Тобто. середнє значення альтернативної ознаки дорівнює частки одиниць, що мають дані ознаки, на частку одиниць, що не мають даних ознак.

Середнє квадратичне відхилення дорівнює Б p =

Перевіряється якість: 1000 готових виробів, 20 бракованих.

Знаходимо частку шлюбу: (20/1000) * 100% = 0,02%

Дисперсія має ряд властивостейякі дозволяють спростити розрахунок.

1. Якщо з усіх значень варіант відібрати якесь постійне число А, то середнє квадратичне відхилення від цього не зміниться.

Поділіться з друзями або збережіть для себе:

Завантаження...