Индикатори за вариация. Изчисляване на дисперсията на алтернативен атрибут Чрез която зависимост се изчислява дисперсията на алтернативен атрибут

Средна стойност на алтернативна характеристика и нейната дисперсия :

Средна стойност на алтернативната характеристика

Вариант на алтернативна характеристика

Заместване във формулата за дисперсия q= 1 - стр, получаваме:

Поради това, алтернативна дисперсия на характеристикитеравно на продукта фракции от единици, притежаващи тази характеристика и дела на единиците, които нямат тази характеристика.

Стандартно отклонение на алтернативна характеристика:

Вариация на алтернативен признак се състои в наличието или отсъствието на изследваното свойство в единиците от съвкупността. Количествено вариацията на алтернативен признак се изразява в две стойности: наличието на изследваното свойство в единица се обозначава с единица (1), а липсата му – с нула (0). Делът на единиците, които притежават изследваната черта, се обозначава с буква, а частта от единиците, които нямат тази черта - чрез. Като се има предвид, че p + q = 1 (следователно q = 1 - p), а средната стойност на алтернативната характеристика е

,

среден квадрат на отклоненията

По този начин дисперсията на алтернативен признак е равна на произведението на частта от единиците с това свойство () на частта от единиците, които нямат това свойство ().

Средният квадрат на отклонението (дисперсията) приема максимална стойност при равенство на дяловете, т.е. когато т.е. ... Долната граница на този индикатор е нула, което съответства на ситуация, в която няма съвкупна вариация. Стандартно отклонение на алтернативна характеристика:

Селективно наблюдение, предимства и недостатъци.

Селективното наблюдение е един от най-модерните видове статистическо наблюдение, при който се изследват част от единиците на изследваната съвкупност, избрани въз основа на научно разработени принципи, които осигуряват достатъчно количество надеждни данни, за да се характеризира цялата съвкупност. като цяло.

Средните и относителните показатели, получени на базата на извадкови данни, трябва да възпроизвеждат достатъчно пълно съответните показатели за съвкупността като цяло.

Основните предимства на селективното наблюдение са, че то може да се извършва по по-широка програма, по-евтино е по отношение на разходите си и може да се организира, когато и в случаите, когато не можем да използваме отчетност.

Основните недостатъци са, че получените данни винаги съдържат грешки и резултатите от наблюдението могат да се оценяват само с определена степен на надеждност. Изисква се и квалифициран персонал.

Методи за формиране на проба.

В статистиката се използват различни методи за формиране на извадкови набори, които се определят от целите на изследването и зависят от спецификата на обекта на изследване.

Основното условие за провеждане на извадково изследване е да се предотврати възникването на системни грешки, произтичащи от нарушаване на принципа на равните възможности всяка единица от генералната съвкупност да бъде включена в извадката. Предотвратяването на системни грешки се постига в резултат на използването на научно обосновани методи за формиране на извадкова съвкупност.

Има следните начини за избор на единици от общата съвкупност:

1) индивидуален подбор - в извадката се избират отделни единици;

2) групов подбор - в извадката попадат качествено хомогенни групи или серии от изследваните единици;

3) комбинираният подбор е комбинация от индивидуален и групов подбор.

Методите за подбор се определят от правилата за формиране на извадковата съвкупност.

Пробата може да бъде:

Строго случайното се състои във факта, че извадковата съвкупност се формира в резултат на случаен (непреднамерен) подбор на отделни единици от генералната съвкупност. В този случай броят на единиците, избрани за извадковата съвкупност, обикновено се определя въз основа на приетата част от извадката. Пропорцията на извадката е съотношението на броя на единиците в извадката n към броя на единиците в генералната съвкупност N, т.е.

§ механичен е, че подборът на единици в извадката се извършва от генералната съвкупност, разделена на равни интервали (групи). Освен това размерът на интервала в общата съвкупност е равен на реципрочната част на извадката. И така, с 2% проба се избира всяка 50-та единица (1: 0,02), с 5% проба всяка 20-та единица (1: 0,05) и т.н. По този начин, в съответствие с приетия дял на подбора, генералната съвкупност е като че ли механично разделена на групи с еднакъв размер. От всяка група се избира само една единица.

§ типичен – при който генералната съвкупност първо се разделя на хомогенни типични групи. След това от всяка типична група, чрез правилно произволно или механично вземане на проби, се прави индивидуален подбор на единици в извадковата съвкупност. Важна характеристика на типичната извадка е, че тя дава по-точни резултати в сравнение с други методи за подбор на единици в извадката;

§ сериен – при който генералната съвкупност се разделя на групи с еднакъв размер – серии. За извадката се избират серии. В рамките на серията се извършва непрекъснато наблюдение на единиците, включени в серията;

Комбинирана - пробата може да бъде двуетапна. В този случай общото население първо се разделя на групи. След това се избират групите, а в рамките на последните се избират отделни единици.

В статистиката се разграничават следните методи за избор на единици за извадка:

§ едноетапно вземане на проби - всяка избрана единица незабавно се изследва по зададен критерий (правилно произволно и серийно вземане на проби);

Многоетапна извадка – подборът се извършва от генералната съвкупност на отделните групи, а отделните единици се избират от групите (типична извадка с механичен метод за подбор на единици в извадковата съвкупност).

Освен това се прави разлика между:

§ повторен подбор - по схемата на върнатата топка. Освен това всяка единица или серия, попаднали в извадката, се връщат в общата съвкупност и следователно има шанс да попаднат отново в извадката;

Вариация- това са разликите в индивидуалните стойности на признака в единици от изследваната популация. Изучаването на вариациите е от голямо практическо значение и е необходимо звено в икономическия анализ. Необходимостта от изследване на вариацията се дължи на факта, че средната, като резултат, изпълнява основната си задача с различна степен на точност: колкото по-малки са разликите в индивидуалните стойности на чертата, която трябва да бъде осреднена, толкова по-хомогенна е популацията , и следователно, колкото по-точна и надеждна е средната стойност, и обратно. Следователно, според степента на вариация, може да се прецени границите на вариация на даден признак, хомогенността на популацията за този признак, типичността на средната стойност, връзката на факторите, определящи вариацията.

Промяната на вариацията на характеристика в съвкупността се извършва с помощта на абсолютни и относителнииндикатори.

Абсолютните показатели за вариация включват:

Вариант на люлеене (R)

Вариант на плъзганеДали разликата между максималните и минималните стойности на характеристиката

Показва границите, в които се променя стойността на чертата в изследваната.

Пример... Трудов стаж на петима кандидати в предишна работа е: 2,3,4,7 и 9 години.
Решение: диапазон на вариация = 9 - 2 = 7 години.

За обобщена характеристика на разликите в стойностите на атрибута, средните показатели за вариация се изчисляват въз основа на отчитане на отклоненията от средната аритметична стойност. Разликата се приема като отклонение от средната стойност.

В същото време, за да се избегне сумата от отклоненията на опциите на даден признак от средната стойност (нулево свойство на средната стойност), е необходимо или да не се вземат предвид признаците на отклонение, тоест да се вземе това сума по модул, или квадратура на отклоненията до нула.

Средно линейно и стандартно отклонение

Средно линейно отклонение- това е от абсолютните отклонения на индивидуалните стойности на характеристиката от средните.

Средното линейно отклонение е просто:

Трудов стаж на петима кандидати в предишна работа е: 2,3,4,7 и 9 години.

В нашия пример: години;

Отговор: 2,4 години.

Претеглено средно линейно отклонениесе отнася за групирани данни:

Средното линейно отклонение, поради неговата конвенция, се използва на практика сравнително рядко (по-специално, за характеризиране на изпълнението на договорните задължения за еднородност на доставката; при анализа на качеството на продукта, като се вземат предвид технологичните характеристики на производството).

Стандартно отклонение

Най-съвършената характеристика на вариацията е стандартното отклонение, което се нарича стандарт (или стандартно отклонение). () е равно на квадратния корен от средния квадрат на отклоненията на отделните стойности на характеристиката от:

Стандартното отклонение е просто:

Претегленото стандартно отклонение се използва за групирани данни:

Между средното квадратично и стандартното линейно отклонение при нормални условия на разпределение има следната връзка: ~ 1.25.

Стандартното отклонение, което е основната абсолютна мярка за вариация, се използва за определяне на стойностите на ординатите на кривата на нормалното разпределение, при изчисления, свързани с организиране на наблюдение на извадката и установяване на точността на характеристиките на пробата, както и при оценка на граници на вариация на даден признак в хомогенна популация.

Дисперсия

Дисперсия- е средният квадрат на отклоненията на отделните стойности на признака от тяхната средна стойност.

Разликата е проста:

В нашия пример:

Претеглена дисперсия:

По-удобно е да се изчисли дисперсията по формулата:

който се получава от главния чрез прости преобразувания. В този случай средният квадрат на отклоненията е равен на средната стойност на квадратите на стойностите на характеристиките минус квадрата на средната стойност.

За неагрегирани данни:

За групирани данни:

Вариант на алтернативна функциясе състои в наличието или отсъствието на изследваното свойство в единиците от съвкупността. Количествено вариацията на алтернативен признак се изразява в две стойности: наличието на изследваното свойство в единица се обозначава с единица (1), а липсата му – с нула (0). Делът на единиците, които притежават изследваната черта, се обозначава с буква, а частта от единиците, които нямат тази черта - чрез. Като се има предвид, че p + q = 1 (следователно q = 1 - p), а средната стойност на алтернативната характеристика е

,

среден квадрат на отклоненията

По този начин дисперсията на алтернативен признак е равна на произведението на частта от единиците с това свойство () на частта от единиците, които нямат това свойство ().

Средният квадрат на отклонението (дисперсията) приема максимална стойност при равенство на дяловете, т.е. когато т.е. ... Долната граница на този индикатор е нула, което съответства на ситуация, в която няма съвкупна вариация. Стандартно отклонение на алтернативна характеристика:

Така че, ако в произведената партида 3% от продуктите се оказаха нестандартни, тогава дисперсията на дела на нестандартните продукти и стандартното отклонение или 17,1%.

Стандартно отклонениее равен на квадратния корен от средния квадрат на отклоненията на отделните стойности на признака от средноаритметичната стойност.

Относителни проценти на вариация

Относителните нива на вариация включват:

Сравнението на вариацията на няколко популации за една и съща характеристика и още повече за различни характеристики с помощта на абсолютни показатели не е възможно. В тези случаи за сравнителна оценка на степента на разликата се изграждат относителни показатели на вариация. Те се изчисляват като съотношението на абсолютните показатели на вариация към средната стойност:

Изчисляват се и други относителни характеристики. Например, за да се оцени вариацията в случай на асиметрично разпределение, се изчислява съотношението на средното линейно отклонение към медианите

тъй като поради свойството на медианата сумата от абсолютните отклонения на атрибута от неговата стойност винаги е по-малка от която и да е друга.

Като относителна мярка за дисперсия, която оценява вариацията в централната част на популацията, се изчислява отклонението на относителния квартил, където е средният квартил на полусумата на разликата между третия (или горния) квартил () и първи (или по-нисък) квартил ().

На практика най-често се изчислява коефициентът на вариация. Долната граница на този индикатор е нула, тя няма горна граница, но е известно, че с увеличаване на вариацията на даден признак, неговата стойност също се увеличава. Коефициентът на вариация е в известен смисъл критерий за хомогенност на съвкупността (в случай на нормално разпределение).

Нека изчислим коефициента на вариация на базата на стандартното отклонение за следния пример. Разходът на суровини за единица продукт беше (kg): за една технология при, а за другата - в. Прякото сравнение на стойността на стандартните отклонения би могло да доведе до погрешното схващане, че вариацията в потреблението на суровини за първата технология е по-интензивна, отколкото за втората (. Относителната мярка за вариация (позволява да направим обратното заключение

Пример за изчисляване на показателите за вариация

На етапа на подбор на кандидати за участие в сложен проект, фирмата обяви конкурс за професионалисти. Разпределението на кандидатите по трудов стаж показа следните резултати:

Нека изчислим средния производствен опит, години

Нека изчислим дисперсията въз основа на продължителността на трудовия стаж

Същият резултат се получава, ако използваме различна формула за изчисляване на дисперсията за изчислението

Нека изчислим стандартното отклонение, години:

Определете коефициента на вариация, %:

Правило за добавяне на дисперсия

За да се оцени влиянието на факторите, определящи вариацията, се използва техника на групиране: множеството се разделя на групи, като се избира един от определящите фактори като атрибут на групиране. След това, заедно с общата дисперсия, изчислена за цялата съвкупност, се изчисляват вътрешногруповата дисперсия (или средната стойност за групата) и междугруповата дисперсия (или дисперсията на средните стойности на групата).

Пълна дисперсияхарактеризира вариацията на даден признак в цялата съвкупност, който се е развил под влияние на всички фактори и условия.

Междугрупова дисперсияизмерва системната вариация, дължаща се на влиянието на фактора, чрез който се прави групирането:

Вътрешногрупова дисперсияоценява вариацията на чертата, която се е развила според влиянието на други фактори, които не са взети предвид в това изследване и е независима от групиращия фактор. Определя се като средната стойност на груповите дисперсии.

И трите вариации () са свързани помежду си чрез следното равенство, което е известно като правило за добавяне на дисперсия:

това съотношение се използва за конструиране на показатели, оценяващи влиянието на атрибута за групиране върху формирането на обща вариация. Те включват емпиричния коефициент на детерминация () и емпиричното съотношение на корелация ()

() характеризира дела на междугруповата дисперсия в общата дисперсия:

и показва доколко вариацията на чертата в съвкупността се дължи на групиращия фактор.

Емпирична корелационна връзка(!! \ eta = \ sqrt (\ frac (\ delta ^ 2) (\ sigma ^ 2))

оценява плътността на връзката между изследваните и групиращите характеристики. Граничните стойности са нула и едно. Колкото по-близо до един, толкова по-близо е връзката.

Пример. Цената на 1 квадратен метър обща площ (конвенционални единици) на пазара на жилища за десет 17 къщи с подобрено планиране беше:

В същото време е известно, че първите пет къщи са построени в близост до бизнес центъра, а останалите - на значително разстояние от него.

За да изчислим общата дисперсия, нека изчислим средната цена на 1 кв. М. обща площ: Общата дисперсия се определя по формулата :

Нека изчислим средната цена на 1 кв.м. и дисперсията за този показател за всяка група къщи, които се различават по местоположение спрямо центъра на града:

а)за къщи, построени в близост до центъра:

б)за къщи, построени далеч от центъра:

Вариация в цената на 1 кв.м. определя се общата площ, причинена от промяна в местоположението на къщите междугрупова дисперсия:

Вариация в цената на 1 кв.м. от общата площ, поради изменението на останалите показатели, които не отчитаме, се измерва вътрешногрупова дисперсия

Намерените дисперсии се равняват на общата дисперсия

Емпиричен коефициент на детерминация:

показва, че дисперсията на цената на 1 кв.м. от общата площ на жилищния пазар с 81,8% се обяснява с разликите в местоположението на новите сгради спрямо бизнес центъра и с 18,2% - с други фактори.

Емпиричната корелационна връзка показва значително влияние върху цената на жилищата, местоположението на къщите.

Правилото за добавяне на вариации за дробзнакът се изписва по следния начин:

и три типа вариации на дяловете за групирани данни се определят по следните формули:

обща дисперсия:

Формули за междугрупова и вътрешногрупова дисперсия:

Характеристики на формата на разпределение

За да получите представа за формата на разпределение, се използват индикаторите за средно ниво (,), индикатори за вариация, асиметрия и ексцес.

При симетричните разпределения средноаритметичната, модата и медианата съвпадат (. Ако това равенство е нарушено, разпределението е асиметрично.

Най-простият индикатор за асиметрия е разликата, която е положителна в случай на дясностранна асиметрия и отрицателна в случай на лява асиметрия.

Асиметрично разпределение

За да се сравни асиметрията на няколко реда, се изчислява относителен индикатор

Вариациите се използват като обобщаващи характеристики централни разпределителни моменти-ти ред, съответстващ на степента, до която се повишават отклоненията на отделните стойности на атрибута от средноаритметичната:

За негрупирани данни:

За групирани данни:

Моментът от първи ред, според свойството на средноаритметичната стойност, е равен на нула.

Моментът от втори ред е дисперсията.

Моментите от трети и четвърти порядък се използват за конструиране на показатели, които оценяват особеностите на формата на емпиричните разпределения.

Използвайки момента от трети порядък, се измерва степента на асиметрия или асиметрия на разпределението.

- коефициент на асиметрия

При симетричните разпределения, както всички централни моменти от нечетен ред.Ненулевият централен момент от трети ред показва асиметрията на разпределението. В този случай, ако, тогава асиметрията е дясностранна и десният клон е удължен спрямо максималната ордината; ако, тогава асиметрията е лява (на графиката това съответства на удължението на левия клон).

За да се характеризира пиковостта или плоскостта на разпределението, се изчислява съотношението на въртящия момент от четвърти порядък () към стандартното отклонение в четвъртата степен (). Следователно за нормално разпределение ексцесът се намира по формулата:

За нормално разпределение, изчезва. За върхови разпределения, за плоски.

Разпределителен ексцес

В допълнение към показателите, разгледани по-горе, обобщаваща характеристика на вариацията в хомогенна съвкупност е определен ред в промяната на честотите на разпределение в съответствие с промените в стойността на изследвания атрибут, наречен модел на разпространение.

Характерът (видът) на модела на разпределение може да бъде идентифициран чрез конструиране на вариационна серия въз основа на голям брой наблюдения, както и такъв избор на броя на групите и стойността на интегралите, при които моделът би могъл да бъде най-голям. ясно проявена.

Анализът на поредицата от вариации включва идентифициране на естеството на разпределението (в резултат на вариационния механизъм), установяване на функцията на разпределение, проверка на съответствието на емпиричното разпределение с теоретичното.

Емпирично разпределение, получен въз основа на данни от наблюдение, се изобразява графично чрез емпиричната крива на разпределение с помощта на многоъгълник.

На практика съществуват различни видове разпределения, сред които могат да се разграничат симетрични и асиметрични, едновърхови и многовърхови.

Да се ​​установи вида на разпределението означава да се изрази механизмът на формиране на модел в аналитична форма. Много явления и техните особености се характеризират с характерни форми на разпространение, които се апроксимират със съответните криви. При цялото разнообразие от форми на разпределение най-разпространени като теоретични са нормалното разпределение, разпределението на Паусон, биномното разпределение и т.н.

Специално място в изследването на вариацията принадлежи на нормалния закон, поради неговите математически свойства. За нормалния закон е изпълнено правилото на три сигма, според което вариацията на отделните стойности на даден признак е в диапазона от стойността на средната стойност. В същото време около 70% от всички единици са в границите, а 95% са в границите.

Оценяването на съответствието на емпиричните и теоретичните разпределения се извършва с помощта на критерии за доброта, сред които са широко известни критериите на Пирсън, Романовски, Ястремски, Колмогоров.

ПОКАЗАТЕЛИ ЗА ВАРИАЦИЯ

Методически указания за решаване на задачи

По темата "Показатели за вариация"

За измерване на степента на вариация (изменчивост) на даден признак се използва вариация, чиито показатели са: диапазон на вариация, средно линейно отклонение, стандартно отклонение, средноквадратно отклонение (вариация), коефициент на вариация .

Вариант на плъзгане

Обхватът на вариации ( Р) характеризира границите на вариация (промяна) на отделни стойности (или варианти) на атрибута ( х) в статистическата съвкупност

където е най-голямата и най-малката стойност на характеристиката.

Средно линейно отклонение

Средното линейно отклонение се изчислява с помощта на средноаритметичните формули:

Просто (непретеглено)

,

където - и-та стойност на характеристиката х ;

Средна стойност на характеристиката х ;

Статистическо тегло и-та стойност на атрибута;

н- броят на членовете на населението;

Претеглени

Стандартно отклонение

Стандартното отклонение се изчислява по формулите:

Непретеглени

Претеглени

Дисперсия на количествен признак

Дисперсияколичественият атрибут се определя от средноаритметичните формули:

Непретеглени

Претеглени

Дисперсията може да се изчисли, както следва:

където е средният квадрат на стойностите на характеристиката;

Квадратът на средната стойност на характеристиката.

Дисперсионни свойства на количествен признак

1. С намаляване или увеличаване на теглата (честотите) на вариращия атрибут в Ктъй като дисперсията не се променя

2. При намаляване или увеличаване на всяка стойност на атрибута със същата константна стойност Адисперсията не се променя

където е средната стойност на характеристиката ( х- А).

3. При намаляване или увеличаване на всяка стойност на атрибута в едно и също число Кпъти дисперсията намалява или се увеличава с К 2 пъти, а стандартното отклонение - в Кведнъж



където е средната стойност на характеристиката xK.

4. Дисперсия на характеристика по отношение на произволна стойност Авинаги по-голямо от дисперсията спрямо средноаритметичната на квадрат на разликата между средната и произволна стойност

доказателство:

Дисперсия спрямо средната стойност

Изчисляване на дисперсията по метода на моментите

Методът за опростено изчисляване на дисперсията се извършва по формулата

и се нарича път на моментите.

Индикатори м 1 , м 2 представляват моменти от първи и втори ред и се изчисляват по следния начин

доказателство:

Дисперсия на количествен признак в съвкупност,

Разделени на групи

За да се анализират връзките на количествените характеристики в статистическа съвкупност, разделена на групи, се изчисляват следните дисперсии: групова, междугрупова, вътрешногрупова и обща.

Груповата вариация (частична) характеризира вариацията на дадена черта в групата поради действието на всички други фактори върху нея, с изключение на чертата, лежаща в основата на групирането (групираща черта):

където - и-та стойност на характеристиката в j-та група;

Частна (групова) средна стойност на характеристика в j-та група;

Статистическо тегло и-та стойност на атрибута в j-та група;

Броят на различните стойности на характеристиките в jгрупа.

Междугруповата дисперсия измерва степента на променливост (вариация) на даден признак в цялата статистическа съвкупност поради фактора, лежащ в основата на групирането (групираща черта):

където е средната стойност на характеристиката в съвкупността (обща средна стойност);

Теглото j-та група, представляваща броя на единиците в jти

Дж- броят на групите в статистическата съвкупност.

Вътрешногруповата дисперсия (средна стойност на груповите вариации) измерва степента на променливост на даден признак в цялата популация като цяло поради действието върху нея на всички други фактори (черти), с изключение на групиращия признак:

Общата дисперсия измерва степента на променливост на даден признак, дължащ се на влиянието на всички фактори, действащи върху него:

Общата дисперсия на характеристика в статистическа съвкупност, разделена на групи, може да се определи чрез основната формула за дисперсия

Междугруповата и общата дисперсия се използват за определяне на показателите за близостта на връзката на показателите в съвкупността, разделени на групи.

Вариант на качествена алтернативна характеристика

За да определим дисперсията на алтернативен признак, нека приемем, че общият брой единици на населението е равен на н... Броят на единиците с изследваната черта - е, то броят на единиците, които не притежават изследваната характеристика, е равен на ( н- е). Редът на разпространение на качествена (алтернативна) характеристика е както следва

Стойност на променливата Честота на повторение
е н-е
Обща сума н

Средноаритметичната стойност на такава серия е:

тоест е равна на относителната честота (честота) на появата на изследваната черта, която може да се означи с стр, тогава

Делът на единиците с изследваната черта е равен на стр, делът на единиците, които не притежават изследваната черта, е равен на q, тогава p + q = 1.

Вариант на алтернативна характеристика

Специален случай на атрибутивен (неколичествен) признак е алтернативен признак. Когато единиците от съвкупността или имат даден изследван признак, или го нямат. Пример за такива признаци е: наличието на дефектни продукти, академична степен от университетски преподаватели, работа по придобитата специалност, превишаване на средния доход на глава от населението от общоруското им ниво, наличието на деца в семейството и др. .

Ако има алтернативен признак, единицата на населението получава стойност "1". При отсъствие - "0".

Теглата в изчисленията са:

Делът на единиците с тази характеристика;

Делът на единиците, които нямат тази функция

Тогава средната стойност на алтернативната характеристика е равна на:

дисперсията ще приеме формата:

Дисперсията на алтернативната характеристика варира от 0 до 0,25. Максималната стойност от 0,25 достига при 0,5

Пример 4.11. В едно извадково проучване сред 300 жители на Курск, 60 от тях говорят положително за съхраняването на лични спестявания в търговските банки на града.

Определете средното ниво, дисперсията и стандартното отклонение на чертата

Практическото приложение на вариацията на алтернативен признак се състои главно в конструиране на доверителни интервали при провеждане на извадково наблюдение.

Изследване на формата на разпределението на признаците. Основни характеристики на моделите на разпространение

Необходимо условие за успеха на построенията, изчисленията и изводите, базирани на поредицата от вариации, е хомогенността на обобщените в тях агрегати, установена на базата на задълбочен теоретичен анализ.

Ясно изразен ред на промяна на честотата в съответствие с промяна в стойността на даден признак се нарича модел на разпределение.

Познаването на типа на модела на разпределение (и следователно формата на кривата) е необходимо преди всичко:

1. Да се ​​изяснят типичните условия за получаване на първичен статистически материал. По този начин появата на многовърхова или по същество асиметрична крива показва разнообразен състав на популацията и необходимостта от прегрупиране на данните, за да се идентифицират по-хомогенни групи.

2. Да осигури коректността на практическите изчисления и прогнози. По този начин, използването на формулата на Г. Стърджис за изчисляване на оптималния брой групи в интервална серия, правилото "три сигма", коефициента на вариация Vу като индикатор за хомогенност на близки до него разпределения.

Моделите на вариационните серии, които се изразяват във вида на разпределението на техните честоти, ясно се появяват на графиките - хистограмата и полигона на честотното разпределение. Разглеждането им показва, че в хистограмата има голям прекъсване в разпределението, а в полигона има постепенен преход от една група в друга. Многоъгълната полилиния частично изглажда прекъсването на хистограмата; това е по-обобщена техника за анализ на разпределението.

С увеличаване на редовете на интервална вариационна серия и съответно намаляване на стойността на нейните интервали, броят на страните на полигона на разпределение ще се увеличи и прекъснатата линия ще има тенденция да се превърне в определена крива в границата. Тази крива се нарича крива на разпределение... В него се получава най-голямо освобождаване на данни от влиянието на случайни фактори. Той разкрива и показва в най-обобщен вид естеството на вариацията, модела на честотно разпределение в рамките на еднокачествен набор от явления.

Кривите на разпределение могат да бъдат различни видове. В практиката на социално-икономическите изследвания кривата на нормалното разпределение се използва широко. Това е едновърхова симетрична фигура с форма на камбана, чийто десен и ляв клон намаляват равномерно и симетрично, асимптотично приближавайки се към оста на абсцисата.

Отличителна черта на тази крива е съвпадението на средната аритметична стойност, модата и медианата в нея. Ако цялата площ между кривата и оста на абсцисата се приеме за 100%, тогава 68,3% от честотите са в границите, в рамките на 95,4%, в рамките на 99,7% ("правилото на трите сигма").

Въпреки че нормалното или симетрично разпределение съответства на естеството на редица явления, обаче, за социалните явления то е нехарактерно, тъй като отразява различията, причинени от външни влияния, присъщи не на развиваща се, а само на флуктуираща съвкупност от единици. Развитието и динамиката са характерни за социалните явления. Следователно сериите и кривите на разпределението на честотите на социалните явления, като правило, са асиметрични, в тях честотите се увеличават до максимум и намаляват от него неравномерно. Именно наличието на асиметрия или асиметрия в редовете от хомогенни агрегати служи като непряка индикация, че изследваният процес преминава в активна фаза на развитие.

Асиметричните редове и съответните криви имат различни форми на разпределения, изследвани от математическата статистика. Такива форми са разпределението на Поасон, разпределението на Максуел, разпределението на Пиърсън и др. Тук асиметрията се разглежда като цяло като един вид разпределение. В този случай се прави разлика между дясната и лявата асиметрия (изкривяване).

Ако дългият клон на кривата е разположен вдясно от върха, тогава асиметрията се нарича дясностранна, ако този клон е разположен вляво от върха - лява. С дясностранна асиметрия с лява. Следователно, споменатата разлика между тях се нарича коефициент на К. Пиърсън и се използва като коефициент на асиметрия:

При дясностранна асиметрия този коефициент е положителен, при лява - отрицателен. Ако = 0, вариационният ред е симетричен. Колкото по-голяма е абсолютната стойност на коефициента, толкова по-голяма е степента на изкривяване.

Най-точният индикатор за асиметрия на разпределението е коефициентът на асиметрия, изчислен по формулата

където n е броят на единиците в съвкупността. Както в случая с коефициента на Пиърсън, за> 0, има дясностранна асиметрия, за< 0 левосторонняя. В симметричных распределениях = 0.

Колкото по-голяма е стойността на ||, толкова по-асиметрично е разпределението. Установена е следната скала за оценка на асиметрия:

|| - незначителна асиметрия;

0,25 < || - асимметрия заметная (умеренная);

|| > 0,5 - значителна асиметрия.

Тъй като коефициентите и са относителни безразмерни величини, те често се използват за сравнителен анализ на асиметрията на различни редове на разпределение.

Естеството на асиметрията понякога показва посоката на развитие. При изследване на вариацията на признаците, по отношение на които има интерес от увеличаването им (изпълнение на нормите, производствена продукция и др.), дясната асиметрия показва прогресивността на развитието, че тя върви към увеличаване на показателя и лявата асиметрия показва наличието на голям брой изоставащи места.

При изследване на вариацията на признаците, по отношение на които има интерес от намаляването им (разходи, интензивност на труда, потребление на суровини за единица продукция и др.), дясната асиметрия показва недостатъци в развитието на изследвания процес, ляво - за прогресивността на неговото развитие, за това как последното върви в посока на намаляване на индикатора. При разпределението на служителите по стаж (виж пример 4.9 = 5.75) се наблюдава дясностранна асиметрия, тъй като коефициентът на асиметрия е положителен: (5.955-5.75): 2.47 = 0.095. Тази асиметрия е прогресивна за тази серия, тя показва развитието на поредицата в посока нарастване на изследвания показател.

Формата на разпределението може да се определи грубо директно чрез изследване на емпиричните данни на серията, особено ако те са изобразени с хистограма и полигон. За да се уверим, че приблизителното определение на формата на разпределение е правилно, емпиричните данни на серията се изследват за тяхната близост до теоретичното разпределение, което се установява чрез конструиране на съответната крива на разпределение. В много случаи обаче нито теорията, нито прякото разглеждане на емпирични данни дават отговори на въпроса за формата на разпределението. След това обикновено се провежда проучване за близостта на емпиричните данни с нормалното разпределение, тъй като разпределенията с малка или умерена асиметрия в повечето случаи са нормални по своя тип.

За обективна преценка за степента на съответствие на емпиричното разпределение с нормалното в статистиката се използват редица критерии, наречени критерии за съгласие или съответствие.

Те включват критериите на Пиърсън, Романовски, Ястремски, Колмогоров, базирани на използването на различни теоретични концепции.

Например, най-често използваният тест хи-квадрат на Пиърсън се определя по формулата:

къде са емпиричните честоти (честоти)

Теоретични честоти (честоти)

За да се оцени близостта на емпиричното разпределение с теоретичното, се определя вероятността да се постигне тази стойност по този критерий. Ако тази вероятност надвишава 0,05, тогава отклоненията на действителните честоти от теоретичните се считат за случайни, незначителни. Ако обаче отклоненията се считат за значителни и емпиричното разпределение е коренно различно от теоретичното.

За да се характеризира степента на отклонение на симетричното разпределение от нормалното, се изчислява индексът на ексцес. Може да се определи приблизително с помощта на коефициента на Линдберг.

където е делът (в%) от броя на вариантите, лежащи в интервала, равен на наполовинасредното квадратно отклонение (в двете посоки от средната стойност) в общата сума на вариант от тази серия;

38.29 - делът (в%) от броя на опциите, лежащи в интервала, равен на наполовинасредно квадратно отклонение (в една или друга посока на средната стойност) в общата сума на вариант на ред на нормално разпределение

Ексцесът може да бъде положителен, отрицателен или нулев.

За криви с висок връх индексът на ексцес има положителен знак, за криви с нисък връх - отрицателен знак. За крива на нормално разпределение нейната стойност е нула.

За по-точна характеристика на степента на отклонение на симетричното разпределение от нормалното, индексът на пиковост (индекс на ексцес) (Ek) се изчислява по формулата:

Той, подобно на коефициента на Линдберг, може да бъде положителен, отрицателен и равен на нула. Индикаторът за ексцес, подобно на индикатора за асиметрия, е абстрактно число. Граничната стойност на отрицателния ексцес е Ek = -2; величината на положителния ексцес е безкрайна.

Определянето на показателите за асиметрия и ексцес има не само описателно значение, често техните стойности дават определени индикации за по-нататъшно изследване на изследваните явления. Така, например, появата на значителен отрицателен ексцес може да показва качествена хетерогенност на изследваната популация.

Съвременните компютърни технологии разкриват широки възможности за извършване на тромави изчислителни операции за анализ на вариационни редове. Ако материалът е теоретично осмислен и се изтъкне разумна хипотеза за формата на разпределението (последното, между другото, компютрите също могат да проверяват), изчислителните устройства могат бързо да изчисляват различни обобщаващи показатели и критерии, да изграждат графики и т.н. . Това е още по-възможно, тъй като индикаторите за вариация са относително прости и добре формализирани.

Концепция за вариация

Средната дава обобщаваща характеристика на цялата съвкупност от изследваното явление.

Вариация на функциятасе нарича разлика в индивидуалните стойности на даден признак в рамките на изследваната популация.

Средната стойност е абстрактна, обобщаваща характеристика на характеристиката на изследваната съвкупност, но не показва структурата на съвкупността.

Средната стойност не дава представа как индивидуалните стойности на изследваната черта са групирани около средната, дали са концентрирани близо до нея или значително се отклоняват от нея.

Ако индивидуалните стойности на атрибута са близки до средното аритметично, тогава средната стойност представя добре цялата съвкупност. И обратно.

Флуктуацията на индивидуалните стойности се характеризира с индикатори за вариация.

Терминът "вариация" идва от латинското variatio - промяна, колебание, разлика. Въпреки това, не всички различия обикновено се наричат ​​вариации.

Под вариацияв статистиката те означават такива количествени промени в стойността на изследваната черта в рамките на хомогенна популация, които се дължат на пресичащото се влияние на действието на различни фактори. Разграничаване на вариацията на чертата в абсолютни и относителни стойности. Абсолютно - R, L, σ, σ 2.

Индикатори за вариация

1 агрегат 2 агрегат
n = 5 80, 100, 120, 200, 300 n = 8 145, 150, 155, 160, 160, 162, 168, 180

80 100 120 x 200 300

Следователно в този случай става необходимо да се определи вариацията на характеристиката, т.е. съотношението на отделните стойности на серията една спрямо друга.

Индикатори за вариация

1. Диапазонът на вариация е разликата между максималната и минималната стойност на характеристиката.

R = X max - X min

R 1 = 300-80 = 220 R 2 = 180-145 = 35

Практика: за хомогенна популация, за контрол на качеството на продукта.

2. Индикатори, които отчитат отклоненията на всички опции от средноаритметичната стойност.

а) Средно линейно отклонение

б) Стандартно отклонение

Средно линейно отклонениее средноаритметичната стойност на абсолютните стойности на отклоненията на отделните опции от средната.

за негрупирани:

;

за групирани:

практика:той анализира:

1. Състав на служителите

2. Ритъм на производство

3. Еднакво снабдяване с материали

недостатък:този индикатор усложнява изчисленията от вероятен тип, затруднява прилагането на методите на математическата статистика

Средно квадратно отклонение (стандарт)- това е

за негрупирани данни

за групирани данни

За умерено изкривени разпределения

Стандартното отклонение, подобно на стандартното отклонение, е абсолютен индикатор, изразен в същите единици като средноаритметичната стойност.

Показателите за средноквадратичните или стандартните линейни отклонения за две популации се оказват несравними, ако самите характеристики за тези популации не са еднакви. Тези показатели не се сравняват за различни характеристики на една и съща популация. Тези. когато средните стойности и в двете популации са изразени в едни и същи мерни единици и са еднакви, сравнението е възможно и ще отразява разликите в вариацията на чертата.

Стандартното отклонение е мярка за надеждността на средната стойност. Колкото по-малко е σ, толкова по-добре средноаритметичната отразява цялата представена популация.

3. Дисперсияизползва се за измерване на променливостта на даден признак. Този показател по-обективно отразява мярката за вариация

за негрупирани

за групирани

Отличителна черта на този индикатор е, че при квадратурата делът на малките отклонения намалява, а големите се увеличават в общия размер на отклоненията.

Това също е абсолютен показател.

Отклонението има редица свойства, някои от които улесняват изчисляването:

1. Дисперсията на константата е 0

2. Ако всички варианти на стойностите на атрибута (x) ↓ с едно и също число, тогава дисперсията не намалява

3. Ако всички опции ↓ по същия брой пъти (K пъти), тогава дисперсията ↓ по K 2 пъти

х е х "

х 100 пъти

Дисперсията σ е 0,909 * 10000 = 9090

Изчисляването на показателите за вариация за количествените характеристики беше разгледано по-горе, но може да се постави задачата за оценка на вариацията качествени характеристики. Например, когато се изучава качеството на произвежданите продукти, то може да бъде разделено на добро и дефектно.

В този случай говорим за алтернативни функции.

Вариант на алтернативна характеристика

Алтернативни знацисе наричат ​​тези, които някои единици от съвкупността имат, докато други нямат. Например наличието на трудов опит сред кандидатите, академична степен от университетски преподаватели и др. Наличието на признак в единиците на съвкупността условно се обозначава с 1, а отсъствието - 0. x 1 = 1, x 2 = 0. Делът на единиците, които имат признак (в общата съвкупност) се обозначава с p, а делът на единиците, които нямат признак - с q. Тези. p + q = 1, q = 1-p.

Нека изчислим средната стойност на алтернативната характеристика

; ;

Тези. средната стойност на алтернативен признак е равна на дела на единиците с тези характеристики, на дела на единиците, които нямат тези характеристики.

Стандартното отклонение е равно на B p =

Качеството се проверява: 1000 готови продукта, 20 дефектни.

Намерете коефициента на брак: (20/1000) * 100% = 0,02%

Дисперсията има редица свойства, което опростява изчислението.

1. Ако от всички стойности опцията извади някакво постоянно число A, тогава стандартното отклонение от това няма да се промени.

Споделете с приятели или запазете за себе си:

Зареждане...