Varyasyon göstergeleri. Alternatif bir özelliğin varyansının hesaplanması Alternatif bir özelliğin varyansının hesaplandığı bağımlılığa göre

Alternatif bir özelliğin ortalama değeri ve varyansı :

Alternatif özelliğin ortalama değeri

Alternatif bir özelliğin varyansı

Varyans formülünde yer değiştirme Q= 1 - p, şunu elde ederiz:

Böylece, alternatif özellik varyansıürüne eşit birim kesirler, bu özelliğe sahip olan ve bu özelliğe sahip olmayan birimlerin oranı.

Alternatif bir özelliğin standart sapması:

Alternatif bir özelliğin bir varyasyonu, popülasyon birimlerinde incelenen özelliğin varlığından veya yokluğundan oluşur. Nicel olarak, alternatif bir özelliğin varyasyonu iki değerle ifade edilir: bir birimde incelenen özelliğin varlığı bir birim (1) ile ve yokluğu sıfır (0) ile gösterilir. İncelenen özelliğe sahip birimlerin oranı bir harfle ve bu özelliğe sahip olmayan birimlerin kesri - ile gösterilir. p + q = 1 (dolayısıyla q = 1 - p) olduğu ve alternatif özelliğin ortalama değerinin

,

ortalama sapma karesi

Böylece, alternatif bir özelliğin varyansı, bu özelliğe sahip birimlerin kesrinin () bu özelliğe sahip olmayan birimlerin kesrine () eşittir.

Sapmanın (varyansın) ortalama karesi, hisselerin eşitliği durumunda maksimum değeri alır, yani. ne zaman yani ... Bu göstergenin alt sınırı sıfırdır ve bu, toplam varyasyonun olmadığı bir duruma karşılık gelir. Alternatif bir özelliğin standart sapması:

Seçici gözlem, avantajları ve dezavantajları.

Seçici gözlem, tüm popülasyonu karakterize etmek için yeterli miktarda güvenilir veri sağlayan bilimsel olarak geliştirilmiş ilkeler temelinde seçilen, çalışılan popülasyonun birimlerinin bir kısmının incelendiği en modern istatistiksel gözlem türlerinden biridir. bir bütün olarak.

Örnek verilere dayanarak elde edilen ortalama ve göreli göstergeler, bir bütün olarak nüfusun karşılık gelen göstergelerini yeterince tam olarak yeniden üretmelidir.

Seçici gözlemin başlıca avantajları, daha geniş bir programa göre yapılabilmesi, maliyeti açısından daha ucuz olması ve raporlamayı kullanamadığımız durumlarda ve durumlarda organize edilebilmesidir.

Başlıca dezavantajlar, elde edilen verilerin her zaman hata içermesi ve gözlem sonuçlarının yalnızca belirli bir güvenilirlik derecesi ile yargılanabilmesidir. Ayrıca nitelikli personel gerektirir.

Örnek oluşturma yöntemleri.

İstatistikte, araştırmanın amaçlarına göre belirlenen ve çalışma nesnesinin özelliklerine bağlı olan çeşitli örnek kümeleri oluşturma yöntemleri kullanılır.

Örneklem araştırması yapmanın temel koşulu, örnekleme dahil edilecek genel popülasyonun her birimi için fırsat eşitliği ilkesinin ihlalinden kaynaklanan sistematik hataların oluşmasını önlemektir. Sistematik hataların önlenmesi, bilimsel temelli bir örneklem popülasyonu oluşturma yöntemlerinin kullanılması sonucunda elde edilir.

Genel popülasyondan birimleri seçmenin aşağıdaki yolları vardır:

1) bireysel seçim - numunede bireysel birimler seçilir;

2) grup seçimi - niteliksel olarak homojen gruplar veya incelenen birimlerin serileri örneğe girer;

3) Birleşik seçim, bireysel ve grup seçiminin birleşimidir.

Seçim yöntemleri, örnek popülasyonun oluşturulmasına ilişkin kurallar tarafından belirlenir.

Örnek olabilir:

Kesin olarak rastgele, örnek popülasyonun, genel popülasyondan bireysel birimlerin rastgele (kasıtsız) seçiminin bir sonucu olarak oluşması gerçeğinden oluşur. Bu durumda, örneklem popülasyonu için seçilen birimlerin sayısı, genellikle, örneklemin kabul edilen oranı temelinde belirlenir. Numunenin oranı, numune n'deki birim sayısının genel N popülasyonundaki birim sayısına oranıdır, yani.

§ mekanik, örneklemdeki birimlerin seçiminin genel popülasyondan, eşit aralıklara (gruplara) bölünmüş olmasıdır. Ayrıca, genel popülasyondaki aralığın büyüklüğü, örneklem oranının tersine eşittir. Bu nedenle, %2'lik bir örnekle, her 50. birimde bir (1: 0.02), %5'lik bir örnekle, her 20. birimde bir (1: 0.05), vb. seçilir. Böylece, kabul edilen seçim payına göre, genel nüfus, mekanik olarak eşit büyüklükteki gruplara bölünmüştür. Her gruptan sadece bir birim seçilir.

§ tipik - genel nüfusun ilk önce homojen tipik gruplara ayrıldığı. Daha sonra, her bir tipik gruptan, uygun rastgele veya mekanik örnekleme yoluyla, örnek popülasyona ayrı bir birim seçimi yapılır. Tipik numunenin önemli bir özelliği, numunedeki diğer birimleri seçme yöntemlerine kıyasla daha doğru sonuçlar vermesidir;

§ seri - genel nüfusun aynı büyüklükteki gruplara ayrıldığı - seri. Numune için seriler seçilir. Seri içerisinde, seriye dahil olan birimlerin sürekli gözlemi yapılır;

Kombine - örnek iki aşamalı olabilir. Bu durumda, genel nüfus önce gruplara ayrılır. Daha sonra gruplar seçilir ve ikincisi içinde bireysel birimler seçilir.

İstatistikte, bir örnek için aşağıdaki birimleri seçme yöntemleri ayırt edilir:

§ tek aşamalı örnekleme - seçilen her birim, belirli bir kritere göre (uygun rastgele ve seri örnekleme) hemen incelenir;

Çok aşamalı örnekleme - seçim, bireysel grupların genel popülasyonundan yapılır ve gruplardan bireysel birimler seçilir (örnek popülasyonunda birimlerin seçilmesi için mekanik bir yöntemle tipik örnekleme).

Ek olarak, aşağıdakiler arasında bir ayrım yapılır:

§ yeniden seçim - iade edilen top şemasına göre. Ayrıca, örnekleme giren her birim veya seri, genel popülasyona geri döner ve dolayısıyla tekrar örnekleme girme şansına sahiptir;

varyasyon- bunlar, incelenen popülasyonun birimlerindeki özelliğin bireysel değerlerindeki farklılıklardır. Varyasyon çalışması büyük pratik öneme sahiptir ve ekonomik analizde gerekli bir bağlantıdır. Varyasyonu inceleme ihtiyacı, sonuçta ortaya çıkan ortalamanın ana görevini değişen derecelerde doğrulukla yerine getirmesinden kaynaklanmaktadır: ortalaması alınacak özelliğin bireysel değerlerindeki farklılıklar ne kadar küçükse, popülasyon o kadar homojen olur. ve sonuç olarak, ortalama daha doğru ve güvenilir ve bunun tersi de geçerlidir. Sonuç olarak, varyasyon derecesine göre, bir özelliğin varyasyon sınırlarını, bu özellik için popülasyonun homojenliğini, ortalamanın tipikliğini, varyasyonu belirleyen faktörlerin ilişkisini yargılayabilir.

Toplamdaki bir özelliğin varyasyonunu değiştirmek, kullanılarak gerçekleştirilir. mutlak ve göreli göstergeler.

Mutlak varyasyon göstergeleri şunları içerir:

Salıncak varyasyonu (R)

Kaydırma varyasyonu Karakteristiğin maksimum ve minimum değerleri arasındaki fark mı?

İncelenen özellikteki özelliğin değerinin değiştiği sınırları gösterir.

Örnek... Beş başvuranın önceki işteki iş tecrübesi: 2,3,4,7 ve 9 yıldır.
Çözüm: varyasyon aralığı = 9 - 2 = 7 yıl.

Özniteliğin değerlerindeki farklılıkların genelleştirilmiş bir özelliği için, ortalama varyasyon göstergeleri, aritmetik ortalamadan sapmalar dikkate alınarak hesaplanır. Fark, ortalamadan sapma olarak alınır.

Aynı zamanda, bir özelliğin seçeneklerinin ortalamadan sapmalarının toplamından kaçınmak için (ortalamanın sıfır özelliği), sapma işaretlerini hesaba katmamak, yani bunu almak gerekir. toplam modulo veya sapmaları sıfıra kare yapmak için.

Ortalama doğrusal ve standart sapma

Ortalama doğrusal sapma- bu, özelliğin bireysel değerlerinin ortalamadan mutlak sapmalarındandır.

Ortalama doğrusal sapma basittir:

Beş başvuranın önceki işteki iş tecrübesi: 2,3,4,7 ve 9 yıldır.

Örneğimizde: yıllar;

Cevap: 2.4 yıl.

Ağırlıklı ortalama doğrusal sapma gruplandırılmış veriler için geçerlidir:

Konvansiyonu nedeniyle ortalama doğrusal sapma pratikte nispeten nadiren kullanılır (özellikle, teslimatın tekdüzeliği için sözleşmeden doğan yükümlülüklerin yerine getirilmesini karakterize etmek için; üretimin teknolojik özelliklerini dikkate alarak ürün kalitesinin analizinde).

Standart sapma

Varyasyonun en mükemmel özelliği, standart (veya standart sapma) olarak adlandırılan standart sapmadır. (), özelliğin bireysel değerlerinin aşağıdakilerden sapmalarının ortalama karesinin kareköküne eşittir:

Standart sapma basittir:

Gruplandırılmış veriler için ağırlıklı standart sapma kullanılır:

Normal dağılım koşulları altında ortalama kare ve standart doğrusal sapmalar arasında aşağıdaki ilişki gerçekleşir: ~ 1.25.

Varyasyonun ana mutlak ölçüsü olan standart sapma, normal dağılım eğrisinin koordinatlarının değerlerini belirlemek için, numune gözlemini organize etme ve numune özelliklerinin doğruluğunu belirleme ile ilgili hesaplamalarda ve ayrıca değerlendirme yaparken kullanılır. homojen bir popülasyonda bir özelliğin varyasyon sınırları.

Dağılım

Dağılım- özelliğin bireysel değerlerinin ortalamalarından sapmalarının ortalama karesidir.

Varyans basittir:

Örneğimizde:

Ağırlıklı dağılım:

Varyansı aşağıdaki formülle hesaplamak daha uygundur:

basit dönüşümlerle ana olandan elde edilir. Bu durumda, sapmaların ortalama karesi, özellik değerlerinin karelerinin ortalaması eksi ortalamanın karesine eşittir.

Toplu olmayan veriler için:

Gruplandırılmış veriler için:

Alternatif bir özelliğin varyasyonu popülasyon birimlerinde incelenen mülkün varlığından veya yokluğundan oluşur. Nicel olarak, alternatif bir özelliğin varyasyonu iki değerle ifade edilir: bir birimde incelenen özelliğin varlığı bir birim (1) ile ve yokluğu sıfır (0) ile gösterilir. İncelenen özelliğe sahip birimlerin oranı bir harfle ve bu özelliğe sahip olmayan birimlerin kesri - ile gösterilir. p + q = 1 (dolayısıyla q = 1 - p) olduğu ve alternatif özelliğin ortalama değerinin

,

ortalama sapma karesi

Böylece, alternatif bir özelliğin varyansı, bu özelliğe sahip birimlerin kesrinin () bu özelliğe sahip olmayan birimlerin kesrine () eşittir.

Sapmanın (varyansın) ortalama karesi, hisselerin eşitliği durumunda maksimum değeri alır, yani. ne zaman yani ... Bu göstergenin alt sınırı sıfırdır ve bu, toplam varyasyonun olmadığı bir duruma karşılık gelir. Alternatif bir özelliğin standart sapması:

Bu nedenle, üretilen partide ürünlerin% 3'ünün standart dışı olduğu ortaya çıkarsa, standart olmayan ürünlerin payının varyansı ve standart sapma veya% 17,1'dir.

Standart sapmaözelliğin bireysel değerlerinin aritmetik ortalamadan sapmalarının ortalama karesinin kareköküne eşittir.

Göreceli varyasyon oranları

Göreceli varyasyon oranları şunları içerir:

Aynı özellik için birkaç popülasyonun varyasyonunun karşılaştırılması ve daha da fazlası, mutlak göstergeler kullanılarak farklı özellikler için mümkün değildir. Bu durumlarda, fark derecesinin karşılaştırmalı bir değerlendirmesi için, göreli varyasyon göstergeleri oluşturulur. Mutlak varyasyon göstergelerinin ortalamaya oranı olarak hesaplanırlar:

Diğer göreceli özellikler de hesaplanır. Örneğin, asimetrik bir dağılım durumunda değişimi tahmin etmek için ortalama doğrusal sapmanın medyanlara oranı hesaplanır.

çünkü medyanın özelliğinden dolayı, özniteliğin değerinden mutlak sapmalarının toplamı her zaman diğerlerinden daha azdır.

Nüfusun merkezi kısmındaki değişimi tahmin eden göreli bir dağılım ölçüsü olarak, üçüncü (veya üst) çeyrek () ile dörtte birlik (veya üst) çeyrek () arasındaki farkın yarım toplamının ortalama dörtte birlik olduğu, göreceli dörtte birlik sapma hesaplanır. ilk (veya daha düşük) çeyrek ().

Uygulamada, varyasyon katsayısı çoğunlukla hesaplanır. Bu göstergenin alt sınırı sıfırdır, bir üst sınırı yoktur, ancak bir özelliğin varyasyonundaki artışla değerinin de arttığı bilinmektedir. Varyasyon katsayısı bir anlamda popülasyonun homojenliği için bir kriterdir (normal dağılım durumunda).

Aşağıdaki örnek için standart sapmaya göre varyasyon katsayısını hesaplayalım. Birim ürün başına hammadde tüketimi (kg): bir teknoloji için ve diğeri için - at. Standart sapmaların değerinin doğrudan karşılaştırılması, birinci teknoloji için hammadde tüketimindeki değişimin ikincisinden daha yoğun olduğu yanılgısına yol açabilir (. Göreceli varyasyon ölçüsü (karşıt sonucu çıkarmamızı sağlar).

Varyasyon göstergelerinin hesaplanmasına bir örnek

Karmaşık bir projeye katılmak için aday seçme aşamasında, firma profesyoneller için bir yarışma duyurdu. Başvuru sahiplerinin iş tecrübesine göre dağılımı aşağıdaki sonuçları göstermiştir:

Ortalama üretim deneyimini, yılları hesaplayalım

İş deneyim süresine göre varyansı hesaplayalım

Hesaplama için varyansı hesaplamak için farklı bir formül kullanırsak aynı sonuç elde edilir.

Standart sapmayı hesaplayalım, yıllar:

Varyasyon katsayısını belirleyin,%:

Varyans toplama kuralı

Varyasyonu belirleyen faktörlerin etkisini değerlendirmek için bir gruplama tekniği kullanılır: küme, gruplandırma özelliği olarak belirleyici faktörlerden biri seçilerek gruplara ayrılır. Daha sonra, tüm popülasyon için hesaplanan toplam varyans ile birlikte grup içi varyans (veya grubun ortalaması) ve gruplar arası varyans (veya grup ortalamalarının varyansı) hesaplanır.

toplam varyans tüm faktörlerin ve koşulların etkisi altında gelişen tüm kümedeki bir özelliğin varyasyonunu karakterize eder.

gruplar arası varyans gruplandırmanın yapıldığı faktörün etkisinden kaynaklanan sistematik değişimi ölçer:

grup içi varyans Bu çalışmada ele alınmayan diğer faktörlerin etkisine göre gelişen özelliğin varyasyonunu değerlendirir ve gruplama faktöründen bağımsızdır. Grup varyanslarının ortalaması olarak tanımlanır.

Her üç varyans () olarak bilinen aşağıdaki eşitlikle birbiriyle ilişkilidir. varyans toplama kuralı:

bu oran, gruplandırma özniteliğinin genel bir varyasyonun oluşumu üzerindeki etkisini değerlendiren göstergeler oluşturmak için kullanılır. Bunlar, ampirik belirleme katsayısını () ve ampirik korelasyon oranını () içerir.

() gruplar arası varyansın toplam varyans içindeki payını karakterize eder:

ve toplamdaki özelliğin varyasyonunun ne kadar gruplama faktöründen kaynaklandığını gösterir.

ampirik korelasyon ilişkisi(!! \ eta = \ sqrt (\ frac (\ delta ^ 2) (\ sigma ^ 2))

İncelenen ve gruplama özellikleri arasındaki ilişkinin sıkılığını değerlendirir. Limit değerler sıfır ve birdir. Bire ne kadar yakınsa, bağlantı o kadar yakın olur.

Örnek. İyileştirilmiş planlamaya sahip on 17 konut için konut piyasasında 1 metrekarelik toplam alanın (geleneksel birimler) maliyeti:

Aynı zamanda, ilk beş evin iş merkezinin yakınında ve geri kalanının ondan oldukça uzakta inşa edildiği bilinmektedir.

Toplam varyansı hesaplamak için, 1 metrekare M'nin ortalama maliyetini hesaplayalım. toplam alan: Toplam varyans formülle belirlenir :

1 metrekare ortalama maliyeti hesaplayalım. ve şehir merkezine göre konumları farklı olan her bir ev grubu için bu göstergenin varyansı:

a) merkeze yakın inşa edilen evler için:

B) merkezden uzakta inşa edilen evler için:

1 metrekare M maliyetindeki değişiklik. evlerin konumunda bir değişikliğin neden olduğu toplam alan belirlenir gruplar arası varyans:

1 metrekare M maliyetindeki değişiklik. Toplam alanın, dikkate almadığımız kalan göstergelerdeki değişiklik nedeniyle ölçülür grup içi varyans

Bulunan varyanslar toplam varyansa eklenir

Ampirik belirleme katsayısı:

1 metrekare maliyetin varyansının olduğunu gösterir. m. konut piyasasındaki toplam alanın %81,8'i, yeni binaların iş merkezine göre konumlarındaki farklılıklar ve %18,2'si - diğer faktörlerle açıklanmaktadır.

Ampirik korelasyon ilişkisi, konut maliyeti, evlerin yeri üzerinde önemli bir etkiye işaret etmektedir.

Bir kesir için varyans ekleme kuralı işareti şu şekilde yazılır:

ve gruplandırılmış veriler için üç tür hisse varyansı aşağıdaki formüllerle belirlenir:

toplam varyans:

Gruplar arası ve grup içi dağılım formülleri:

Dağıtım şekli özellikleri

Dağılım formu hakkında fikir edinmek için ortalama seviye (,), varyasyon, asimetri ve basıklık göstergeleri kullanılır.

Simetrik dağılımlarda aritmetik ortalama, mod ve medyan çakışır (. Bu eşitlik bozulursa dağılım asimetriktir.

Asimetrinin en basit göstergesi, sağ taraflı asimetri durumunda pozitif ve sol taraflı asimetri durumunda negatif olan farktır.

asimetrik dağılım

Birkaç satırın asimetrisini karşılaştırmak için göreli bir gösterge hesaplanır

Varyasyonlar genelleme özellikleri olarak kullanılır merkezi dağıtım anları-. sıra, özniteliğin bireysel değerlerinin aritmetik ortalamadan sapmalarının yükselme derecesine karşılık gelir:

Gruplandırılmamış veriler için:

Gruplandırılmış veriler için:

Aritmetik ortalamanın özelliğine göre birinci mertebenin momenti sıfıra eşittir.

İkinci dereceden moment varyanstır.

Üçüncü ve dördüncü derecelerin anları, ampirik dağılımların şeklinin özelliklerini değerlendiren göstergeler oluşturmak için kullanılır.

Üçüncü dereceden moment kullanılarak dağılımın çarpıklık veya asimetri derecesi ölçülür.

- asimetri katsayısı

Simetrik dağılımlarda, tek sıralı tüm merkezi momentler gibi, üçüncü dereceden sıfır olmayan merkezi moment, dağılımın asimetrisini gösterir. Bu durumda, eğer asimetri sağ taraflıysa ve sağ dal maksimum ordinata göre uzarsa; eğer, o zaman asimetri sol taraflıdır (grafikte bu, sol dalın uzamasına karşılık gelir).

Dağılımın sivriliğini veya düzlüğünü karakterize etmek için, dördüncü dereceden torkun () dördüncü güçteki () standart sapmaya oranı hesaplanır. Normal bir dağılım için basıklık şu formülle bulunur:

Normal dağılım için kaybolur. Tepeli dağılımlar için, düz tepeli olanlar için.

dağıtım basıklığı

Yukarıda ele alınan göstergelere ek olarak, homojen bir popülasyondaki varyasyonun genelleştirici bir özelliği, incelenen özniteliğin değerindeki değişikliklere göre dağılım sıklıklarındaki değişimin belirli bir sırasıdır. dağıtım modeli.

Dağılım modelinin doğası (tipi), büyük miktarda gözleme dayanan bir varyasyon serisinin yanı sıra, modelin en çok olabileceği grup sayısı ve integrallerin değeri gibi bir seçim yaparak tanımlanabilir. açıkça tezahür etti.

Varyasyon dizisinin analizi, dağılımın doğasının belirlenmesini (varyasyon mekanizmasının bir sonucu olarak), dağıtım fonksiyonunun oluşturulmasını, ampirik dağılımın teorik olana uygunluğunun kontrol edilmesini içerir.

ampirik dağılım gözlem verilerine dayanarak elde edilen , bir çokgen kullanılarak ampirik dağılım eğrisi ile grafiksel olarak gösterilir.

Uygulamada, aralarında simetrik ve asimetrik, tek tepe ve çok tepe arasında ayrım yapılabilen çeşitli dağılım türleri vardır.

Dağıtım türünü belirlemek, bir modelin oluşum mekanizmasını analitik bir biçimde ifade etmek anlamına gelir. Birçok fenomen ve özellikleri, karşılık gelen eğrilerle yaklaşık olarak elde edilen karakteristik dağılım biçimleriyle karakterize edilir. Tüm dağılım biçimleriyle birlikte, teorik olarak en yaygın olanları normal dağılım, Pausson dağılımı, binom dağılımı vb.

Varyasyon çalışmasında özel bir yer, matematiksel özelliklerinden dolayı normal yasaya aittir. Normal yasa için, bir özelliğin bireysel değerlerinin varyasyonunun ortalama değerinden aralığında olduğuna göre üç sigma kuralı yerine getirilir. Aynı zamanda, tüm birimlerin yaklaşık %70'i sınırlar içinde ve %95'i sınırlar içindedir.

Ampirik ve teorik dağılımların uygunluk değerlendirmesi, aralarında Pearson's, Romanovsky's, Yastremsky's, Kolmogorov's kriterlerinin yaygın olarak bilindiği uyum iyiliği kriterleri kullanılarak gerçekleştirilir.

VARYASYON GÖSTERGELERİ

Problemleri çözmek için metodik talimatlar

"Varyasyon göstergeleri" konusunda

Bir özelliğin varyasyon derecesini (değişkenliği) ölçmek için, göstergeleri: varyasyon aralığı, ortalama doğrusal sapma, standart sapma, ortalama sapma karesi (varyans), varyasyon katsayısı olan varyasyon kullanılır. .

Kaydırma varyasyonu

Varyasyon aralığı ( r) özelliğin bireysel değerlerinin (veya varyantlarının) varyasyon (değişim) sınırlarını karakterize eder ( x) istatistiksel popülasyonda

özelliğin en büyük ve en küçük değeri nerede.

Ortalama doğrusal sapma

Ortalama doğrusal sapma, aritmetik ortalama formülleri kullanılarak hesaplanır:

Basit (ağırlıksız)

,

nerede - ben-th özellik değeri x ;

Özelliğin ortalama değeri x ;

istatistiksel ağırlık ben-th nitelik değeri;

n- nüfusun üye sayısı;

Ağırlıklı

Standart sapma

Standart sapma aşağıdaki formüller kullanılarak hesaplanır:

ağırlıksız

Ağırlıklı

Nicel bir özelliğin dağılımı

Dağılım nicel nitelik, aritmetik ortalama formülleriyle belirlenir:

ağırlıksız

Ağırlıklı

Varyans aşağıdaki gibi hesaplanabilir:

özelliğin değerlerinin ortalama karesi nerede;

Özelliğin ortalama değerinin karesi.

Nicel bir özelliğin varyans özellikleri

1. Değişen özniteliğin ağırlıklarında (sıklıklarında) bir azalma veya artış ile K varyans değişmediği için

2. Her bir öznitelik değerini aynı sabit değerle azaltırken veya arttırırken A varyans değişmez

nerede özelliğin ortalama değeridir ( x- A).

3. Her bir öznitelik değerini aynı sayıda azaltırken veya arttırırken K varyansın azaldığı veya arttığı zamanlar K 2 kez ve standart sapma - K bir Zamanlar



özelliğin ortalama değeri nerede xK.

4. Bir özelliğin keyfi bir değere göre dağılımı A her zaman ortalama ve keyfi bir değer arasındaki farkın karesi başına aritmetik ortalamaya göre varyanstan daha büyüktür

Kanıt:

Ortalamaya göre dağılım

Moment yöntemiyle varyansı hesaplama

Basitleştirilmiş varyans hesaplama yöntemi, formüle göre gerçekleştirilir.

ve anların yolu olarak adlandırılır.

göstergeler m 1 , m 2, birinci ve ikinci dereceden anları temsil eder ve aşağıdaki gibi hesaplanır

Kanıt:

Toplamda nicel bir özelliğin dağılımı,

Gruplara ayrılmış

Gruplara ayrılmış istatistiksel bir popülasyondaki nicel özelliklerin ilişkilerini analiz etmek için şu varyanslar hesaplanır: grup, grup içi, grup içi ve toplam.

Grup varyansı (kısmi), gruplamanın altında yatan özellik (gruplama özelliği) hariç, diğer tüm faktörlerin etkisi nedeniyle bir gruptaki bir özelliğin varyasyonunu karakterize eder:

nerede - benözelliğin -th değeri J-th grup;

içindeki bir özelliğin özel (grup) ortalama değeri J-th grup;

istatistiksel ağırlık ben-th öznitelik değeri J-th grup;

Farklı karakteristik değerlerin sayısı J grup.

Gruplar arası varyans, gruplandırmanın (gruplama özelliği) altında yatan faktör nedeniyle tüm istatistiksel popülasyondaki bir özelliğin değişkenlik (varyasyon) derecesini ölçer:

toplamdaki özelliğin ortalama değeri nerede (toplam ortalama);

Ağırlık J-th grubu, birim sayısını temsil eder J NS

J- istatistiksel popülasyondaki grupların sayısı.

Grup içi varyans (grup varyanslarının ortalaması), gruplama özelliği hariç diğer tüm faktörlerin (özellikler) üzerindeki etkisinden dolayı bir özelliğin bir bütün olarak popülasyondaki değişkenlik derecesini ölçer:

Toplam varyans, üzerinde etkili olan tüm faktörlerin etkisi nedeniyle bir özelliğin değişkenlik derecesini ölçer:

Gruplara ayrılmış bir istatistiksel popülasyondaki bir özelliğin toplam varyansı, temel dağılım formülü ile belirlenebilir.

Gruplar arası ve toplam varyans, gruplara ayrılan toplamdaki göstergelerin ilişkisinin yakınlığının göstergelerini belirlemek için kullanılır.

Niteliksel bir alternatif özelliğin varyansı

Alternatif bir özelliğin varyansını belirlemek için popülasyon birimlerinin toplam sayısının şuna eşit olduğunu varsayalım. n... İncelenen özelliğe sahip birimlerin sayısı - F, o zaman incelenen özelliğe sahip olmayan birimlerin sayısı eşittir ( n- F). Nitel (alternatif) bir özelliğin dağılım serisi aşağıdaki gibidir

değişken değer tekrarlama oranı
F n-F
Toplam n

Böyle bir serinin aritmetik ortalaması:

yani, incelenen özelliğin görünümünün göreli sıklığına (sıklığına) eşittir, bu şu şekilde gösterilebilir: P, sonra

İncelenen özelliğe sahip birimlerin oranı eşittir P, incelenen özelliğe sahip olmayan birimlerin oranı Q, sonra p + q = 1.

Alternatif bir özelliğin varyansı

Niteliksel (nicel olmayan) bir özelliğin özel bir durumu, alternatif bir özelliktir. Popülasyon birimlerinin belirli bir incelenen özniteliğe sahip olması veya buna sahip olmaması. Bu tür işaretlere bir örnek: kusurlu ürünlerin varlığı, üniversite öğretmenlerinden akademik bir derece, alınan uzmanlıkta çalışma, tüm Rusya seviyelerinin kişi başına düşen ortalama gelirinin fazlalığı, ailede çocukların varlığı vb. .

Alternatif bir özellik varsa, popülasyon birimine "1" değeri atanır. Yokluğunda - "0".

Hesaplamalardaki ağırlıklar:

Bu özelliğe sahip birimlerin oranı;

Bu özelliğe sahip olmayan birimlerin oranı

O zaman alternatif özelliğin ortalama değeri şuna eşittir:

varyans şu şekilde olacaktır:

Alternatif özelliğin varyansı 0 ile 0.25 arasında değişmektedir. 0,25'in maksimum değeri 0,5'e ulaşır

Örnek 4.11. 300 Kursk sakini ile yapılan örnek bir ankette, 60'ı kişisel tasarrufların şehrin ticari bankalarında tutulması hakkında olumlu konuştu.

Özelliğin ortalama seviyesini, varyansını ve standart sapmasını belirleyin

Alternatif bir özelliğin varyasyonunun pratik uygulaması, temel olarak bir örnek gözlem yapılırken güven aralıklarının oluşturulmasından oluşur.

Özellik dağılımının şeklinin incelenmesi. Dağıtım modellerinin ana özellikleri

Varyasyonlar dizisine dayanan yapıların, hesaplamaların ve sonuçların başarısı için vazgeçilmez bir koşul, derin teorik analiz temelinde oluşturulan, içlerinde özetlenen toplamların homojenliğidir.

Bir özelliğin değerindeki bir değişikliğe göre açıkça ifade edilen bir frekans değişikliği sırasına dağılım modeli denir.

Her şeyden önce, dağılım modelinin türü (ve dolayısıyla eğrinin şekli) bilgisi gereklidir:

1. Birincil istatistiksel materyal elde etmek için tipik koşulları netleştirmek. Bu nedenle, çok köşeli veya büyük ölçüde asimetrik bir eğrinin görünümü, popülasyonun farklı bir bileşimini ve daha homojen grupları tanımlamak için verileri yeniden gruplandırma ihtiyacını gösterir.

2. Pratik hesaplamaların ve tahminlerin doğruluğunu sağlamak. Böylece, bir aralık serisindeki optimal grup sayısını hesaplamak için G. Sturgess formülünün kullanılması, "üç sigma" kuralı, ona yakın dağılımların homojenliğinin bir göstergesi olarak Vу varyasyon katsayısı.

Frekanslarının dağılım türünde ifade edilen varyasyon serisinin kalıpları, grafiklerde açıkça görülmektedir - histogram ve frekans dağılım poligonu. Dikkatleri, histogramda dağılımda büyük bir süreksizlik olduğunu ve çokgende bir gruptan diğerine kademeli bir geçiş olduğunu göstermektedir. Çokgen çoklu çizgi, histogramın süreksizliğini kısmen düzeltir; dağılımı analiz etmek için daha genelleştirilmiş bir tekniktir.

Bir aralık varyasyon serisinin satırlarında bir artış ve aralıklarının değerinde buna karşılık gelen bir azalma ile, dağıtım poligonunun kenar sayısı artacak ve kesikli çizgi, limitte belirli bir eğriye dönüşme eğiliminde olacaktır. Bu eğri denir dağıtım eğrisi... İçinde, rastgele faktörlerin etkisinden en büyük veri salınımı meydana gelir. Varyasyonun doğasını, tek-kaliteli bir olgular kümesi içindeki frekans dağılımı modelini en genelleştirilmiş biçimde ortaya koyar ve gösterir.

Dağılım eğrileri farklı tiplerde olabilir. Sosyo-ekonomik araştırma pratiğinde normal dağılım eğrisi yaygın olarak kullanılmaktadır. Sağ ve sol dalları düzgün ve simetrik olarak azalan, asimptotik olarak apsis eksenine yaklaşan, tek tepe simetrik çan şeklinde bir figürdür.

Bu eğrinin ayırt edici bir özelliği, içindeki aritmetik ortalama, mod ve medyanın çakışmasıdır. Eğri ile apsis arasındaki alanın tamamı %100 alınırsa, frekansların %68,3'ü sınırlar içinde, %95,4'ü içinde, %99,7'si ("üç sigma kuralı") içindedir.

Normal veya simetrik dağılım, bir dizi fenomenin doğasına karşılık gelse de, sosyal fenomenler için karakteristik değildir, çünkü dış etkilerin neden olduğu farklılıkları yansıtır, gelişmekte olan bir durumda değil, yalnızca dalgalı bir dizide doğar. birimler. Gelişim ve dinamizm, sosyal fenomenlerin karakteristiğidir. Bu nedenle, sosyal fenomenlerin frekanslarının dağılımının serileri ve eğrileri, kural olarak, asimetriktir, içlerinde frekanslar maksimuma çıkar ve ondan eşit olmayan bir şekilde azalır. İncelenmekte olan sürecin aktif bir gelişim aşamasından geçtiğinin dolaylı bir göstergesi olarak hizmet eden homojen agrega sıralarında asimetri veya çarpıklığın varlığıdır.

Asimetrik seriler ve karşılık gelen eğriler, matematiksel istatistiklerle incelenen farklı dağılım biçimlerine sahiptir. Bu tür formlar Poisson dağılımı, Maxwell dağılımı, Pearson dağılımı vb.'dir. Burada asimetri bir bütün olarak tek bir dağılım türü olarak kabul edilir. Bu durumda sağ ve sol asimetriler (çarpıklık) arasında bir ayrım yapılır.

Eğrinin uzun dalı tepe noktasının sağında bulunuyorsa, bu dal tepe noktasının solundaysa - sol taraflıysa asimetri sağ taraflı olarak adlandırılır. Sol taraflı sağ taraflı asimetri ile. Bu nedenle, aralarında atıfta bulunulan farka K. Pearson katsayısı denir ve asimetri katsayısı olarak kullanılır:

Sağ taraflı asimetri ile bu katsayı, sol taraflı - negatif ile pozitiftir. = 0 ise, varyasyon serisi simetriktir. Katsayının mutlak değeri ne kadar büyük olursa, çarpıklık derecesi de o kadar büyük olur.

Dağılım çarpıklığının en doğru göstergesi formülle hesaplanan çarpıklık katsayısıdır.

burada n, popülasyondaki birim sayısıdır. Pearson katsayısı durumunda olduğu gibi, > 0 için sağ taraflı bir asimetri vardır, çünkü< 0 левосторонняя. В симметричных распределениях = 0.

|| değeri ne kadar büyükse, dağılım o kadar asimetriktir. Asimetri için aşağıdaki derecelendirme ölçeği oluşturulmuştur:

|| - önemsiz asimetri;

0,25 < || - асимметрия заметная (умеренная);

|| > 0,5 - önemli asimetri.

Katsayılar ve göreceli boyutsuz nicelikler olduğundan, genellikle farklı dağılım serilerinin asimetrisinin karşılaştırmalı analizi için kullanılırlar.

Asimetrinin doğası bazen gelişme yönünü gösterir. Onları artırmaya ilgi duyulan işaretlerin çeşitliliğini incelerken (normların yerine getirilmesi, üretim çıktısı vb.), Sağ taraflı asimetri, gelişimin ilerlemesini, göstergede bir artışa doğru gittiğini gösterir ve sol taraflı asimetri, çok sayıda gecikmeli sitenin varlığını gösterir.

Onları azaltmaya ilgi duyulan işaretlerin varyasyonunu incelerken (maliyet, emek yoğunluğu, üretim birimi başına hammadde tüketimi, vb.), Sağ taraflı asimetri, çalışılan sürecin gelişimindeki eksiklikleri gösterir, sol taraflı - gelişiminin ilerlemesi hakkında, ikincisinin göstergeyi azaltma yönünde nasıl gittiği hakkında. Çalışanların kıdeme göre dağılımında (bkz. örnek 4.9 = 5.75), asimetri katsayısı pozitif olduğu için sağ taraflı asimetri görülmektedir: (5.955-5.75): 2.47 = 0.095. Bu asimetri bu seri için ilerleyicidir, incelenen göstergede bir artışa doğru serinin gelişimini gösterir.

Dağılımın şekli, özellikle bir histogram ve bir çokgen ile gösteriliyorsa, serilerin ampirik verileri incelenerek kabaca doğrudan belirlenebilir. Dağılım şeklinin yaklaşık tanımının doğru olduğundan emin olmak için, serilerin ampirik verileri, karşılık gelen dağılım eğrisi oluşturularak oluşturulan teorik dağılıma yakınlıkları açısından incelenir. Bununla birlikte, çoğu durumda, ne teori ne de ampirik verilerin doğrudan değerlendirilmesi, dağılımın şekli hakkındaki soruya cevap vermez. Daha sonra, çoğu durumda küçük veya orta asimetriye sahip dağılımlar, türlerine göre normal olduğundan, genellikle ampirik verilerin normal dağılıma yakınlığı üzerine bir çalışma yapılır.

İstatistikte ampirik dağılımın normale uygunluk derecesi hakkında nesnel bir yargı için, anlaşma veya uygunluk kriterleri adı verilen bir dizi kriter kullanılır.

Bunlar, çeşitli teorik kavramların kullanımına dayanan Pearson, Romanovsky, Yastremsky, Kolmogorov kriterlerini içerir.

Örneğin, en yaygın olarak kullanılan Pearson ki-kare testi şu formülle belirlenir:

ampirik frekanslar (frekanslar) nerede

Teorik frekanslar (frekanslar)

Ampirik dağılımın teorik olana yakınlığını değerlendirmek için bu kritere göre bu değere ulaşma olasılığı belirlenir. Bu olasılık 0,05'i aşarsa, gerçek frekansların teorik olanlardan sapmaları rastgele, önemsiz olarak kabul edilir. Bununla birlikte, sapmalar önemli kabul edilirse ve ampirik dağılım teorik olandan temel olarak farklıdır.

Simetrik dağılımın normalden sapma derecesini karakterize etmek için basıklık indeksi hesaplanır. Lindbergh katsayısı kullanılarak yaklaşık olarak belirlenebilir.

eşit aralıkta yer alan değişken sayısının payı (% olarak) nerede yarım bu serinin bir varyantının toplam miktarındaki ortalama kare sapma (ortalama değerden her iki yönde);

38.29 - eşit aralıkta yer alan seçenek sayısının payı (% olarak) yarım normal dağılım serisinin bir varyantının toplam miktarındaki ortalama kare sapma (ortalama değerin şu veya bu yönünde)

Kurtosis pozitif, negatif veya sıfır olabilir.

Yüksek tepe eğrileri için basıklık endeksi pozitif bir işarete, düşük tepe eğrileri için negatif bir işarete sahiptir. Normal dağılım eğrisi için değeri sıfırdır.

Simetrik dağılımın normalden sapma derecesinin daha doğru bir karakterizasyonu için, tepe noktası indeksi (basıklık indeksi) (Ek) aşağıdaki formülle hesaplanır:

Lindbergh katsayısı gibi pozitif, negatif ve sıfıra eşit olabilir. Asimetri göstergesi gibi basıklık göstergesi de soyut bir sayıdır. Negatif basıklığın sınırlayıcı değeri Ek = -2'dir; pozitif basıklığın büyüklüğü sonsuzdur.

Asimetri ve basıklık göstergelerinin belirlenmesi sadece tanımlayıcı bir anlama sahip değildir, çoğu zaman değerleri, incelenen fenomenlerin daha fazla araştırılması için belirli göstergeler verir. Bu nedenle, örneğin, önemli bir negatif basıklığın ortaya çıkması, çalışılan popülasyonun niteliksel bir heterojenliğini gösterebilir.

Modern bilgisayar teknolojileri, varyasyon serilerinin analizi için hantal hesaplama işlemleri gerçekleştirmek için geniş fırsatlar sunar. Materyal teorik olarak anlaşılırsa ve dağılımın şekli hakkında makul bir hipotez ortaya konulursa (ikincisi, bu arada, bilgisayarlar da kontrol edebilir), bilgi işlem cihazları çeşitli genelleştirici göstergeleri ve kriterleri hızlı bir şekilde hesaplayabilir, grafikler oluşturabilir, vb. . Varyasyon göstergeleri nispeten basit ve iyi biçimlendirilmiş olduğundan, bu daha da mümkündür.

Varyasyon kavramı

Ortalama, incelenen fenomenin tüm setinin genelleştirici bir özelliğini verir.

Özelliğin varyasyonu incelenen popülasyondaki bir özelliğin bireysel değerlerindeki fark olarak adlandırılır.

Ortalama değer, çalışılan popülasyonun karakteristiğinin soyut, genelleştirici bir özelliğidir, ancak popülasyonun yapısını göstermez.

Ortalama değer, incelenen özelliğin bireysel değerlerinin, ortalamaya yakın veya ondan önemli ölçüde sapmış olup olmadıklarına bakılmaksızın, ortalama etrafında nasıl gruplandırıldığı hakkında bir fikir vermez.

Özelliğin bireysel değerleri aritmetik ortalamaya yakınsa, bu durumda ortalama tüm popülasyonu iyi temsil eder. Ve tam tersi.

Bireysel değerlerin dalgalanması ile karakterize edilir değişkenlik göstergeleri.

"Varyasyon" terimi, Latin varyasyonundan gelir - değişim, dalgalanma, farklılık. Ancak, tüm farklılıklar genellikle varyasyon olarak adlandırılmaz.

varyasyon altında istatistikte, çeşitli faktörlerin etkisinin kesişen etkisinden kaynaklanan, homojen bir popülasyon içinde incelenen özelliğin değerindeki bu tür nicel değişiklikler anlamına gelir. Özelliğin varyasyonunu mutlak ve göreli değerlerde ayırt edin. Mutlak - R, L, σ, σ 2.

Varyasyon göstergeleri

1 toplam 2 agrega
n = 5 80, 100, 120, 200, 300 n = 8 145, 150, 155, 160, 160, 162, 168, 180

80 100 120 x 200 300

Bu nedenle, bu durumda özelliğin varyasyonunu belirlemek, yani. serinin bireysel değerlerinin birbirine göre oranı.

Varyasyon göstergeleri

1. Varyasyon aralığı, özelliğin maksimum ve minimum değeri arasındaki farktır.

R = X maks - X dak

R 1 = 300-80 = 220 R 2 = 180-145 = 35

Alıştırma: homojen bir popülasyon için, ürün kalite kontrolü için.

2. Tüm seçeneklerin aritmetik ortalamadan sapmalarını hesaba katan göstergeler.

a) Ortalama doğrusal sapma

b) Standart sapma

Ortalama doğrusal sapma bireysel seçeneklerin ortalamadan sapmalarının mutlak değerlerinin aritmetik ortalamasıdır.

gruplandırılmamış için:

;

gruplandırılmış için:

Uygulama: analiz eder:

1. Çalışanların bileşimi

2. Üretim ritmi

3. Tek tip malzeme temini

kusur: bu gösterge olası türdeki hesaplamaları karmaşıklaştırır, matematiksel istatistik yöntemlerini uygulamayı zorlaştırır

Ortalama kare sapma (standart)- bu

gruplanmamış veriler için

gruplandırılmış veriler için

Orta derecede çarpık dağılımlar için

Standart sapma, standart sapma gibi, aritmetik ortalama ile aynı birimlerde ifade edilen mutlak bir göstergedir.

İki popülasyon için ortalama karekök veya standart doğrusal sapmaların göstergeleri, bu popülasyonlar için özelliklerin kendileri aynı değilse, karşılaştırılamaz hale gelir. Bu göstergeler aynı popülasyonun farklı özellikleri için karşılaştırılmaz. Onlar. her iki popülasyondaki ortalamalar aynı ölçü birimlerinde ifade edildiğinde ve aynı olduğunda, karşılaştırma mümkündür ve özelliğin varyasyonundaki farklılıkları yansıtacaktır.

Standart sapma, ortalamanın güvenilirliğinin bir ölçüsüdür. σ ne kadar küçükse, aritmetik ortalama temsil edilen popülasyonun tamamını o kadar iyi yansıtır.

3. Dağılım Bir özelliğin değişkenliğini ölçmek için kullanılır. Bu gösterge, varyasyon ölçüsünü daha nesnel olarak yansıtır

gruplandırılmadığı için

gruplandırılmış için

Bu göstergenin ayırt edici bir özelliği, kare alındığında, küçük sapmaların oranının düşmesi ve büyük sapmaların toplam sapma miktarında artmasıdır.

Bu aynı zamanda mutlak bir göstergedir.

Varyans, bazılarının hesaplanmasını kolaylaştıran bir dizi özelliğe sahiptir:

1. Sabitin varyansı 0'dır

2. (x) ↓ özniteliğinin değerlerinin tüm varyantları aynı sayıdaysa, varyans azalmaz

3. Tüm seçenekler ↓ aynı sayıda (K kez) ise, o zaman varyans ↓ K 2 kez

x F x "

x 100 kez

σ varyansı 0.909 * 10000 = 9090'dır

Niceliksel özellikler için varyasyon göstergelerinin hesaplanması yukarıda ele alındı, ancak varyasyonu değerlendirme görevi verilebilir. niteliksel özellikler. Örneğin, üretilen ürünlerin kalitesini incelerken, iyi ve kusurlu olarak ayrılabilir.

Bu durumda, alternatif özelliklerden bahsediyoruz.

Alternatif bir özelliğin varyansı

alternatif işaretler Toplamın bazı birimlerinin sahip olduğu, diğerlerinin sahip olmadığı birimlere denir. Örneğin, başvuru sahipleri arasında iş deneyiminin mevcudiyeti, üniversite profesörlerinden akademik derece vb. Popülasyon birimlerinde bir özelliğin varlığı geleneksel olarak 1 ile ve yokluğu - 0 ile gösterilir. x 1 = 1, x 2 = 0. Özelliği olan birimlerin payı (toplam nüfus içinde) p ile, özelliği olmayan birimlerin payı - q ile gösterilir. Onlar. p + q = 1, q = 1-p.

Alternatif özelliğin ortalama değerini hesaplayalım

; ;

Onlar. alternatif bir özelliğin ortalama değeri, bu özelliklere sahip birimlerin oranına, bu özelliklere sahip olmayan birimlerin oranına eşittir.

Standart sapma eşittir B p =

Kalite kontrol edilir: 1000 bitmiş ürün, 20 kusurlu ürün.

Evlilik oranını bulun: (20/1000) * %100 = %0,02

Dispersiyonun bir takım özellikleri vardır, bu hesaplamayı basitleştirir.

1. Seçenek, tüm değerlerden bazı sabit A sayısını çıkarırsa, bundan standart sapma değişmez.

Arkadaşlarınızla paylaşın veya kendiniz için kaydedin:

Yükleniyor...