Üstel dağılım için medyan nasıl hesaplanır. İstatistiksel analiz gerçekleştirmek için excel'de medyan işlevi

Üçgenin medyanı ve yüksekliği, tüm üçgeni, kenarlarının ve açılarının değerini belirleyen grafiksel bir parametre görevi görür. Üç değer: medyanlar, yükseklikler ve bisektörler - bu bir ürün üzerindeki barkod gibidir, bizim görevimiz basitçe onu okuyabilmektir.

Tanım

Medyan, karşı tarafın yüksekliğini ve orta noktasını birleştiren doğru parçasıdır. Üçgenin üç köşesi vardır, bu da üç medyan olduğu anlamına gelir. Medyanlar her zaman yükseklik veya açıortaylarla çakışmaz. Çoğu zaman bunlar ayrı bölümlerdir.

ortanca özellikler

  • Tabana çizilen bir ikizkenar üçgenin medyanı, yükseklik ve açıortayı ile çakışır. V eşkenar üçgen tüm medyanlar açıortaylar ve yüksekliklerle örtüşür.
  • Üçgenin tüm medyanları bir noktada kesişir.
  • Ortanca, bir üçgeni iki eşit üçgene ve üç medyanı 6 eşit üçgene böler.

Alanları birbirine eşit olan üçgenlere eş alan üçgenleri denir.

Pirinç. 1. Üç medyan 6 eşit üçgen oluşturur.

  • Medyanların kesişme noktası, onları üstten sayarak 2: 1 oranında böler.
  • Dik açılı bir üçgenin hipotenüsüne çizilen medyan, hipotenüsün yarısıdır.

Görevler

Tüm bu özelliklerin hatırlanması kolaydır, pratikte kolayca sabitlenirler. Konunun daha iyi anlaşılması için birkaç sorunu çözeceğiz:

  • V sağ üçgen a = 3 ve b = 4'e eşit olan bacaklar bilinmektedir. C hipotenüsüne çizilen medyan m'nin değerini bulun.

Pirinç. 2. Problem için çizim.

Ortancanın değerini bulmak için hipotenüsü bulmamız gerekir, çünkü hipotenüse çizilen medyan, bunun yarısına eşittir. Pisagor teoremi aracılığıyla hipotenüs: $$ a ^ 2 + b ^ 2 = c ^ 2 $$

$$ c = \ sqrt (a ^ 2 + b ^ 2) = \ sqrt (9 + 16) = \ sqrt (25) = 5 $$

Medyan değerini bulalım: $$ m = (c \ over2) = (5 \ over2) = 2.5 $$ - ortaya çıkan sayı medyan değerdir.

Üçgendeki ortanca değerler eşit değildir. Bu nedenle, tam olarak hangi değeri bulmanız gerektiğini hayal etmek zorunludur.

  • Üçgende kenarların değerleri bilinmektedir: a = 7; b = 8; c = 9. b tarafına doğru medyanın değerini bulun.

Pirinç. 3. Problem için çizim.

Bu sorunu çözmek için, üçgenin kenarları boyunca medyanı bulmak için üç formülden birini kullanmanız gerekir:

$$ m ^ 2 = (1 \ üzeri2) * (a ^ 2 + c ^ 2-b ^ 2) $$

Gördüğünüz gibi, burada asıl mesele parantez içindeki katsayıları ve yan değerlerin işaretlerini hatırlamaktır. İşaretler, hatırlaması en kolay olanlardır - medyanın indirildiği taraf her zaman çıkarılır. Bizim durumumuzda, bu b'dir, ancak başka herhangi biri olabilir.

Değerleri formülde yerine koyun ve medyan değeri bulun: $$ m = \ sqrt ((1 \ over2) * (a ^ 2 + c ^ 2-b ^ 2)) $$

$$ m = \ sqrt ((1 \ over2) * (49 + 81-64)) = \ sqrt (33) $$ - sonucu bir kök olarak bırakalım.

  • Bir ikizkenar üçgende, tabana çizilen ortanca 8'dir ve tabanın kendisi 6'dır. Bu ortanca, kalan iki üçgenle birlikte üçgeni 6 üçgene böler. Her birinin alanını bulun.

Medyanlar üçgeni altı eşit alana böler. Bu, küçük üçgenlerin alanlarının birbirine eşit olacağı anlamına gelir. Büyük olanın alanını bulup 6'ya bölmek yeterlidir.

Bir ikizkenar üçgende tabana çizilen medyan verildiğinde, açıortay ve yüksekliktir. Bu, üçgende taban ve yüksekliğin bilindiği anlamına gelir. Bölgeyi bulabilirsiniz.

$$ S = (1 \ üzeri2) * 6 * 8 = 24 $$

Küçük üçgenlerin her birinin alanı: $$ (24\over6) = 4 $$

Ne öğrendik?

Medyanın ne olduğunu öğrendik. Medyanın özelliklerini belirledik ve tipik problemlere bir çözüm bulduk. Temel hatalardan bahsettik ve bir üçgenin kenarlarından medyanı bulma formülünü nasıl kolay ve hızlı bir şekilde ezberleyeceğimizi bulduk.

Konuya göre test edin

Makale değerlendirmesi

Ortalama puanı: 4.7. Alınan toplam puan: 87.

Not... V bu ders Bir üçgenin medyanı hakkında geometride problemler ortaya koyar. Burada olmayan bir geometri problemini çözmeniz gerekiyorsa, forumda bunun hakkında yazın. Kurs neredeyse kesinlikle tamamlanacak.

Görev... Kenarlarından geçen bir üçgenin medyanının uzunluğunu bulun

Üçgenin kenarları 8, 9 ve 13 santimetre uzunluğundadır. Ortanca, üçgenin en büyük tarafına çizilir. Kenarlarının boyutlarına göre üçgenin medyanını belirleyin.

Çözüm.

Sorunu çözmenin iki yolu vardır. Öğretmenlerin sevmediği ilk kişi lise ama en çok yönlü olanıdır.

Yöntem 1.

Ortancanın karesinin, medyanın çizildiği kenarın karesinin çıkarıldığı kenarların ikiye katlanmış karelerinin toplamının dörtte birine eşit olduğunu söyleyen Stewart Teoremini uyguluyoruz.

M c 2 = (2a 2 + 2b 2 - c 2) / 4

Sırasıyla

M c 2 = (2 * 8 2 + 2 * 9 2 - 13 2) / 4
mc2 = 30.25
mc = 5.5 cm

Yöntem 2.

Okuldaki öğretmenlerin sevdiği ikinci çözüm, bir paralelkenara bir üçgenin ek yapıları ve paralelkenar köşegen teoremi aracılığıyla bir çözümdür.

Üçgenin kenarlarını ve medyanı paralelkenara tamamlayarak uzatalım. Bu durumda, ABC üçgeninin ortanca BO'su, elde edilen paralelkenarın köşegeninin yarısına eşit olacak ve AB, BC üçgeninin iki kenarı, yan kenarlarına eşit olacaktır. Ortancanın çizildiği AC üçgeninin üçüncü kenarı, elde edilen paralelkenarın ikinci köşegenidir.

Teoreme göre, bir paralelkenarın köşegenlerinin kareleri toplamı, kenarlarının karelerinin toplamının iki katına eşittir.

2 (a 2 + b 2) = d 1 2 + d 2 2

Orijinal üçgenin medyanının devam etmesiyle oluşan paralelkenarın köşegenini x olarak gösterelim, şunu elde ederiz:

2 (8 2 + 9 2) = 13 2 + x 2
290 = 169 + x 2
x 2 = 290 - 169
x 2 = 121
x = 11

Gerekli medyan paralelkenarın köşegeninin yarısına eşit olduğundan, üçgenin medyanının değeri 11/2 = 5.5 cm olacaktır.

Yanıt vermek: 5.5cm

Ekonominin çeşitli sektörlerindeki maaşlar, aynı bölgede karşılaştırılabilir zaman dilimleri için sıcaklık ve yağış, farklı coğrafi bölgelerde yetiştirilen mahsullerin verimi, vb. Bununla birlikte, ortalama hiçbir şekilde tek genelleştirici gösterge değildir - bazı durumlarda daha doğru bir değerlendirme medyan gibi bir değer uygundur. İstatistikte, belirli bir popülasyondaki bir özelliğin dağılımının yardımcı tanımlayıcı bir özelliği olarak yaygın olarak kullanılır. Ortalamadan nasıl farklı olduğunu ve neden kullanılması gerektiğini görelim.

İstatistikte medyan: tanım ve özellikler

Şu durumu hayal edin: Şirkette müdürle birlikte 10 kişi çalışıyor. Sıradan işçilerin her biri 1.000 UAH ve ayrıca sahibi olan yöneticileri - 10.000 UAH. Aritmetik ortalamayı hesaplarsak, bu işletmedeki ortalama maaşın 1900 UAH olduğu ortaya çıkıyor. Bu ifade doğru olacak mı? Veya bu örneği ele alalım, aynı hastane koğuşunda ateşi 36,6 °C olan dokuz kişi ve ateşi 41 °C olan bir kişi var. Bu durumda aritmetik ortalama: (36.6 * 9 + 41) / 10 = 37.04 ° C'dir. Ancak bu, mevcut herkesin hasta olduğu anlamına gelmez. Bütün bunlar, ortalamanın tek başına genellikle yeterli olmadığını ve bu nedenle medyanın buna ek olarak kullanıldığını göstermektedir. İstatistikte bu göstergeye, sıralı bir varyasyon serisinin tam ortasında bulunan bir varyant denir. Örneklerimiz için hesaplarsanız, sırasıyla 1000 UAH alırsınız. ve 36.6 ° C Başka bir deyişle, istatistikteki medyan, bir diziyi, belirli bir popülasyonun aynı sayıda biriminin her iki tarafında (yukarı veya aşağı) bulunacak şekilde yarıya bölen bir değerdir. Bu özellik nedeniyle, bu göstergenin birkaç adı daha vardır: 50'nci yüzdelik dilim veya 0,5'lik nicelik.

İstatistiklerde medyan nasıl bulunur

Bu değeri hesaplama yöntemi, büyük ölçüde ne tür varyasyon serilerine sahip olduğumuza bağlıdır: kesikli veya aralıklı. İlk durumda, istatistiklerde medyanı bulmak oldukça kolaydır. Tek yapmanız gereken frekansların toplamını bulmak, 2'ye bölmek ve ardından sonuca ½ eklemek. Hesaplama prensibini aşağıdaki örnekle açıklamak en doğrusu olacaktır. Doğurganlık verilerini gruplandırdığımızı ve medyanın ne olduğunu bulmak istediğimizi varsayalım.

Çocuk sayısına göre aile grubu sayısı

Aile sayısı

Bazı basit hesaplamalar yaptıktan sonra, gerekli göstergenin şuna eşit olduğunu anlıyoruz: 195/2 + ½ = seçenekler. Bunun ne anlama geldiğini bulmak için, en küçük seçeneklerden başlayarak sırayla frekansları biriktirmek gerekir. Yani, ilk iki satırın toplamı bize 30'u veriyor. Açıkçası, 98 seçenek yok. Ancak sonuca üçüncü seçeneğin (70) sıklığını eklerseniz, 100'e eşit bir toplam elde edersiniz. 98. seçeneği içerir, bu da medyanın iki çocuklu bir aile olacağı anlamına gelir.

Aralık serilerine gelince, burada genellikle aşağıdaki formül kullanılır:

М е = X Ме + i Ме * (∑f / 2 - S Me-1) / f Ме, ki:

  • X Me - ortanca aralığın ilk değeri;
  • ∑f, serinin sayısıdır (frekanslarının toplamı);
  • i Me, medyan aralığın değeridir;
  • f Me, medyan aralığın frekansıdır;
  • S Ме-1 - medyandan önceki aralıklardaki kümülatif frekansların toplamı.

Yine, bir örnek olmadan anlamak oldukça zor. Değerle ilgili veri olduğunu varsayalım

Maaş, bin ruble

birikmiş frekanslar

Yukarıdaki formülü kullanmak için önce ortanca aralığı belirlememiz gerekir. Böyle bir aralık, birikmiş frekansı tüm frekans toplamının yarısını aşan veya ona eşit olan seçilir. Böylece, 510'u 2'ye bölerek, bu kriterin 250.000 ruble maaş değerine sahip bir aralığa karşılık geldiğini görüyoruz. 300.000 RUB'a kadar Artık formüldeki tüm verileri değiştirebilirsiniz:

M e = X Me + ben Me * (∑f / 2 - S Me-1) / f Me = 250 + 50 * (510/2 - 170) / 115 = 286.96 bin ruble.

Umarız makalemiz faydalı olmuştur ve artık istatistiklerde medyanın ne olduğu ve nasıl hesaplanması gerektiği konusunda net bir fikriniz vardır.

Ortalama değerlerle birlikte yapısal ortalamalar, varyasyon dağılım serisinin istatistiksel özellikleri olarak hesaplanır - moda ve medyan.
Moda(Mo), incelenen özelliğin en büyük sıklıkta tekrarlanan değeridir, yani. moda, bir özelliğin en yaygın anlamıdır.
Medyan(Ben), sıralı (sıralı) bir popülasyonun ortasına düşen bir özelliğin değeridir, yani. medyan, varyasyon serisinin merkezi değeridir.
Medyanın ana özelliği, öznitelik değerlerinin medyandan mutlak sapmalarının toplamının diğer herhangi bir değerden daha az olmasıdır ∑ | x i - Me | = min.

Gruplandırılmamış Verilerden Mod ve Medyan Belirleme

Düşünmek gruplandırılmamış verilerden mod ve medyanın belirlenmesi... 9 kişilik çalışma ekiplerinin aşağıdaki ücret kategorilerine sahip olduğunu varsayalım: 4 3 4 5 3 3 6 2 6. Bu tugay 3. kategoride en fazla işçiye sahip olduğundan, bu tarife kategorisi modal olacaktır. Mo = 3.
Medyanı belirlemek için sıralamanız gerekir: 2 3 3 3 4 4 5 6 6. Bu satırdaki merkez, 4. kategorinin çalışanıdır, bu nedenle bu kategori medyan olacaktır. Sıralanan seri çift sayıda birim içeriyorsa, medyan iki merkezi değerin ortalaması olarak belirlenir.
Mod, öznitelik değerinin en yaygın varyantını yansıtıyorsa, medyan, normal dağılım yasasına uymayan heterojen bir popülasyon için ortalamanın işlevlerini pratik olarak yerine getirir. Bilişsel önemini aşağıdaki örnekle açıklayalım.
100 kişiden oluşan bir grup insanın ortalama gelirini karakterize etmemiz gerektiğini varsayalım, bunların 99'u ayda 100 ila 200 dolar arasında gelire sahip ve ikincisinin aylık geliri 50.000 dolar (Tablo 1).
Tablo 1 - İncelenen grubun aylık gelirleri. Aritmetik ortalamayı kullanırsak, grubun ana bölümünün geliriyle pek ilgisi olmayan yaklaşık 600 - 700 dolar arasında bir ortalama gelir elde ederiz. Medyan, bu durumda, Me = 163 dolar, bu insan grubunun% 99'unun gelir düzeyinin nesnel bir tanımını vermeye izin verecektir.
Gruplandırılmış verilerden (dağılım serileri) mod ve medyanın belirlenmesini göz önünde bulundurun.
Tüm işletmenin çalışanlarının ücret kategorisine göre dağılımının bir bütün olarak aşağıdaki forma sahip olduğunu varsayalım (Tablo 2).
Tablo 2 - İşletme çalışanlarının ücret kategorisine göre dağılımı

Ayrık bir seri için mod ve medyanın hesaplanması

Aralık serisi için mod ve medyanın hesaplanması
video talimatı

Varyasyon serisi için mod ve medyanın hesaplanması
video talimatı

Ayrık bir varyasyon serisinden modun belirlenmesi

Boyuta göre sıralanmış önceden oluşturulmuş bir dizi karakteristik değer kullanılır. Örneklem büyüklüğü tek ise, merkezi değeri alın; örnek boyutu eşitse, iki merkezi değerin aritmetik ortalamasını alın.
Ayrık bir varyasyon serisinden modun belirlenmesi: 5. tarife kategorisi en yüksek frekansa (60 kişi) sahiptir, bu nedenle modaldir. Mo = 5.
Bir özelliğin medyan değerini belirlemek için, dizinin medyan biriminin sayısı (N Me) aşağıdaki formül kullanılarak bulunur: burada n, popülasyonun hacmidir.
Bizim durumumuzda: .
Her zaman çift sayıda nüfus birimiyle ortaya çıkan elde edilen kesirli değer, tam ortanın 95 ile 96 işçi arasında olduğunu gösterir. Bu seri numaralarına sahip işçilerin hangi gruba ait olduğunun belirlenmesi gerekmektedir. Bu, birikmiş frekansları hesaplayarak yapılabilir. Sadece 12 kişinin bulunduğu birinci grupta bu sayılara sahip işçi yokken, ikinci grupta (12 + 48 = 60) işçi bulunmamaktadır. 95. ve 96. işçiler üçüncü grupta (12 + 48 + 56 = 116), bu nedenle medyan 4. ücret kategorisidir.

Aralık serilerinde mod ve medyanın hesaplanması

Kesikli varyasyon serilerinin aksine, mod ve medyanın aralık serilerine göre belirlenmesi aşağıdaki formüllere dayalı belirli hesaplamalar gerektirir:
, (6)
nerede x 0- mod aralığının alt sınırı (en yüksek frekansa sahip aralığa modal denir);
Bence- mod aralığının değeri;
f Ay- mod aralığının sıklığı;
f Mo -1- moddan önceki aralığın sıklığı;
f Ay +1 Modalı takip eden aralığın frekansıdır.
(7)
nerede x 0- ortanca aralığın alt sınırı (ortanca, birikmiş frekansı toplam frekans toplamının yarısını aşan ilk aralıktır);
Bence- medyan aralığın değeri;
Ben -1- medyandan önceki birikmiş aralık;
ben Medyan aralığın frekansıdır.
Tablodaki verileri kullanarak bu formüllerin uygulamasını gösterelim. 3.
Bu dağılımda 60 - 80 sınırları olan aralık modal olacaktır, çünkü en yüksek frekansa sahiptir. Formül (6)'yı kullanarak modu tanımlarız:

Ortanca aralığı belirlemek için, biriken frekansların toplamının yarısını (bizim durumumuzda, %50) geçene kadar her bir sonraki aralığın birikmiş frekansını belirlemek gerekir (Tablo 11).
Medyanın 100 - 120 bin ruble sınırları olan aralık olduğu bulundu. Şimdi medyanı belirleyelim:

Tablo 3 - Mart 1994'te Rusya Federasyonu nüfusunun kişi başına ortalama nominal para geliri düzeyine göre dağılımı.
Kişi başına aylık gelir düzeyine göre gruplar, bin rubleNüfusun payı,%
20'ye kadar1,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
300'ün üzerinde7,7
Toplam100,0

Tablo 4 - Ortanca aralığın belirlenmesi
Bu nedenle, aritmetik ortalama, mod ve medyan, sıralanmış bir popülasyonun birimlerinde belirli bir özelliğin değerlerinin genelleştirilmiş bir özelliği olarak kullanılabilir.
Dağıtım merkezinin ana özelliği, toplamdaki tüm sapmaların (pozitif ve negatif) sıfıra eşit olmasıyla karakterize edilen aritmetik ortalamadır. Mutlak değerdeki ondan sapmaların toplamının minimum olması ve modun en sık karşılaşılan özelliğin değeri olması medyan için karakteristiktir.
Moda, medyan ve aritmetik ortalamanın oranı, bir özelliğin toplamdaki dağılımının doğasını gösterir, asimetrisini değerlendirmemize izin verir. Simetrik dağılımlarda her üç özellik de aynıdır. Mod ve aritmetik ortalama arasındaki fark ne kadar büyükse seri o kadar asimetriktir. Orta derecede asimetrik seriler için mod ve aritmetik ortalama arasındaki fark, medyan ve ortalama arasındaki farkın yaklaşık üç katıdır, yani:
| Mo –`x | = 3 | Ben –`x |.

Grafiksel yöntemle mod ve medyanın belirlenmesi

Aralık serisindeki moda ve medyan grafiksel olarak belirlenebilir... Mod, dağıtım histogramından belirlenir. Bunun için, bu durumda modal olan en yüksek dikdörtgen seçilir. Ardından modal dikdörtgenin sağ köşesini bir önceki dikdörtgenin sağ üst köşesine bağlarız. Ve kalıcı dikdörtgenin sol köşesi, sonraki dikdörtgenin sol üst köşesidir. Kesiştikleri noktadan, dik olanı apsis eksenine indiriyoruz. Bu düz çizgilerin kesiştiği noktanın apsisi dağıtım modu olacaktır (Şekil 3).


Pirinç. 3. Histogram ile modun grafiksel olarak belirlenmesi.


Pirinç. 4. Medyanın kümülatif olarak grafiksel tespiti
%50'ye tekabül eden birikmiş frekanslar (frekanslar) ölçeğindeki bir noktadan medyanı belirlemek için, kümülatif ile kesişene kadar apsis eksenine paralel bir düz çizgi çizilir. Daha sonra kesişim noktasından apsis eksenine bir dik açı indirilir. Kesişme noktasının apsisi medyandır.

Çeyrekler, ondalıklar, yüzdelikler

Benzer şekilde, değişken dağılım serilerinde medyanı bularak, sıralanmış serilerin herhangi bir birimi için özelliğin değerini büyüklük sırasına göre bulabilirsiniz. Örneğin, bir özelliğin değerini, bir seriyi dört eşit parçaya, 10 veya 100 parçaya bölen birimlerde bulabilirsiniz. Bu değerlere "çeyrekler", "ondalıklar", "yüzdelikler" denir.
Çeyrekler, sıralanmış bir popülasyonu 4 eşit parçaya bölen bir özellik değeridir.
Nüfusun ¼ bölümünü aşağıdakilerle ayırarak alt çeyreği (Q 1) ayırt edin: en küçük değerler karakter ve üst çeyrek (Q 3) ile kesişen ¼ kısmı en yüksek değerler işaret. Bu, nüfusun birimlerinin %25'inin Q 1 açısından daha az olacağı anlamına gelir; Birimlerin %25'i Q 1 ve Q 2 arasında yer alacaktır; %25, Q 2 ile Q 3 arasındadır ve kalan %25, Q 3'ü aşmaktadır. Q 2'nin ortalama çeyreği medyandır.
Bir aralık varyasyon serisi için çeyrekleri hesaplamak için aşağıdaki formüller kullanılır:
, ,
nerede x S 1- alt çeyreği içeren aralığın alt sınırı (aralık, ilki %25'i aşan birikmiş frekans tarafından belirlenir);
x S3- üst çeyreği içeren aralığın alt sınırı (aralık, ilki %75'i aşan birikmiş frekans tarafından belirlenir);
Bence- aralığın boyutu;
SQ 1-1- alt çeyreği içeren aralıktan önceki aralığın kümülatif sıklığı;
SQ 3-1- üst çeyreği içeren aralıktan önceki aralığın kümülatif sıklığı;
f S 1- alt çeyreği içeren aralığın sıklığı;
f S 3Üst çeyreği içeren aralığın frekansıdır.
Tabloya göre alt ve üst çeyreklerin hesaplanmasını düşünün. 10. Alt çeyrek, kümülatif frekansı %33,5 olan 60 - 80 aralığındadır. Üst çeyrek, %75,8 kümülatif frekansla 160 - 180 aralığındadır. Bunu akılda tutarak, şunları elde ederiz:
,
.
Çeyreklere ek olarak, değişken dağılımlarda ondalıklar belirlenebilir - sıralananları bölen değişkenler varyasyon aralığı on tarafından eşit parçalar... İlk ondalık (d 1) nüfusu 1/10 ila 9/10 oranında, ikinci ondalık (d 1) 2/10 ila 8/10 oranında vb. böler.
Formüllerle hesaplanırlar:
, .
Bir satırı yüz parçaya bölen özellik değerlerine yüzdelikler denir. Medyan, çeyrek, ondalık ve yüzdelik oranları Şekil 1'de gösterilmektedir. 5.

Verilerin merkezi eğilimi, yalnızca sıfır toplam sapma (aritmetik ortalama) veya maksimum frekans (mod) olan bir değer olarak değil, aynı zamanda sıralanmış verileri bölerek (artan veya azalan sırayla) iki eşit parçaya ... Orijinal verilerin yarısı bu işaretten daha az ve yarısı daha fazla. işte bu medyan.

Dolayısıyla, istatistikteki medyan, veri setini iki eşit yarıya bölen göstergenin seviyesidir. Değerler bir yarıda daha düşük, diğerinde medyandan daha yüksektir. Örnek olarak, rastgele sayılar kümesine bakalım.

Açıkçası, simetrik bir dağılımla, nüfusu ikiye bölen orta, tam merkezde - aritmetik ortalama (ve mod) ile aynı yerde olacaktır. Bu, tabiri caizse, mod, medyan ve aritmetik ortalamanın çakıştığı ve tüm özelliklerinin bir noktaya düştüğü zaman ideal bir durumdur - maksimum frekans, yarıya bölme, sapmaların sıfır toplamı - hepsi tek bir yerde. Ancak hayat normal dağılım kadar simetrik değildir.

Bir şeyin beklenen değerinden (elemanların içeriği, mesafe, seviye, kütle, vb.) sapmaların teknik ölçümleriyle uğraştığımızı varsayalım. Her şey yolundaysa, sapmalar büyük olasılıkla normale yakın bir yasaya göre, yaklaşık olarak yukarıdaki şekilde olduğu gibi dağıtılacaktır. Ancak süreçte önemli ve kontrol edilemeyen bir faktör varsa, o zaman aritmetik ortalamayı önemli ölçüde etkileyecek, ancak aynı zamanda medyanı pek etkilemeyecek olan anormal değerler görünebilir.

Örnek medyan, aritmetik ortalamaya bir alternatiftir, çünkü anormal sapmalara (aykırı değerlere) karşı dayanıklıdır.

Matematiksel ortanca özellik medyan değerden mutlak (mutlak değerde) sapmaların toplamının, diğer herhangi bir değerden sapmalarla karşılaştırıldığında mümkün olan minimum değeri vermesidir. Aritmetik ortalamadan bile daha az, oh nasıl! Bu gerçek, örneğin, ulaşım problemlerinin çözümünde, yola yakın nesnelerin yapım yerinin, farklı yerlerden toplam uçuş uzunluğunun minimum olacağı şekilde hesaplanması gerektiğinde (duraklar, gaz) uygulamasını bulur. istasyonlar, depolar, vb.).

İstatistiklerde medyan formülü ayrık veriler biraz moda formülünü andırıyor. Yani böyle bir formülün olmadığı gerçeği. Ortanca değer mevcut verilerden seçilir ve ancak bu mümkün değilse basit bir hesaplama yapılır.

Her şeyden önce, veriler sıralanır (azalan düzende sıralanır). O zaman iki seçenek var. Değerlerin sayısı tek ise, medyan, sayısı formülle belirlenebilen serinin merkezi değerine karşılık gelir:

Hayır ben- medyana karşılık gelen değerin sayısı,

n- veri setindeki değerlerin sayısı.

Daha sonra medyan olarak gösterilir

Bu, verilerde tek bir merkezi değerin bulunduğu ilk seçenektir. İkinci seçenek, veri miktarı eşit olduğunda, yani bir yerine iki merkezi değer olduğunda ortaya çıkar. Çıkış yolu basittir: iki merkezi değerin aritmetik ortalaması alınır:

V Aralık verileri belirli bir değer seçmek mümkün değildir. Medyan belirli bir kurala göre hesaplanır.

Başlamak için (verileri sıraladıktan sonra), bulun ortanca aralık... Bu, istenen medyan değerinin geçtiği aralıktır. Sıralanmış aralıkların kümülatif oranı kullanılarak belirlenir. Birikmiş pay ilk kez tüm değerlerin %50'sini aştığında, bir ortanca aralık da vardır.

Medyan için formülü kimin bulduğunu bilmiyorum, ancak medyan aralık içindeki verilerin dağılımının tekdüze olduğu varsayımından yola çıktık (yani aralığın genişliğinin %30'u, değerlerin %30'u, 80 genişliğin %'si değerlerin %80'idir, vb.) ... Dolayısıyla, medyan aralığın başlangıcından itibaren popülasyondaki tüm değerlerin %50'sine kadar olan değerlerin sayısını bilmek (tüm değerlerin sayısının yarısı ile premedyan aralığın kümülatif frekansı arasındaki fark), tüm medyan aralıkta hangi oranı işgal ettiklerini bulabiliriz. Bu kesir tam olarak medyan aralığının genişliğine aktarılır ve daha sonra medyan olarak adlandırılan belirli bir değeri belirtir.

Resimli bir diyagrama dönelim.

Biraz hantal çıktı, ama şimdi umarım her şey açık ve anlaşılır. Hesaplarken her seferinde böyle bir grafik çizmemek için hazır bir formül kullanabilirsiniz. Medyan formülü aşağıdaki gibidir:

nerede x ben- ortanca aralığın alt sınırı;

ben ben- medyan aralığın genişliği;

∑f / 2- 2'ye bölünen tüm değerlerin sayısı (iki);

S (Ben-1)- medyan aralığın başlangıcından önce toplanan gözlemlerin toplam sayısı, yani. medyan öncesi aralığın kümülatif frekansı;

ben- medyan aralıktaki gözlem sayısı.

Görülmesi kolay olduğu gibi, ortanca formül iki terimden oluşur: 1 - ortanca aralığın başlangıcının değeri ve 2 - %50'ye kadar eksik birikmiş payla orantılı olan kısım.

Örneğin, aşağıdaki verilerden medyanı hesaplayalım.

Medyan fiyatı, yani mal miktarının yarısı için daha ucuz ve daha pahalı olan fiyatı bulmak gerekir. Başlangıç ​​olarak, birikmiş frekans, birikmiş pay ve toplam mal sayısı için yardımcı hesaplamalar yapalım.

Son sütuna göre "Birikmiş pay" medyan aralığını belirleriz - 300-400 ruble (ilk kez birikmiş pay %50'den fazladır). Aralığın genişliği 100 ruble. Şimdi geriye kalan tek şey, verileri yukarıdaki formüle eklemek ve medyanı hesaplamak.

Yani, malların bir yarısı için fiyat 350 rubleden düşük, diğer yarısı için - daha yüksek. Basit. Aynı verilerden hesaplanan aritmetik ortalama 355 ruble. Fark önemli değil, ama orada.

Excel'de medyanı hesaplama

Sayısal veriler için medyanı kullanarak bulmak kolaydır Excel işlevi, buna denir - MEDYAN... Aralık verileri başka bir konudur. Excel'de karşılık gelen bir işlev yoktur. Bu nedenle, yukarıdaki formülü kullanmanız gerekir. Ne yapabilirsin? Ancak bu çok trajik değil, çünkü aralık verilerinden medyanın hesaplanması nadir bir durum. Ayrıca bir hesap makinesine bir kez güvenebilirsiniz.

Son olarak, bir problem öneriyorum. Bir veri seti var. 15, 5, 20, 5, 10. Ortalama nedir? Dört seçenek:

Bir örneğin modu, medyanı ve ortalaması, bir örnekteki merkezi eğilimi belirlemenin farklı yollarıdır.

Arkadaşlarınızla paylaşın veya kendiniz için kaydedin:

Yükleniyor...