Vjerojatnostne statističke metode. Statističke metode

Posebno je zanimljiva kvantitativna procjena poduzetničkog rizika korištenjem metoda matematičke statistike. Glavni alati ove metode procjene su:

§ vjerojatnost pojave nasumična varijabla ,

§ matematičko očekivanje ili prosječna vrijednost ispitivane slučajne varijable,

varijanca,

§ standardna (srednja kvadratna) devijacija,

§ koeficijent varijacije,

§ distribucija vjerojatnosti ispitivane slučajne varijable.

Da biste donijeli odluku, morate znati veličinu (stupanj) rizika koji se mjeri pomoću dva kriterija:

1) prosječna očekivana vrijednost (matematičko očekivanje),

2) fluktuacije (varijabilnost) mogućeg rezultata.

Prosječna očekivana vrijednost ovo je prosječne težine slučajna varijabla, koja je povezana s neizvjesnošću situacije:

,

gdje je vrijednost slučajne varijable.

Prosječna očekivana vrijednost mjeri rezultat koji u prosjeku očekujemo.

Prosječna vrijednost je generalizirana kvalitativna karakteristika i ne dopušta donošenje odluke u korist bilo koje određene vrijednosti slučajne varijable.

Za donošenje odluke potrebno je izmjeriti fluktuacije pokazatelja, odnosno odrediti mjeru varijabilnosti mogućeg rezultata.

Fluktuacija mogućeg ishoda je stupanj do kojeg očekivana vrijednost odstupa od srednje vrijednosti.

Za to se u praksi obično koriste dva usko povezana kriterija: "varijanca" i "standardna devijacija".

Disperzija - ponderirani prosjek kvadrata stvarnih rezultata od očekivanog prosjeka:

Standardna devijacija Je kvadratni korijen varijance. To je dimenzijska veličina i mjeri se u istim jedinicama u kojima se mjeri ispitivana slučajna varijabla:

.

Disperzija i standardna devijacija mjere su apsolutne fluktuacije. Za analizu se obično koristi koeficijent varijacije.

Koeficijent varijacije je omjer standardne devijacije i prosječne očekivane vrijednosti, pomnožen sa 100%

ili .

Apsolutne vrijednosti proučavanog pokazatelja ne utječu na koeficijent varijacije.

Koristeći koeficijent varijacije, možete čak usporediti fluktuacije značajki izražene u različitim mjernim jedinicama. Koeficijent varijacije može varirati od 0 do 100%. Što je koeficijent veći, to je veća fluktuacija.


V ekonomska statistika utvrdio takvu ocjenu različita značenja koeficijent varijacije:

do 10% - slaba fluktuacija, 10 - 25% - umjerena, preko 25% - visoka.

Sukladno tome, što su fluktuacije veće, to je veći rizik.

Primjer. Vlasnik malog dućana na početku svakog dana kupi neki kvarljivi proizvod za prodaju. Jedinica ovog proizvoda košta 200 UAH. Prodajna cijena - 300 UAH. za jedinicu. Iz opažanja je poznato da potražnja za ovim proizvodom tijekom dana može biti 4, 5, 6 ili 7 jedinica s odgovarajućim vjerojatnostima od 0,1; 0,3; 0,5; 0.1. Ako se proizvod ne proda tijekom dana, onda će se na kraju dana uvijek kupiti po cijeni od 150 UAH. za jedinicu. Koliko jedinica ovog proizvoda vlasnik trgovine treba kupiti na početku dana?

Riješenje. Izgradimo matricu dobiti za vlasnika trgovine. Izračunajmo dobit koju će vlasnik dobiti ako npr. kupi 7 jedinica proizvoda, a proda jednu jedinicu tijekom dana 6 i na kraju dana. Svaka jedinica prodanog proizvoda tijekom dana daje dobit od 100 UAH, a na kraju dana - gubitke od 200 - 150 = 50 UAH. Dakle, dobit će u ovom slučaju biti:

Izračuni se provode na sličan način za druge kombinacije ponude i potražnje.

Očekivana dobit izračunava se kao matematičko očekivanje mogućih vrijednosti dobiti svakog retka konstruirane matrice, uzimajući u obzir odgovarajuće vjerojatnosti. Kao što vidite, među očekivanim profitom najveća je 525 UAH. Odgovara kupnji predmetnog proizvoda u količini od 6 jedinica.

Da bismo potkrijepili konačnu preporuku o kupnji potrebnog broja jedinica proizvoda, izračunavamo varijansu, standardnu ​​devijaciju i koeficijent varijacije za svaku moguću kombinaciju ponude i potražnje proizvoda (svaki red matrice dobiti):

400 0,1 40 16000
400 0,3 120 48000
400 0,5 200 80000
400 0,1 40 16000
1,0 400 160000
350 0,1 35 12250
500 0,3 150 75000
500 0,5 250 125000
500 0,1 50 25000
1,0 485 2372500
300 0,1 30 9000
450 0,3 135 60750
600 0,5 300 180000
600 0,1 60 36000
1,0 525 285750

Što se tiče kupnje od strane vlasnika trgovine 6 jedinica proizvoda u odnosu na 5 i 4 jedinice, to nije očito, jer je rizik pri kupnji 6 jedinica proizvoda (19,2%) veći nego kod kupnje 5 jedinica (9,3). %), pa čak i više nego pri kupnji 4 jedinice (0%).

Tako imamo sve informacije o očekivanoj dobiti i rizicima. I vlasnik trgovine odlučuje koliko će jedinica proizvoda kupiti svako jutro, uzimajući u obzir svoje iskustvo, apetit za rizik.

Prema našem mišljenju, vlasnika trgovine treba savjetovati da kupi 5 jedinica proizvoda svako jutro, a njegova prosječna očekivana dobit će biti jednaka 485 UAH. a ako to usporedimo s kupnjom 6 jedinica proizvoda, u kojem je prosječna očekivana dobit 525 UAH, što je 40 UAH. više, ali će rizik u ovom slučaju biti 2,06 puta veći.

Kako se koriste teorija vjerojatnosti i matematička statistika? Ove discipline su temelj vjerojatno-statističkih metoda. odlučivanje... Da biste koristili njihov matematički aparat, potrebni su vam problemi odlučivanje izraženo u terminima vjerojatno-statističkih modela. Primjena specifične vjerojatnosno-statističke metode odlučivanje sastoji se od tri faze:

  • prijelaz iz ekonomske, upravljačke, tehnološke stvarnosti u apstraktnu matematičku i statističku shemu, t.j. izgradnja vjerojatnosnog modela upravljačkog sustava, tehnološkog procesa, postupcima donošenja odluka, posebno na temelju rezultata statističke kontrole, itd.;
  • izrada proračuna i dobivanje zaključaka čisto matematičkim sredstvima u okviru vjerojatnosnog modela;
  • tumačenje matematičkih i statističkih zaključaka u odnosu na stvarno stanje i donošenje odgovarajuće odluke (npr. o sukladnosti ili neusklađenosti kvalitete proizvoda s utvrđenim zahtjevima, potrebi prilagodbe tehnološkog procesa i sl.), posebice zaključka (o udjelu neispravnog proizvoda). jedinica u seriji, o specifičnoj vrsti zakona distribucije praćeni parametri tehnološki proces itd.).

Matematička statistika koristi pojmove, metode i rezultate teorije vjerojatnosti. Razmotrite glavne probleme izgradnje vjerojatnosnih modela odlučivanje u ekonomskim, menadžerskim, tehnološkim i drugim situacijama. Za aktivno i ispravno korištenje normativno-tehničkih i nastavno-metodoloških dokumenata o probabilističko-statističkim metodama odlučivanje zahtijeva predznanje. Dakle, potrebno je znati pod kojim uvjetima treba primijeniti određeni dokument, koje početne podatke je potrebno imati za njegov odabir i primjenu, koje odluke treba donijeti na temelju rezultata obrade podataka itd.

Primjeri primjene teorije vjerojatnosti i matematičke statistike... Razmotrimo nekoliko primjera kada su vjerojatnostno-statistički modeli dobar alat za rješavanje upravljačkih, proizvodnih, gospodarskih i nacionalno-gospodarskih problema. Tako, na primjer, u romanu A.N. Tolstojev "Hod kroz agoniju" (v. 1) kaže: "Radionica daje dvadeset i tri posto braka, a vi se držite ove brojke", rekao je Strukov Ivanu Iljiču.

Postavlja se pitanje kako razumjeti ove riječi u razgovoru voditelja tvornica, budući da jedna proizvodna jedinica ne može biti 23% neispravna. Može biti dobar ili neispravan. Vjerojatno je Strukov mislio da serija velikog volumena sadrži otprilike 23% neispravnih predmeta. Tada se postavlja pitanje, što znači "o"? Neka se od 100 testiranih jedinica proizvodnje 30 pokaže neispravnim, ili od 1000-300, ili od 100000-30000 itd., treba li optužiti Strukova za laž?

Ili drugi primjer. Novčić koji se koristi kao lot mora biti "simetričan", t.j. pri bacanju, u prosjeku, u polovici slučajeva, grb bi trebao ispasti, a u polovici slučajeva - rešetka (repovi, broj). Ali što znači "prosjek"? Ako izvedete mnogo serija od 10 bacanja u svakoj seriji, tada ćete često naići na serije u kojima novčić pada 4 puta s amblemom. Za simetričan novčić, to će se dogoditi u 20,5% serije. A ako ima 40.000 grbova na 100.000 bacanja, može li se novčić smatrati simetričnim? Postupak odlučivanje izgrađen je na temelju teorije vjerojatnosti i matematičke statistike.

Primjer o kojem je riječ možda se ne čini dovoljno ozbiljnim. Međutim, nije. Ždrijeb se široko koristi u organizaciji industrijskih tehničkih i ekonomskih eksperimenata, na primjer, pri obradi rezultata mjerenja pokazatelja kvalitete (momenta trenja) ležajeva ovisno o različitim tehnološkim čimbenicima (utjecaj okoliša očuvanja, metode priprema ležajeva prije mjerenja, učinak opterećenja ležaja tijekom mjerenja i sl.). NS.). Recimo da je potrebno usporediti kvalitetu ležajeva ovisno o rezultatima njihovog skladištenja u različitim konzervacijskim uljima, t.j. u sastavu ulja i. Prilikom planiranja ovakvog eksperimenta postavlja se pitanje koje ležajeve treba staviti u ulje kompozicije, a koje u ulje kompozicije, ali na način da se izbjegne subjektivnost i osigura objektivnost odluke.

Odgovor na ovo pitanje može se dobiti ždrijebom. Sličan primjer može se dati s kontrolom kvalitete bilo kojeg proizvoda. Kako bi se odlučilo ispunjava li kontrolirana serija proizvoda utvrđene zahtjeve ili ne, uzima se uzorak. Na temelju rezultata uzorkovanja donosi se zaključak o cijeloj seriji. U ovom slučaju vrlo je važno izbjeći subjektivnost u odabiru uzorka, t.j. potrebno je da svaka stavka u kontroliranoj seriji ima istu vjerojatnost da bude odabrana u uzorku. V radni uvjeti Odabir proizvodnih jedinica u uzorku obično se ne provodi žrijebom, već posebnim tablicama slučajnih brojeva ili uz pomoć računalnih senzora slučajnih brojeva.

Slični problemi osiguravanja objektivnosti usporedbe javljaju se pri usporedbi različitih shema. organizacija proizvodnje, naknade, tijekom natječaja i natječaja, odabir kandidata za slobodna radna mjesta i dr. Svugdje su potrebni izvlačenje ili slični postupci. Objasnimo na primjeru identificiranja najjače i druge najjače momčadi pri organizaciji turnira po olimpijskom sustavu (poraženi je eliminiran). Neka jača ekipa uvijek pobjeđuje slabiju. Jasno je da će najjača momčad definitivno postati prvak. Druga po snazi ​​momčad izborit će finale ako i samo ako nema utakmica s budućim prvakom prije finala. Ako je takva utakmica planirana, onda druga po snazi ​​momčad neće proći u finale. Svatko tko planira turnir može ili "nokautirati" drugu po snazi ​​momčad s turnira prije roka, okupivši je u prvom susretu s liderom, ili joj osigurati drugo mjesto, osiguravajući susrete sa slabijim momčadima do finala. Kako biste izbjegli subjektivnost, izvucite ždrijeb. Za turnir s 8 momčadi, vjerojatnost da će se dvije najjače momčadi susresti u finalu je 4/7. Sukladno tome, s vjerojatnošću od 3/7, druga po snazi ​​momčad napustit će turnir prije roka.

Svako mjerenje jedinica proizvoda (pomoću čeljusti, mikrometra, ampermetra itd.) ima pogreške. Da bi se utvrdilo postoje li sustavne pogreške, potrebno je izvršiti višestruka mjerenja jedinice proizvodnje čije su karakteristike poznate (na primjer, standardni uzorak). Treba imati na umu da osim sustavne postoji i slučajna pogreška.

Stoga se postavlja pitanje kako iz rezultata mjerenja doznati postoji li sustavna pogreška. Zabilježimo li samo da li je pogreška dobivena tijekom sljedećeg mjerenja pozitivna ili negativna, onda se ovaj problem može svesti na prethodni. Doista, usporedimo mjerenje s bacanjem novčića, pozitivnu pogrešku - s padom grba, negativnu - rešetku (nulta pogreška s dovoljnim brojem podjela ljestvice praktički se nikada ne događa). Tada je provjera odsutnosti sustavne pogreške ekvivalentna provjeravanju simetrije novčića.

Svrha ovog razmišljanja je problem provjere odsutnosti sustavne pogreške svesti na problem provjere simetrije novčića. Gornje obrazloženje dovodi do takozvanog "znakovnog kriterija" u matematičkoj statistici.

Statističkom regulacijom tehnoloških procesa na temelju metoda matematičke statistike izrađuju se pravila i planovi za statističku kontrolu procesa, s ciljem pravovremenog otkrivanja nepravilnosti u tehnološkim procesima, poduzimanja mjera za njihovo prilagođavanje i sprječavanja oslobađanja proizvoda koji ne ispunjavaju utvrđene zahtjeve. Ove mjere usmjerene su na smanjenje troškova proizvodnje i gubitaka od opskrbe nekvalitetnim proizvodima. U statističkoj prihvatnoj kontroli, na temelju metoda matematičke statistike, izrađuju se planovi kontrole kvalitete analizom uzoraka iz serija proizvoda. Poteškoća leži u mogućnosti ispravne izgradnje vjerojatnosnih i statističkih modela odlučivanje, na temelju čega je moguće odgovoriti na navedena pitanja. U matematičkoj statistici za to su razvijeni vjerojatnosni modeli i metode za provjeru hipoteza, posebice hipoteza da je udio neispravnih jedinica proizvodnje jednak određenom broju, na primjer (sjetite se riječi Strukova iz romana A.N. Tolstoj).

Zadaci ocjenjivanja... U nizu upravljačkih, industrijskih, gospodarskih i nacionalno-gospodarskih situacija javljaju se problemi drugačijeg tipa - problem procjene karakteristika i parametara distribucija vjerojatnosti.

Pogledajmo primjer. Pretpostavimo da je na pregled primljena serija od N žarulja. Iz ove serije nasumično je odabran uzorak od n žarulja. Postavlja se niz prirodnih pitanja. Kako na temelju rezultata ispitivanja elemenata uzorka odrediti prosječni vijek trajanja električnih svjetiljki i s kojom se točnošću može procijeniti ta karakteristika? Kako se mijenja točnost ako uzmete veći uzorak? U kojem se broju sati može jamčiti da će najmanje 90% žarulja trajati više od jednog sata?

Pretpostavimo da se prilikom ispitivanja uzorka s volumenom električnih svjetiljki pokazalo da su električne svjetiljke neispravne. Tada se postavljaju sljedeća pitanja. Koje se granice mogu odrediti za broj neispravnih žarulja u seriji, za razinu neispravnosti itd.?

Ili, u statističkoj analizi točnosti i stabilnosti tehnoloških procesa, npr pokazatelji kvalitete kao prosjek praćeni parametar te stupanj njegove rasprostranjenosti u procesu koji se razmatra. Prema teoriji vjerojatnosti, preporučljivo je koristiti njezino matematičko očekivanje kao srednju vrijednost slučajne varijable, te varijansu, standardnu ​​devijaciju ili koeficijent varijacije... Postavlja se pitanje: kako vrednovati ove statističke karakteristike iz podataka uzorka i s kojom se točnošću to može učiniti? Mnogo je sličnih primjera. Ovdje je bilo važno pokazati kako se teorija vjerojatnosti i matematička statistika mogu koristiti u upravljanju proizvodnjom pri donošenju odluka u području statističkog upravljanja kvalitetom proizvoda.

Što je "matematička statistika"? Pod, ispod matematička statistika razumjeti "odjeljak matematike posvećen matematičkim metodama za prikupljanje, organiziranje, obradu i tumačenje statističkih podataka, kao i njihovo korištenje za znanstvene ili praktične zaključke. Pravila i postupci matematičke statistike temelje se na teoriji vjerojatnosti, što ga čini moguće je procijeniti točnost i pouzdanost zaključaka dobivenih u svakom problemu na temelju dostupnog statističkog materijala“ [[2.2], str. 326]. U ovom slučaju statistički se podaci nazivaju informacijama o broju objekata u nekom više ili manje opsežnom skupu koji imaju određene karakteristike.

Prema vrsti problema koji se rješavaju, matematička statistika se obično dijeli u tri dijela: opis podataka, procjena i testiranje hipoteza.

Prema vrsti obrađenih statističkih podataka, matematička statistika se dijeli na četiri područja:

  • jednodimenzionalna statistika (statistika slučajnih varijabli), u kojoj se rezultat promatranja opisuje realnim brojem;
  • multivarijantna statistička analiza, gdje se rezultat promatranja nad objektom opisuje s nekoliko brojeva (vektora);
  • statistika slučajnih procesa i vremenskih serija, gdje je rezultat promatranja funkcija;
  • statistika objekata nenumeričke prirode, u kojoj je rezultat promatranja nenumeričke prirode, na primjer, skup ( geometrijski lik), naručivanjem ili dobivenim kao rezultat mjerenja na kvalitativnoj osnovi.

Povijesno gledano, prva su se pojavila neka područja statistike objekata nenumeričke prirode (posebno problemi procjene udjela braka i testiranja hipoteza o njemu) i jednodimenzionalne statistike. Matematički aparat im je jednostavniji, pa se na njihovom primjeru obično demonstriraju osnovne ideje matematičke statistike.

Samo one metode obrade podataka, t.j. matematička statistika je dokaz koji se temelji na vjerojatnosnim modelima relevantnih stvarnih pojava i procesa. Riječ je o modelima ponašanja potrošača, pojavi rizika, funkcioniranju tehnološke opreme, dobivanju eksperimentalnih rezultata, tijeku bolesti itd. Vjerojatnostni model stvarne pojave treba smatrati konstruiranim ako su razmatrane veličine i odnosi među njima izraženi u terminima teorije vjerojatnosti. Usklađenost s probabilističkim modelom stvarnosti, t.j. njegova se primjerenost potkrepljuje, posebice, uz pomoć statističkih metoda za provjeru hipoteza.

Nevjerojatne metode obrade podataka su istraživačke, mogu se koristiti samo za preliminarnu analizu podataka, jer ne omogućuju procjenu točnosti i pouzdanosti zaključaka dobivenih na temelju ograničenog statističkog materijala.

Vjerojatnost i statističke metode primjenjivi su gdje god je moguće konstruirati i potkrijepiti vjerojatnostni model pojave ili procesa. Njihova je uporaba obvezna kada se zaključci izvučeni iz uzorka podataka prenose na cijelu populaciju (na primjer, iz uzorka na cijelu seriju proizvoda).

U specifičnim aplikacijama koriste se kao probabilistički statističke metode raširena upotreba i specifična. Primjerice, u dijelu upravljanja proizvodnjom posvećenom statističkim metodama upravljanja kvalitetom proizvoda, koristi se primijenjena matematička statistika (uključujući planiranje eksperimenata). Uz pomoć njenih metoda, Statistička analiza točnost i stabilnost tehnoloških procesa te statističku ocjenu kvalitete. Specifične metode uključuju metode statističke kontrole prihvatljivosti kvalitete proizvoda, statističke regulacije tehnoloških procesa, procjene i kontrole pouzdanosti itd.

Primijenjene probabilističke i statističke discipline kao što su teorija pouzdanosti i teorija čekanja imaju široku primjenu. Sadržaj prvog od njih je jasan iz naziva, drugi proučava sustave poput telefonske centrale, koja u nasumično vrijeme prima pozive - zahtjeve pretplatnika koji biraju brojeve na svojim telefonima. Trajanje servisiranja ovih potraživanja, tj. trajanje razgovora također se modelira slučajnim varijablama. Veliki doprinos razvoju ovih disciplina dao je dopisni član Akademije znanosti SSSR-a A.Ya. Khinčin (1894-1959), akademik Akademije znanosti Ukrajinske SSR B.V. Gnedenko (1912-1995) i drugi domaći znanstvenici.

Ukratko o povijesti matematičke statistike... Matematička statistika kao znanost počinje radovima poznatog njemačkog matematičara Karla Friedricha Gaussa (1777.-1855.) koji je na temelju teorije vjerojatnosti istraživao i potkrijepio metoda najmanjih kvadrata , koju je stvorio 1795. i korišten za obradu astronomskih podataka (kako bi se razjasnila orbita malog planeta Ceres). Njegovo se ime često naziva jednom od najpopularnijih distribucija vjerojatnosti - normalnom, a u teoriji slučajnih procesa glavni predmet proučavanja su Gaussovi procesi.

V krajem XIX v. - početak dvadesetog stoljeća. veliki doprinos matematičkoj statistici dali su engleski istraživači, prvenstveno K. Pearson (1857-1936) i R.A. Fisher (1890-1962). Konkretno, Pearson je razvio hi-kvadrat test za statističke hipoteze, a Fisher je razvio analiza varijance, teorija planiranja eksperimenta, metoda procjene parametara maksimalne vjerojatnosti.

U 30-im godinama dvadesetog stoljeća. Poljak Jerzy Neumann (1894-1977) i Englez E. Pearson razvili opća teorija testiranje statističkih hipoteza, a sovjetski matematičari akademik A.N. Kolmogorov (1903-1987) i dopisni član Akademije znanosti SSSR-a N.V. Smirnov (1900-1966) postavio je temelje neparametarskoj statistici. Četrdesetih godina dvadesetog stoljeća. Rumunj A. Wald (1902-1950) izgradio je teoriju sekvencijalne statističke analize.

Matematička statistika se u današnje vrijeme ubrzano razvija. Dakle, tijekom proteklih 40 godina mogu se razlikovati četiri temeljno nova područja istraživanja [[2.16]]:

  • razvoj i implementacija matematičkih metoda za planiranje eksperimenata;
  • razvoj statistike objekata nenumeričke prirode kao samopreporuka u primijenjenoj matematičkoj statistici;
  • razvoj statističkih metoda koje su stabilne u odnosu na mala odstupanja od korištenog vjerojatnosnog modela;
  • raširen razvoj rada na izradi računalnih programskih paketa namijenjenih statističkoj analizi podataka.

Vjerojatnostno-statističke metode i optimizacija... Ideja optimizacije prožima suvremenu primijenjenu matematičku statistiku i drugo statističke metode... Naime - metode planiranja eksperimenata, statistička kontrola prihvaćanja, statistička regulacija tehnoloških procesa itd. S druge strane, optimizacijski iskazi u teoriji odlučivanje, na primjer, primijenjena teorija optimizacije kvalitete proizvoda i zahtjevi standarda, omogućuju široku primjenu probabilističkih i statističkih metoda, prvenstveno primijenjene matematičke statistike.

U upravljanju proizvodnjom, posebice pri optimizaciji kvalitete proizvoda i zahtjevima standarda, posebno je važno primijeniti statističke metode u početnoj fazi životni ciklus proizvoda, tj. u fazi istraživačke pripreme razvoja pokusnog projekta (izrada obećavajućih zahtjeva za proizvode, idejni projekt, tehničke specifikacije za izradu eksperimentalnog projekta). To je zbog ograničenih informacija dostupnih u početnoj fazi životnog ciklusa proizvoda i potrebe za predviđanjem tehničkih mogućnosti i ekonomske situacije za budućnost. Statističke metode treba koristiti u svim fazama rješavanja problema optimizacije - pri skaliranju varijabli, razvoju matematičkih modela za funkcioniranje proizvoda i sustava, provođenju tehničkih i ekonomskih eksperimenata itd.

U problemima optimizacije koriste se sva područja statistike, uključujući optimizaciju kvalitete proizvoda i zahtjeve standarda. Naime - statistika slučajnih varijabli, višedimenzionalna Statistička analiza, statistika slučajnih procesa i vremenskih serija, statistika objekata nenumeričke prirode. Odabir statističke metode za analizu specifičnih podataka preporučljivo je provesti prema preporukama [

Dio 1. Temelji primijenjene statistike

1.2.3. Bit probabilističkih i statističkih metoda odlučivanja

Kako se pristupi, ideje i rezultati teorije vjerojatnosti i matematičke statistike koriste u donošenju odluka?

Baza je probabilistički model stvarne pojave ili procesa, t.j. matematički model u kojem se objektivni odnosi izražavaju u terminima teorije vjerojatnosti. Vjerojatnosti se prvenstveno koriste za opisivanje neizvjesnosti koje je potrebno uzeti u obzir prilikom donošenja odluka. To se odnosi i na neželjene prilike (rizici) i na one atraktivne ("sretna prilika"). Ponekad se slučajnost namjerno unosi u situaciju, na primjer, izvlačenjem ždrijeba, slučajnim odabirom jedinica za kontrolu, održavanjem lutrije ili anketama potrošača.

Teorija vjerojatnosti omogućuje da se neke vjerojatnosti izračunaju druge koje su od interesa za istraživača. Na primjer, na temelju vjerojatnosti ispadanja grba, možete izračunati vjerojatnost da će s 10 bacanja novčića ispasti najmanje 3 grba. Takav se izračun temelji na vjerojatnosnom modelu, prema kojem se bacanja novčića opisuju shemom neovisnih testova, osim toga, grb i rešetka su jednako mogući, pa je vjerojatnost svakog od ovih događaja ½. Složeniji model je onaj u kojem se, umjesto bacanja novčića, razmatra provjera kvalitete jedinice proizvoda. Odgovarajući probabilistički model temelji se na pretpostavci da je kontrola kvalitete različitih proizvoda opisana neovisnom shemom ispitivanja. Za razliku od modela bacanja novčića, mora se uvesti novi parametar – vjerojatnost R da je predmet neispravan. Model će biti u potpunosti opisan ako se pretpostavi da svi predmeti imaju jednaku vjerojatnost neispravnosti. Ako je potonja pretpostavka netočna, tada se povećava broj parametara modela. Na primjer, možete pretpostaviti da svaka stavka ima vlastitu vjerojatnost da će biti neispravna.

Razmotrimo model kontrole kvalitete sa zajedničkom vjerojatnošću kvara za sve jedinice proizvoda R... Kako bi pri analizi modela "došli do broja" potrebno je izvršiti zamjenu R za neko specifično značenje. Da biste to učinili, potrebno je ići dalje od vjerojatnosnog modela i okrenuti se podacima dobivenim tijekom kontrole kvalitete. Matematička statistika rješava inverzni problem u odnosu na teoriju vjerojatnosti. Njegova je svrha izvući zaključke o vjerojatnostima koje su u osnovi vjerojatnosnog modela na temelju rezultata promatranja (mjerenja, analize, ispitivanja, eksperimenti). Na primjer, na temelju učestalosti pojavljivanja neispravnih proizvoda tijekom inspekcije, mogu se izvući zaključci o vjerojatnosti neispravnosti (vidi gore Bernoullijev teorem). Na temelju Čebiševljeve nejednakosti izvedeni su zaključci o korespondenciji učestalosti pojavljivanja neispravnih proizvoda hipotezi da vjerojatnost neispravnosti poprima određenu vrijednost.

Dakle, primjena matematičke statistike temelji se na vjerojatnosnom modelu pojave ili procesa. Koriste se dva paralelna niza pojmova - vezani uz teoriju (vjerojatni model) i povezani s praksom (uzorak rezultata promatranja). Na primjer, teorijska vjerojatnost odgovara učestalosti pronađenoj iz uzorka. Matematičko očekivanje (teorijski niz) odgovara uzorku aritmetičke sredine (praktične serije). Obično su karakteristike uzorka teorijske procjene. Istodobno, vrijednosti koje se odnose na teorijske serije "su u glavama istraživača", odnose se na svijet ideja (prema starogrčkom filozofu Platonu) i nedostupne su za izravno mjerenje. Istraživači imaju samo uzorke podataka, uz pomoć kojih pokušavaju ustanoviti svojstva teorijskog vjerojatnostnog modela koja ih zanimaju.

Zašto je potreban vjerojatnostni model? Činjenica je da je samo uz njegovu pomoć moguće prenijeti svojstva utvrđena iz rezultata analize pojedinog uzorka na druge uzorke, kao i na cjelokupnu opću populaciju tzv. Izraz "opća populacija" koristi se kada se odnosi na veliku, ali ograničenu populaciju jedinica od interesa. Na primjer, o zbroju svih stanovnika Rusije ili o zbroju svih potrošača instant kave u Moskvi. Svrha marketinga ili ispitivanja javnog mnijenja je prenijeti izjave iz uzorka od stotina ili tisuća ljudi na populacije od nekoliko milijuna ljudi. U kontroli kvalitete, serija proizvoda djeluje kao opća populacija.

Za prijenos zaključaka s uzorka na veću populaciju potrebna je jedna ili ona pretpostavka o odnosu karakteristika uzorka s karakteristikama ove veće populacije. Te se pretpostavke temelje na odgovarajućem vjerojatnosnom modelu.

Naravno, moguće je obraditi podatke uzorka bez korištenja određenog vjerojatnosnog modela. Na primjer, možete izračunati uzorak aritmetičke sredine, izračunati učestalost ispunjenja određenih uvjeta itd. Međutim, rezultati izračuna odnosit će se samo na određeni uzorak, a prijenos zaključaka dobivenih uz njihovu pomoć na bilo koju drugu populaciju je netočan. Ova se aktivnost ponekad naziva i "vađenje podataka". U usporedbi s probabilističko-statističkim metodama, analiza podataka ima ograničenu kognitivnu vrijednost.

Dakle, korištenje vjerojatnostnih modela temeljenih na ocjenjivanju i testiranju hipoteza korištenjem karakteristika uzorka predstavlja bit vjerojatno-statističkih metoda odlučivanja.

Naglasimo da logika korištenja karakteristika uzorka za donošenje odluka na temelju teorijskih modela pretpostavlja istovremenu uporabu dvaju paralelnih niza koncepata, od kojih jedan odgovara vjerojatnostim modelima, a drugi uzorku podataka. Nažalost, u nizu književnih izvora, obično zastarjelih ili napisanih u duhu recepta, ne pravi se razlika između selektivnih i teorijskih karakteristika, što čitatelje dovodi do zbunjenosti i pogrešaka u praktičnoj uporabi statističkih metoda.

Prethodni

Pojave života, kao i sve pojave materijalnog svijeta općenito, imaju dvije neraskidivo povezane strane: kvalitativnu, koju opažaju izravno osjetila, i kvantitativnu, izraženu brojkama uz pomoć brojanja i mjere.

Prilikom istraživanja razne pojave prirode, istovremeno se koriste i kvalitativni i kvantitativni pokazatelji. Nema sumnje da se samo u jedinstvu kvalitativnog i kvantitativnog aspekta najpotpunije otkriva bit proučavanih pojava. Međutim, u stvarnosti morate koristiti ili jedan ili drugi pokazatelj.

Nema sumnje da kvantitativne metode, kao objektivnije i točnije, imaju prednost u odnosu na kvalitativne karakteristike objekata.

Sami rezultati mjerenja, iako imaju određenu vrijednost, ipak su nedostatni da se iz njih izvuku potrebni zaključci. Digitalni podaci prikupljeni u procesu masovnog testiranja samo su sirovi činjenični materijal koji se u skladu s tim treba matematički obraditi. Bez obrade – uređenja i sistematizacije digitalnih podataka nije moguće izdvojiti informacije koje se nalaze u njima, ocijeniti pouzdanost pojedinačnih ukupnih pokazatelja, provjeriti jesu li uočene razlike među njima pouzdane. Ovaj rad zahtijeva od stručnjaka određeno znanje, sposobnost ispravne generalizacije i analize podataka prikupljenih u iskustvu. Sustav ovih znanja čini sadržaj statistike - znanosti koja se uglavnom bavi analizom rezultata istraživanja u teorijskim i primijenjenim područjima znanosti.

Treba imati na umu da su matematička statistika i teorija vjerojatnosti čisto teorijske, apstraktne znanosti; proučavaju statističke agregate bez obzira na specifičnosti njihovih sastavnih elemenata. Metode matematičke statistike i teorija vjerojatnosti koja je u njenoj osnovi primjenjive su na širok raspon područja znanja, uključujući humanističke znanosti.

Proučavanje fenomena ne provodi se na pojedinačnim opažanjima, koja se mogu pokazati kao slučajna, netipična, koja nepotpuno izražavaju bit danog fenomena, već na skupu homogenih opažanja, što daje potpunije informacije o predmetu koji se proučava. Određeni skup relativno homogenih objekata, ujedinjenih prema jednom ili drugom kriteriju za zajedničko proučavanje, naziva se statističkim

agregat. Skup kombinira niz homogenih opažanja ili registracija.

Elementi koji čine zbirku nazivaju se njezinim članovima ili opcijama. ... Varijante Jesu li pojedinačna opažanja ili numeričke vrijednosti karakteristike. Dakle, ako obilježje označimo s X (veliko), tada će njegove vrijednosti ili opcije biti označene s x (malo), tj. x 1, x 2, itd.

Ukupan broj opcija koje čine danu populaciju naziva se njezin volumen i označava se slovom n (malo).

Kada se ispita cijeli skup homogenih objekata u cjelini, naziva se općim, općim, skupom.Primjer ovakvog kontinuiranog opisa skupa mogu biti nacionalni popisi stanovništva, opći statistički popis životinja u zemlja. Naravno, potpuni pregled opće populacije daje najpotpunije informacije o njenom stanju i svojstvima. Stoga je prirodno da istraživači nastoje spojiti što više opažanja.

U stvarnosti, međutim, rijetko je potrebno pribjeći anketiranju svih članova opće populacije. Prvo, zato što ovaj posao zahtijeva puno vremena i truda, a drugo, nije uvijek izvediv iz raznih razloga i raznih okolnosti. Dakle, umjesto cjelovitog istraživanja opće populacije, obično se proučava neki njezin dio, koji se naziva populacija uzorka, odnosno uzorak. To je model po kojem se prosuđuje cjelokupna opća populacija u cjelini. Primjerice, da bi se saznao prosječan rast ročnika određene regije ili okruga, uopće nije potrebno mjeriti sve ročnike koji žive na određenom području, već je dovoljno izmjeriti dio njih.

1. Uzorak treba biti potpuno reprezentativan, odnosno tipičan, t.j. tako da uključuje uglavnom one opcije koje najpotpunije odražavaju opću populaciju. Stoga, kako bi se započelo s obradom podataka uzorka, oni se pažljivo pregledavaju i uklanjaju se očito netipične varijante. Na primjer, kada se analizira trošak proizvoda koje proizvede poduzeće, treba isključiti trošak u onim razdobljima kada poduzeće nije bilo u potpunosti opskrbljeno komponentama ili sirovinama.

2. Uzorak mora biti objektivan. Prilikom formiranja uzorka ne treba se ponašati proizvoljno, uključivati ​​samo one opcije koje se čine tipične u njegovu sastavu, a sve ostale odbaciti. Kvalitetan uzorak izrađuje se bez predrasuda, metodom ždrijeba ili ždrijebom, kada niti jedna varijanta opće populacije nema prednosti u odnosu na druge – da se uključi ili ne uključi u uzorak. Drugim riječima, uzorak bi trebao biti nasumično odabran bez utjecaja na njegov sastav.

3. Uzorak treba biti kvalitativno ujednačen. Nemoguće je uključiti u isti uzorak podatke dobivene pod različitim uvjetima, na primjer, trošak proizvoda dobivenih s različitim brojem zaposlenika.

6.2. Grupiranje rezultata promatranja

Obično se rezultati pokusa i opažanja unose u obliku brojeva u upisne kartice ili dnevnik, a ponekad i samo na listove papira - dobiva se izjava ili registar. Takvi početni dokumenti u pravilu sadrže podatke ne o jednom, već o nekoliko znakova na kojima su obavljena opažanja. Ovi dokumenti služe kao glavni izvor formiranja uzorka. To se obično radi ovako: na zasebnom listu papira od primarnog dokumenta, t.j. kartoteka, dnevnik ili izvod, ispisuju se numeričke vrijednosti atributa kojim se formira agregat. Opcije u takvoj kombinaciji obično se prikazuju u obliku neuređene mase brojeva. Stoga je prvi korak prema obradi takvog materijala naručivanje, sistematizacija - grupiranje opcije u statističke tablice ili retke.

Statističke tablice su jedan od najčešćih oblika grupiranja uzoraka podataka. Oni su ilustrativni, pokazuju neke općenite rezultate, položaj pojedinih elemenata u općem nizu opažanja.

Drugi oblik primarnog grupiranja uzoraka podataka je metoda rangiranja, t.j. položaj varijante određenim redoslijedom - prema rastućim ili opadajućim vrijednostima atributa. Kao rezultat dobiva se takozvana rangirana serija koja pokazuje u kojim granicama i kako se to obilježje mijenja. Na primjer, postoji uzorak sljedećeg sastava:

5,2,1,5,7,9,3,5,4,10,4,5,7,3,5, 9,4,12,7,7

Može se vidjeti da značajka varira od 1 do 12 pojedinih jedinica. Opcije raspoređujemo uzlaznim redoslijedom:

1,2,3,3,4,4,4,5,5,5,5,7,7,7,7,9,9,10,12.,

Kao rezultat, dobivena je rangirana serija vrijednosti promjenjivog atributa.

Jasno je da je metoda rangiranja kako je ovdje prikazana primjenjiva samo na male uzorke. Uz veliki broj zapažanja, rangiranje postaje teško, jer red je toliko dugačak da gubi smisao.

Uz veliki broj opažanja, uobičajeno je da se uzorak rangira u obliku dvostruke serije, t.j. koji označava učestalost ili učestalost pojedinih varijanti rangiranih serija. Takav dvostruki niz rangiranih vrijednosti neke značajke naziva se varijacijski niz ili distribucijski niz. Najjednostavniji primjer serije varijacija mogu biti podaci koji su gore rangirani, ako su raspoređeni na sljedeći način:

Karakteristične vrijednosti

(opcije) 1 2 3 4 5 7 9 10 12

ponovljivost

(opcija) frekvencije 1 1 2 3 5 4 2 1 1

Serija varijacija pokazuje učestalost s kojom se pojedinačne varijante nalaze u određenoj populaciji, kako su raspoređene, što je od velike važnosti, što omogućuje prosuđivanje obrazaca varijacije i raspona varijacija kvantitativnih karakteristika. Izgradnja varijacijskih serija olakšava izračun ukupnih pokazatelja - aritmetičke sredine i varijance ili disperzije varijante oko njihove srednje vrijednosti - pokazatelja koji karakteriziraju bilo koju statističku populaciju.

Varijacijski nizovi su dvije vrste: diskontinuirani i kontinuirani. Diskontinuirani niz varijacija dobiva se iz raspodjele diskretnih veličina, koje uključuju značajke brojanja. Ako se značajka kontinuirano mijenja, t.j. može uzeti bilo koje vrijednosti u rasponu od minimalne do maksimalne varijante populacije, tada se potonja distribuira u kontinuiranom raspon varijacije.

Da bi se konstruirao varijacijski niz diskretno promjenjivog obilježja, dovoljno je cijeli skup promatranja rasporediti u obliku rangiranog niza, navodeći frekvencije pojedinih varijanti. Kao primjer dajemo podatke koji pokazuju distribuciju veličine 267 dijelova (tablica 5.4)

Tablica 6.1. Raspodjela dijelova po veličini.

Da biste izgradili varijacijski niz kontinuirano promjenjivih značajki, trebate podijeliti cijelu varijaciju od minimalne do maksimalne varijante u zasebne grupe ili intervale (od-do), nazvane klase, a zatim rasporediti sve varijante populacije među tim klasama . Kao rezultat, dobit će se dvostruki varijacijski niz, u kojem se frekvencije više ne odnose na pojedine specifične varijante, već na cijeli interval, t.j. ispada da su frekvencije ne opcije, već klase.

Podjela ukupne varijacije na klase provodi se na ljestvici klasnog intervala, koja bi trebala biti ista za sve klase varijacijskog niza. Veličina intervala klase označava se sa i (od riječi intervalum - interval, udaljenost); određuje se sljedećom formulom

, (6.1)

gdje je: i - interval klase, koji se uzima kao cijeli broj;

- maksimalne i minimalne mogućnosti uzorka;

lg.n je logaritam broja klasa u koje je uzorak podijeljen.

Broj razreda se postavlja proizvoljno, ali uzimajući u obzir činjenicu da broj razreda donekle ovisi o veličini uzorka: što je veća veličina uzorka, to bi trebalo biti više klasa, i obrnuto - s manjim veličinama uzorka, manji je potrebno je pohađati broj časova. Iskustvo je pokazalo da čak i na malim uzorcima, kada je potrebno grupirati varijante u obliku varijantnog niza, ne treba postaviti manje od 5-6 razreda. Ako postoji opcija 100-150, broj razreda se može povećati na 12-15. Ako se agregat sastoji od 200-300 varijanti, onda se dijeli na 15-18 klasa itd. Naravno, ove preporuke su vrlo uvjetne i ne mogu se uzeti kao ustaljeno pravilo.

Prilikom raščlanjivanja na razrede, u svakom konkretnom slučaju, morate računati s nizom različitih okolnosti, pazeći da obrada statističke građe daje što točnije rezultate.

Nakon što se utvrdi interval razreda i uzorak podijeli u razrede, varijanta se knjiži po razredima i određuje se broj varijacija (učestalosti) za svaki razred. Rezultat je varijacijski niz u kojem frekvencije ne pripadaju pojedinačnim varijantama, već određenim klasama. Zbroj svih frekvencija serije varijacija trebao bi biti jednak veličini uzorka, tj

(6.2)

gdje:
-znak zbrajanja;

p je frekvencija.

n je veličina uzorka.

Ako te jednakosti nema, tada je napravljena greška prilikom objavljivanja varijante po razredima, koja se mora otkloniti.

Obično se za knjiženje varijante po razredu izrađuje pomoćna tablica u kojoj se nalaze četiri stupca: 1) klase za ovaj atribut (od - do); 2) - prosječna vrijednost nastave, 3) opcija knjiženja po razredima, 4) učestalost nastave (vidi tablicu 6.2.)

Objavljivanje opcije po razredima zahtijeva puno pažnje. Ne smije se dopustiti da je ista varijanta dvaput označena ili da iste varijante spadaju u različite razrede. Kako bi se izbjegle pogreške u raspodjeli varijante po klasama, preporuča se ne tražiti iste varijante u agregatu, nego ih distribuirati po klasama, što nije isto. Ignoriranje ovog pravila, što se događa u radu neiskusnih istraživača, oduzima puno vremena prilikom objave opcije, a što je najvažnije, dovodi do pogrešaka.

Tablica 6.2. Opcija objave po razredu

Granice klasa

Prosječne vrijednosti klasa (x)

Učestalosti klasa (p),%

apsolutna

srodnika

Nakon što završimo s objavljivanjem varijacije i prebrojimo njihov broj za svaki razred, dobivamo kontinuirani niz varijacija. Mora se pretvoriti u diskontinuirani niz varijacija. Za to, kao što je već napomenuto, uzimamo poluzbroje ekstremnih vrijednosti klasa. Tako se, na primjer, srednja vrijednost prve klase, jednaka 8,8, dobiva na sljedeći način:

(8,6+9,0):2=8,8.

Druga vrijednost (9.3) ovog grafikona izračunava se na sličan način:

(9,01 + 9,59): 2 = 9,3, itd.

Kao rezultat, dobiva se diskontinuirani varijacijski niz koji prikazuje distribuciju prema proučavanom svojstvu (tablica 6.3.)

Tablica 6.3. Varijabilne serije

Grupiranje podataka uzorka u obliku varijacijskog niza ima dvostruku svrhu: prvo, kao pomoćna operacija, potrebno je pri izračunu ukupnih pokazatelja, a drugo, distribucijski nizovi pokazuju pravilnost varijacije obilježja, što je jako važno. Kako bi se ovaj obrazac jasnije izrazio, uobičajeno je prikazati niz varijacija grafički u obliku histograma (slika 6.1.)


Slika 6.1 Distribucija poduzeća prema broju zaposlenih

stupčasti grafikon prikazuje distribuciju varijante s kontinuiranom varijacijom karakteristike. Pravokutnici odgovaraju klasama, a njihove visine odgovaraju broju opcija koje su zatvorene u svakoj klasi. Ako spustimo okomice na os apscise od središta vrhova pravokutnika histograma, a zatim povežemo te točke jedna s drugom, dobivamo graf kontinuirane varijacije, nazvan poligon ili gustoća distribucije.

Prilikom provođenja psihološko-pedagoških istraživanja važna uloga pripisana matematičkim metodama modeliranja procesa i obrade eksperimentalnih podataka. Ove metode uključuju, prije svega, tzv. vjerojatno-statističke metode istraživanja. To je zbog činjenice da na ponašanje pojedinca u procesu njegove aktivnosti i osobe u timu značajno utječu mnogi slučajni čimbenici. Slučajnost ne dopušta opisivanje pojava u okviru determinističkih modela, budući da se očituje kao nedovoljna pravilnost u masovnim pojavama i stoga ne omogućuje pouzdano predviđanje nastanka određenih događaja. Međutim, kada se proučavaju takvi fenomeni, otkrivaju se određeni obrasci. Nepravilnost svojstvena slučajnim događajima, s velikim brojem testova, obično se nadoknađuje pojavom statističke pravilnosti, stabilizacijom učestalosti pojavljivanja slučajnih događaja. Stoga podaci slučajni događaji imaju određenu vjerojatnost. Postoje dvije bitno različite probabilističke i statističke metode psihološko-pedagoškog istraživanja: klasična i neklasična. Mi ćemo izvršiti komparativna analiza ove metode.

Klasična probabilističko-statistička metoda. Klasična probabilističko-statistička metoda istraživanja temelji se na teoriji vjerojatnosti i matematičkoj statistici. Ova metoda se koristi u proučavanju masovnih pojava slučajne prirode, uključuje nekoliko faza, od kojih su glavne sljedeće.

1. Izgradnja vjerojatnosnog modela stvarnosti na temelju analize statističkih podataka (određivanje zakona distribucije slučajne varijable). Naravno, što je veći volumen statističke građe, to su jasnije izražene pravilnosti masovnih slučajnih pojava. Podaci uzorka dobiveni tijekom eksperimenta uvijek su ograničeni i, strogo govoreći, nasumični. U tom smislu, važna se uloga pripisuje generalizaciji uzoraka dobivenih u uzorku, te njihovom proširenju na cjelokupnu opću populaciju objekata. Kako bi se riješio ovaj problem, usvaja se određena hipoteza o prirodi statističke pravilnosti, koja se očituje u fenomenu koji se proučava, na primjer hipoteza da se proučavani fenomen pokorava zakonu normalna distribucija... Ova hipoteza se naziva nultom hipotezom, koja se može pokazati pogrešnom, stoga, zajedno s Nulta hipoteza također se postavlja alternativna ili konkurentska hipoteza. Provjera koliko dobiveni eksperimentalni podaci odgovaraju pojedinoj statističkoj hipotezi provodi se pomoću tzv. neparametarskih statističkih testova ili testova dobrosti. Trenutno se široko koriste kriteriji Kolmogorova, Smirnova, omega-kvadrata i drugi kriteriji dobrote uklapanja. Glavna ideja iza ovih kriterija je mjerenje udaljenosti između funkcija empirijska distribucija i potpuno poznata teorijska funkcija distribucije. Metodologija provjere statističke hipoteze rigorozno je razvijena i izložena u velikom broju radova o matematičkoj statistici.

2. Provođenje potrebnih proračuna matematičkim sredstvima u okviru vjerojatnosnog modela. U skladu s uspostavljenim probabilističkim modelom pojave izračunavaju se karakteristični parametri, na primjer, kao što su matematičko očekivanje ili srednja vrijednost, varijanca, standardna devijacija, mod, medijan, indeks asimetrije itd.

3. Interpretacija vjerojatnosnih i statističkih zaključaka u odnosu na stvarno stanje.

Trenutno je klasična probabilističko-statistička metoda dobro razvijena i široko se koristi u istraživanjima u različitim područjima prirodni, tehnički i društvene znanosti. Detaljan opis bit ove metode i njezina primjena na rješenje specifične zadatke može se naći u velikom broju književnih izvora, npr. u.

Neklasična probabilističko-statistička metoda. Neklasična vjerojatno-statistička metoda istraživanja razlikuje se od klasične po tome što se primjenjuje ne samo na masovne događaje, već i na pojedinačne događaje koji su u osnovi slučajni. Ova metoda može se učinkovito koristiti za analizu ponašanja pojedinca u procesu obavljanja određene aktivnosti, na primjer, u procesu usvajanja znanja od strane učenika. Razmotrit ćemo značajke neklasične probabilističko-statističke metode psihološko-pedagoškog istraživanja na primjeru ponašanja učenika u procesu usvajanja znanja.

U radu je prvi put predložen vjerojatno-statistički model ponašanja učenika u procesu usvajanja znanja. Daljnji razvoj ovaj model je napravljen da radi. Učenje kao vrsta aktivnosti čija je svrha stjecanje znanja, vještina i sposobnosti od strane osobe ovisi o stupnju razvijenosti svijesti učenika. Struktura svijesti uključuje kognitivne procese kao što su osjet, percepcija, pamćenje, mišljenje, mašta. Analiza ovih procesa pokazuje da ih karakteriziraju elementi slučajnosti, zbog nasumične prirode psihičkih i somatskih stanja pojedinca, kao i fiziološki, psihološki i informacijski šumovi tijekom rada mozga. Potonje je dovelo do toga da se, pri opisivanju procesa mišljenja, napusti korištenje modela determinističkog dinamičkog sustava u korist modela slučajnog dinamičkog sustava. To znači da se determinizam svijesti ostvaruje kroz slučaj. Dakle, možemo zaključiti da ljudsko znanje, koje je zapravo proizvod svijesti, ima i slučajan karakter, te se stoga za opisivanje ponašanja svakog pojedinog učenika u procesu usvajanja znanja može koristiti probabilističko-statistička metoda. .

U skladu s ovom metodom, student se identificira distribucijskom funkcijom (gustoćom vjerojatnosti), koja određuje vjerojatnost pronalaska u jediničnom području informacijskog prostora. U procesu učenja ulazi funkcija distribucije s kojom se učenik identificira, razvija se informacijski prostor... Svaki učenik ima individualna svojstva i dopuštena je neovisna lokalizacija (prostorna i kinematička) pojedinaca u odnosu na druge.

Sustav je napisan na temelju zakona održanja vjerojatnosti diferencijalne jednadžbe, koje su jednadžbe kontinuiteta koje povezuju promjenu gustoće vjerojatnosti u jedinici vremena u faznom prostoru (prostor koordinata, brzina i ubrzanja različitih redova) s divergencijom toka gustoće vjerojatnosti u faznom prostoru koji se razmatra. U analizi analitičkih rješenja niza jednadžbi kontinuiteta (funkcija distribucije) koje karakteriziraju ponašanje pojedinih učenika u procesu učenja.

Prilikom dirigiranja eksperimentalno istraživanje ponašanje učenika u procesu usvajanja znanja, koristi se probabilističko i statističko skaliranje u skladu s kojim je skala mjerenja uređeni sustav , gdje je A neki dobro uređen skup objekata (pojedinaca) koji posjeduju značajke koje nas zanimaju (empirijski sustav s odnosima); Ly - funkcionalni prostor (prostor distribucijskih funkcija) s relacijama; F je operacija homomorfnog preslikavanja A u podsustav Ly; G - skupina dopuštenih transformacija; f je operacija preslikavanja funkcija distribucije iz podsustava Ly u numeričke sustave s omjerima n-dimenzionalnog prostora M. Vjerojatno-statističko skaliranje se koristi za pronalaženje i obradu eksperimentalnih funkcija distribucije i uključuje tri stupnja.

1. Pronalaženje eksperimentalnih funkcija distribucije na temelju rezultata kontrolnog događaja, na primjer, ispita. Tipičan pogled na pojedinačne funkcije distribucije pronađene pomoću skale od dvadeset točaka prikazan je na Sl. 1. Metoda za pronalaženje takvih funkcija opisana je u.

2. Preslikavanje funkcija distribucije u brojevni prostor. U tu svrhu izračunavaju se momenti pojedinih funkcija raspodjele. U praksi je u pravilu dovoljno ograničiti se na određivanje momenata prvog reda ( matematičko očekivanje), drugog reda (varijance) i trećeg reda, koji karakterizira asimetriju funkcije distribucije.

3. Rangiranje učenika prema razini znanja na temelju usporedbe momenata različitih redova njihovih pojedinačnih funkcija raspodjele.

Riža. 1. Tipičan pogled na pojedinačne funkcije distribucije studenata koji su dobili opća fizika različite ocjene: 1 - tradicionalna ocjena "2"; 2 - tradicionalna ocjena "3"; 3 - tradicionalna ocjena "4"; 4 - tradicionalna ocjena "5"

Eksperimentalne funkcije distribucije protoka studenata pronađene su na temelju aditivnosti pojedinih funkcija distribucije na (sl. 2).


Riža. 2. Evolucija potpune funkcije distribucije toka studenata, aproksimirana glatkim linijama: 1 - nakon prve godine; 2 - nakon drugog tečaja; 3 - nakon trećeg tečaja; 4 - nakon četvrtog tečaja; 5 - nakon petog tečaja

Analiza podataka prikazanih na sl. Slika 2 pokazuje da se, kako se netko kreće u informacijskom prostoru, funkcije distribucije šire. To je zbog činjenice da se matematička očekivanja funkcija distribucije pojedinaca kreću različitim brzinama, a same se funkcije šire zbog disperzije. Daljnja analiza ovih funkcija distribucije može se provesti u okviru klasične probabilističko-statističke metode.

Rasprava o rezultatima. Analiza klasičnih i neklasičnih probabilističko-statističkih metoda psiholoških i pedagoških istraživanja pokazala je da među njima postoji značajna razlika. Kao što se iz navedenog može razumjeti, klasična metoda je primjenjiva samo na analizu masovnih događaja, a neklasična metoda je primjenjiva i na analizu masovnih i pojedinačnih događaja. S tim u vezi, klasičnu metodu možemo konvencionalno nazvati masovnom probabilističko-statističkom metodom (MVSM), a neklasičnu metodu - individualnom vjerojatnosno-statističkom metodom (IVSM). U 4] je pokazano da se u te svrhe ne može primijeniti niti jedna od klasičnih metoda ocjenjivanja znanja učenika u okviru vjerojatno-statističkog modela pojedinca.

Razmotrimo posebnosti metoda MVSM i IVSM na primjeru mjerenja cjelovitosti znanja učenika. U tu svrhu provest ćemo misaoni eksperiment. Pretpostavimo da imamo veliki broj apsolutno identični u mentalnom i fizičke karakteristike studenti s istim podrijetlom i neka, bez interakcije jedni s drugima, istovremeno sudjeluju u istom kognitivni proces, doživljava potpuno isti strogo deterministički utjecaj. Tada su, u skladu s klasičnim predodžbama o objektima mjerenja, svi učenici trebali dobiti jednake ocjene cjelovitosti znanja s bilo kojom točnošću mjerenja. Međutim, u stvarnosti, s obzirom na dovoljno visoku točnost mjerenja, ocjene cjelovitosti znanja učenika će se razlikovati. Takav rezultat mjerenja nije moguće objasniti u okviru MVSM-a, budući da se u početku pretpostavlja da je utjecaj na apsolutno identične učenike koji nisu u interakciji striktno deterministički. Klasična probabilističko-statistička metoda ne uzima u obzir činjenicu da se determinizam procesa spoznaje ostvaruje kroz slučajnost, svojstvenu svakom pojedincu koji spoznaje svijet oko sebe.

IVSM uzima u obzir slučajnu prirodu ponašanja učenika u procesu usvajanja znanja. Korištenje pojedinačne probabilističko-statističke metode za analizu ponašanja razmatrane idealizirane skupine učenika pokazalo bi da je nemoguće točno naznačiti položaj svakog učenika u informacijskom prostoru, može se reći samo vjerojatnost da se on nađe u jednom ili drugo područje informacijskog prostora. Zapravo, svaki učenik je identificiran individualnom funkcijom distribucije, a njegovi parametri, poput matematičkog očekivanja, varijance, itd., individualni su za svakog učenika. To znači da će pojedinačne funkcije distribucije biti uključene različitim područjima informacijski prostor. Razlog ovakvog ponašanja učenika leži u slučajnoj prirodi procesa učenja.

Međutim, u nizu slučajeva rezultati istraživanja dobiveni u okviru MVSM-a mogu se tumačiti u okviru IVSM-a. Pretpostavimo da učitelj koristi ljestvicu od pet stupnjeva za procjenu znanja učenika. U ovom slučaju pogreška u ocjenjivanju znanja iznosi ± 0,5 bodova. Dakle, kada učenik dobije ocjenu, na primjer, 4 boda, to znači da je njegovo znanje u rasponu od 3,5 do 4,5 boda. Zapravo, položaj pojedinca u informacijskom prostoru u ovom slučaju određen je pravokutnom funkcijom distribucije čija je širina jednaka mjernoj pogrešci ± 0,5 bodova, a procjena je matematičko očekivanje. Ta je pogreška toliko velika da ne dopušta promatranje pravog oblika funkcije distribucije. No, unatoč tako gruboj aproksimaciji funkcije distribucije, proučavanje njezine evolucije omogućuje dobivanje važnih informacija, kako o ponašanju pojedinca tako i o studentskom tijelu u cjelini.

Na rezultat mjerenja cjelovitosti znanja učenika izravno ili neizravno utječe svijest nastavnika (mjera), koju također karakterizira slučajnost. U procesu pedagoških mjerenja, naime, dolazi do interakcije dvaju slučajnih dinamičkih sustava koji identificiraju ponašanje učenika i nastavnika u tom procesu. Razmatra se interakcija studentskog podsustava s fakultetskim podsustavom i pokazuje da je brzina kretanja matematičkog očekivanja pojedinih funkcija distribucije studenata u informacijskom prostoru proporcionalna funkciji utjecaja nastavnog osoblja i obrnuto proporcionalna funkcija inercije koja karakterizira nemogućnost promjene položaja matematičkog očekivanja u prostoru (analog Aristotelovog zakona u mehanici).

Trenutno, unatoč značajnom napretku u razvoju teorijskih i praktičnim temeljima mjerenja tijekom psiholoških i pedagoških istraživanja, problem mjerenja u cjelini još je daleko od rješenja. To je prvenstveno zbog činjenice da još uvijek nema dovoljno informacija o utjecaju svijesti na proces mjerenja. Slična situacija je nastala i pri rješavanju problema mjerenja u kvantnoj mehanici. Dakle, kada se razmatraju konceptualni problemi kvantne teorije mjerenja, kaže se da je rješavanje nekih paradoksa mjerenja u kvantnoj mehanici "... teško moguće bez izravnog uključivanja promatračeve svijesti u teorijski opis kvantnog mjerenja ." Nadalje se kaže da je “... pretpostavka da svijest može određeni događaj učiniti vjerojatnim konzistentna, čak i ako je, prema zakonima fizike ( kvantna mehanika) vjerojatnost ovog događaja je mala. Napravimo važno pojašnjenje formulacije: svijest danog promatrača može učiniti vjerojatnim da će vidjeti ovaj događaj."

Podijelite s prijateljima ili sačuvajte za sebe:

Učitavam...