Erori de eșantionare. Sarcini de rezolvat atunci când se aplică observarea selectivă

Teoria statisticii: note de curs Burkhanova Inessa Viktorovna

3. Erori de eșantionare

3. Erori de eșantionare

Fiecare unitate dintr-un eșantion de observare ar trebui să aibă o șansă egală cu ceilalți să fie selectată - aceasta este baza unui eșantion auto-aleator.

Eșantionare auto-aleatorie - Aceasta este selecția unităților din întreaga populație generală prin tragere la sorți sau într-un alt mod similar.

Principiul aleatoriei este că includerea sau excluderea unui obiect din eșantion nu poate fi influențată de alt factor decât caz.

Partajare eșantionEste raportul dintre numărul de unități din eșantion și numărul de unități din populația generală:

Selecția aleatorie adecvată în forma sa pură este cea inițială dintre toate celelalte tipuri de selecție; conține și pune în aplicare principiile de bază ale observației statistice selective.

Cele două tipuri principale de indicatori generalizați care sunt utilizați în metoda de eșantionare sunt valoarea medie caracteristica cantitativă și valoarea relativă a caracteristicii alternative.

Fracțiunea eșantionului (w), sau particulară, este determinată de raportul numărului de unități cu caracteristica studiată m, la numărul total de unități ale eșantionului (n):

Pentru a caracteriza fiabilitatea indicatorilor de eșantionare, se disting erorile de eșantionare medii și marginale.

Eroarea de eșantionare, numită și eroarea de reprezentativitate, este diferența dintre eșantionul corespunzător și caracteristicile generale:

?x \u003d | x - x |;

?w \u003d | x - p |.

Eroarea de eșantionare este inerentă numai în observațiile eșantionului

Media eșantionului și ponderea eșantionului - acestea sunt variabile aleatorii care iau valori diferite în funcție de unitățile populației statistice studiate, care au fost incluse în eșantion. În consecință, erorile de eșantionare sunt, de asemenea, valori aleatorii și pot lua, de asemenea, valori diferite. Prin urmare, se determină media posibilelor erori - eroarea medie de eșantionare.

Eroarea medie de eșantionare este determinată de dimensiunea eșantionului: cu cât este mai mare numărul, celelalte lucruri fiind egale, cu atât este mai mică eroarea medie de eșantionare. Acoperind un număr din ce în ce mai mare de unități ale populației generale cu un sondaj de sondaj, caracterizăm din ce în ce mai exact întreaga populație generală.

Eroarea medie de eșantionare depinde de gradul de variație al trăsăturii studiate, la rândul său, gradul de variație este caracterizat de varianță? 2 sau w (l - w) - pentru o caracteristică alternativă. Cu cât variația caracteristicii și varianța este mai mică, cu atât este mai mică eroarea medie de eșantionare și invers.

Pentru reeșantionarea aleatorie, erorile medii sunt calculate teoretic folosind următoarele formule:

1) pentru trăsătura cantitativă medie:

unde? 2 - valoarea medie a varianței atributului cantitativ.

2) pentru o acțiune (caracteristică alternativă):

Deci, cum este varianța unei trăsături în populația generală? 2 nu se cunoaște exact, în practică folosesc valoarea varianței S 2 calculată pentru populația eșantion pe baza legii numărului mare, conform căreia populația eșantion cu o dimensiune suficient de mare a eșantionului reproduce caracteristicile populației generale cu precizie.

Formulele pentru eroarea medie de eșantionare pentru eșantionarea aleatorie sunt după cum urmează. Pentru valoarea medie a unei trăsături cantitative: varianța generală este exprimată prin electiv prin următorul raport:

unde S 2 este valoarea varianței.

Prelevare mecanică- Aceasta este selecția unităților dintr-un eșantion din populația generală, care este împărțită în grupuri egale pe bază neutră; se face în așa fel încât să fie selectată o singură unitate din fiecare astfel de grup.

În cazul selecției mecanice, unitățile populației statistice studiate sunt dispuse preliminar într-o anumită ordine, după care un anumit număr de unități sunt selectate mecanic la un anumit interval. Mai mult, mărimea intervalului în populația generală este egală cu reciprocitatea eșantionului.

Cu o populație suficient de mare, selecția mecanică în ceea ce privește acuratețea rezultatelor este aproape de auto-aleatoare. Prin urmare, pentru a determina eroarea medie de selecție mecanică, se folosesc formulele pentru eșantionarea auto-aleatorie.

Pentru selectarea unităților dintr-o populație eterogenă, se folosește așa-numitul eșantion tipic, acesta este utilizat atunci când toate unitățile populației generale pot fi împărțite în mai multe grupuri calitative omogene, similare, în funcție de caracteristicile de care depind indicatorii studiați.

Apoi, din fiecare grup tipic, selectarea individuală a unităților în populația eșantionului se face printr-o eșantionare auto-aleatorie sau mecanică.

Eșantionarea tipică este de obicei utilizată atunci când se studiază complexe populații statistice.

Eșantionarea tipică oferă rezultate mai precise. Tipificarea populației generale asigură reprezentativitatea unui astfel de eșantion, reprezentarea fiecărui grup tipologic din acesta, ceea ce face posibilă excluderea influenței varianței intergrupului asupra erorii medii de eșantionare. Prin urmare, atunci când se determină eroarea medie a unui eșantion tipic, media variațiilor intragrup este utilizată ca indicator al variației.

Eșantionarea în serie implică selecția aleatorie dintr-o populație generală de grupuri de dimensiuni egale pentru a supune toate unitățile la observație în astfel de grupuri.

Deoarece toate unitățile fără excepție sunt examinate în cadrul grupurilor (serii), eroarea medie de eșantionare (la selectarea seriilor de dimensiuni egale) depinde numai de varianța intergrup (inter-serie).

Din cartea Buget personal. Banii sub control autor Serghei Makarov

Greșelile unui rezident Puteți trata greșelile în moduri diferite: vă puteți teme să le comiteți și vă faceți griji pentru fiecare dintre ele, vă puteți bucura de greșelile și crizele dvs. ca indicatori pe calea succesului și a victoriilor personale. Există doar un singur lucru în mod invariabil în legătură cu greșelile - trebuie să plătești pentru ele.

Din cartea Manual de audit intern. Riscuri și procese de afaceri autorul Kryshkin Oleg

Eșantionarea Procedura de eșantionare este o parte integrantă a unui proiect de audit intern. Este descris în detaliu în diferite surse pe tema auditului. Cu toate acestea, în multe privințe, astfel de descrieri sunt academice. Propun să mă concentrez pe acestea

Din cartea Psihologia investiției [Cum să nu mai faci prostie cu banii tăi] autor Richards Karl

Greșelile de investiții sunt greșeli ale investitorilor Sunt acum mai convins ca niciodată că toate greșelile în investiții sunt de fapt greșeli ale investitorilor. Investiția nu face greșeli. Spre deosebire de investitori: investiția este o alegere. Este vorba despre asta

autor Shcherbina Lidia Vladimirovna

29. Determinarea mărimii necesare a eșantionului Unul dintre principiile științifice din teoria metodei de eșantionare este asigurarea unui număr suficient de unități eșantionate. O scădere a erorii standard a eșantionului este întotdeauna asociată cu o creștere a dimensiunii eșantionului. Plată

Din carte Teoria generală statistici autor Shcherbina Lidia Vladimirovna

30. Metode de selecție și tipuri de eșantionare. Eșantionare efectivă aleatorie În teoria metodei de eșantionare, au fost dezvoltate diferite metode de eșantionare și tipuri de eșantionare pentru a asigura reprezentativitatea. Metoda de selecție este înțeleasă ca ordinea de selecție a unităților din populația generală.

Din cartea Teoria generală a statisticii autor Shcherbina Lidia Vladimirovna

31. Eșantionare mecanică și tipică Într-o eșantionare pur mecanică, întregul set general de unități ar trebui prezentat în primul rând sub forma unei liste de unități de eșantionare, compilate într-o anumită ordine, neutre în raport cu atributul studiat. Apoi lista

Din cartea Teoria generală a statisticii autor Shcherbina Lidia Vladimirovna

32. Eșantionarea în serie și eșantionarea Eșantionarea în serie (cuibărită) este un tip de formare a unei populații de eșantioane, atunci când nu unitățile care urmează să fie inspectate, ci grupurile de unități (serii, cuiburi) sunt selectate aleatoriu. În seria selectată (cuiburi)

Din cartea Teoria generală a statisticii autor Shcherbina Lidia Vladimirovna

33. Eșantionare în mai multe etape, multifază și interpenetrare. Particularitatea eșantionării în mai multe etape constă în faptul că populația eșantionului se formează treptat, în etape de selecție. În prima etapă, folosind o metodă predeterminată și un tip de selecție

autor Konik Nina Vladimirovna

3. Determinarea dimensiunii necesare a eșantionului Unul dintre principiile științifice din teoria eșantionării este asigurarea unui număr suficient de unități eșantionate. Teoretic, necesitatea respectării acestui principiu este prezentată în dovezile teoremelor limitei

Din cartea General Theory of Statistics: Lecture Notes autor Konik Nina Vladimirovna

4. Metode de selecție și tipuri de eșantionare În teoria eșantionării, au fost dezvoltate diferite metode de selecție și tipuri de eșantionare pentru a asigura reprezentativitatea. Metoda de selecție este înțeleasă ca ordinea în care unitățile sunt selectate din populația generală. Există două metode de selecție: repetate

Din cartea Teoria statisticii autor Burkhanova Inessa Viktorovna

36. Erori de eșantionare Eșantionarea auto-aleatorie este selectarea unităților din întreaga populație prin lot sau metodă similară. Principiul aleatoriei este că includerea sau excluderea unui obiect din eșantion nu poate fi influențată de niciun factor,

Din cartea Business Correspondence: tutorial autor Kirsanova Maria Vladimirovna

Greșeli lexicale 1. Utilizarea incorectă a cuvintelor și a termenilor Cea mai mare parte a greșelilor din literele de afaceri sunt lexicale. Lipsa de alfabetizare duce nu numai la prostii curioase, ci și la absurditate. Termeni separați și cuvinte de jargon profesionist

Din carte Nouă eră - vechi griji: economie politică autor Yasin Evgeny Grigorievich

5 Greșelile noastre Insistăm: cursul ales al reformelor pieței a fost corect. Și nu au eșuat deloc, s-au mai poticnit încă o dată. Dar au fost greșeli și omisiuni. Acestea sunt atât greșelile noastre, cât și greșelile conducerii țării, pe care nu am putut să le prevenim. Erori - în multe feluri

de Curtis Face

Importanța dimensiunii eșantionului Așa cum am spus, oamenii tind să se concentreze prea mult pe apariții rare ale unui fenomen, chiar dacă este statistic imposibil să extragem multe informații din câteva cazuri. Acesta este motivul principal

Din cartea Calea țestoaselor. De la diletanti la comercianti legendari de Curtis Face

Eșantioane reprezentative Reprezentativitatea testelor noastre pentru prezicerea viitorului este determinată de doi factori: - Numărul piețelor: testele efectuate pe diferite piețe includ probabil piețe cu grade diferite de tipuri de volatilitate

Din cartea Calea țestoaselor. De la diletanti la comercianti legendari de Curtis Face

Mărimea eșantionului Conceptul de mărime a eșantionului este simplu: pentru a face concluzii valabile din punct de vedere statistic, trebuie să aveți un eșantion suficient de mare. Cu cât eșantionul este mai mic, cu atât concluziile pot fi trase mai aspre; cu cât eșantionul este mai mare, cu atât concluziile sunt mai bune. Nu este

Să luăm în considerare în detaliu metodele de mai sus de formare a populației eșantion și erorile de reprezentativitate rezultate.

Eșantionarea corectă aleatorie se bazează pe selectarea aleatorie a unităților din populația generală fără elemente sistematice. Din punct de vedere tehnic, selecția aleatorie adecvată se efectuează prin tragere la sorți (de exemplu, trageri la loterie) sau conform unui tabel de numere aleatorii.

Selecție aleatorie pură în practică observarea selectivă este rar folosit, dar este cel inițial printre alte tipuri de selecție, implementează principiile de bază ale observației selective. Să luăm în considerare câteva întrebări despre teoria metodei de eșantionare și formula de eroare pentru un eșantion simplu aleatoriu.

Eroarea de observare a eșantionului este diferența dintre valoarea unui parametru în populația generală și valoarea sa calculată din rezultatele observării eșantionului. Pentru o caracteristică cantitativă medie, se determină eroarea de eșantionare

Indicatorul se numește eroare de eșantionare marginală.

Media eșantionului este o variabilă aleatorie care poate lua valori diferite, în funcție de unitățile din eșantion. Prin urmare, erorile de eșantionare sunt, de asemenea, valori aleatorii și pot lua valori diferite. Prin urmare, se determină media posibilelor erori - eroarea medie de eșantionare, care depinde de:

  • 1) dimensiunea eșantionului: cu cât numărul este mai mare, cu atât este mai mică valoarea erorii medii;
  • 2) gradul de schimbare a trăsăturii studiate: cu cât este mai mică varianța trăsăturii și, în consecință, varianța, cu atât este mai mică eroarea medie de eșantionare.

Pentru re-eșantionarea aleatorie, se calculează eroarea medie

În practică, varianța generală nu este cunoscută exact, dar în teoria probabilității s-a dovedit că

Deoarece valoarea pentru n suficient de mare este aproape de 1, putem presupune că. Atunci se poate calcula eroarea medie de eșantionare:

Dar în cazurile unui eșantion mic (pentru n30), trebuie luat în considerare coeficientul, iar eroarea medie a unui eșantion mic ar trebui calculată folosind formula

În cazul unei eșantionări aleatorii non-repetate, formulele date sunt corectate de valoare. Atunci eroarea medie a eșantionării non-repetitive este:

pentru că este întotdeauna mai mic, atunci multiplicatorul () este întotdeauna mai mic decât 1. Aceasta înseamnă că eroarea medie în selecția non-repetitivă este întotdeauna mai mică decât în \u200b\u200bselecția repetată.

Eșantionarea mecanică este utilizată atunci când populația generală este ordonată într-un fel (de exemplu, liste alfabetice ale alegătorilor, numere de telefon, numere de case, apartamente). Selecția unităților se efectuează la un anumit interval, care este egal cu reciprocitatea procentului eșantionului. Deci, cu un eșantion de 2%, fiecare 50 de unități \u003d 1 / 0,02 este selectată, cu 5% fiecare 1 / 0,05 \u003d 20 unitate din populația generală.

Originea este selectată în diferite moduri: aleatoriu, de la mijlocul intervalului, cu o modificare a originii. Principalul lucru aici este evitarea erorilor sistematice. De exemplu, cu un eșantion de 5%, dacă prima unitate este 13, apoi următoarele 33, 53, 73 etc.

Selecția mecanică este aproape de eșantionarea aleatorie în ceea ce privește precizia. Prin urmare, pentru a determina eroarea medie a eșantionării mecanice, se folosesc formulele de selecție aleatorie adecvată.

Într-o selecție tipică, populația chestionată este împărțită preliminar în grupuri omogene de același tip. De exemplu, atunci când studiați întreprinderile, acestea pot fi industrii, subsectoare; atunci când studiați populația, acestea pot fi regiuni, grupuri sociale sau grupe de vârstă. Apoi, o selecție independentă din fiecare grup este efectuată mecanic sau într-un mod pur aleatoriu.

Eșantionarea tipică oferă rezultate mai precise decât alte metode. Tipificarea populației generale asigură reprezentarea fiecărui grup tipologic în eșantion, ceea ce face posibilă excluderea influenței varianței intergrupului asupra erorii medii de eșantionare. În consecință, atunci când se constată eroarea unui eșantion tipic conform regulii pentru adăugarea varianțelor (), este necesar să se ia în considerare doar media varianțelor grupului. Apoi, eroarea medie de eșantionare:

la re-selectare

cu selecție fără repetare

unde este media varianțelor din cadrul grupului din eșantion.

Eșantionarea în serie (sau în grup) este utilizată atunci când populația este împărțită în serii sau grupuri înainte de începerea unui sondaj. Aceste serii pot fi ambalaje de produse finite, grupuri de studenți, brigăzi. Seriile pentru sondaj sunt selectate mecanic sau într-un mod aleatoriu adecvat și, în cadrul seriei, se efectuează un sondaj continuu al unităților. Prin urmare, eroarea medie de eșantionare depinde doar de varianța intergrup (inter-serie), care este calculată prin formula:

unde r este numărul de serii selectate;

Media seriei a i-a.

Se calculează eroarea medie de eșantionare în serie:

la re-selectare

cu selecție fără repetare

unde R este numărul total de serii.

Selecția combinată este o combinație a metodelor de selecție luate în considerare.

Eroarea medie de eșantionare pentru orice metodă de selecție depinde în principal de mărimea absolută a eșantionului și, într-o măsură mai mică, de procentul eșantionului. Să presupunem că 225 de observații sunt efectuate în primul caz dintr-o populație generală de 4500 de unități și în al doilea din 225000 de unități. Variațiile în ambele cazuri sunt egale cu 25. Apoi, în primul caz cu eșantionare de 5%, eroarea de eșantionare va fi:

În al doilea caz, cu o selecție de 0,1%, acesta va fi egal cu:

Astfel, cu o scădere de 50 de ori a procentului eșantionului, eroarea de eșantionare a crescut nesemnificativ, deoarece dimensiunea eșantionului nu s-a modificat.

Să presupunem că mărimea eșantionului este mărită la 625 de observații. În acest caz, eroarea de eșantionare este:

O creștere a eșantionului cu un factor de 2,8 cu aceeași dimensiune a populației generale reduce dimensiunea erorii de eșantionare de peste 1,6 ori.

Eroare de eșantionareeste o discrepanță care apare în mod obiectiv între caracteristicile eșantionului și populația generală. Depinde de o serie de factori: gradul de variație a trăsăturii studiate, mărimea eșantionului, metoda de selectare a unităților din eșantion, nivelul acceptat de fiabilitate a rezultatului cercetării.

Pentru un eșantion reprezentativ, este important să vă asigurați că selecția este aleatorie, astfel încât toate obiectele din populația generală să aibă o probabilitate egală de a fi incluse în eșantion. Pentru a asigura un eșantion reprezentativ, sunt utilizate următoarele metode de selecție:

· adecvat accidental eșantionare (simplă aleatorie) (primul obiect aleatoriu este selectat secvențial);

· mecanic eșantionare (sistematică);

· tipic eșantionare (stratificată, stratificată) (obiectele sunt selectate proporțional cu reprezentarea diferitelor tipuri de obiecte în populația generală);

· serial (cuibărit) eșantionare.

Selecția unităților din populația eșantionului poate fi repetată sau nerepetată. Cand re-selectarese analizează unitatea din eșantion, adică înregistrarea valorilor caracteristicilor sale, este returnată populației generale și, împreună cu alte unități, participă la procedura de selecție ulterioară. Cand selecție irepetabilăunitatea inclusă în eșantion este examinată și nu participă la procedura de selecție ulterioară

Observarea eșantionului este întotdeauna asociată cu erori, deoarece numărul de unități eșantionate nu este egal cu populația inițială (generală). Erorile de eșantionare aleatorie sunt cauzate de acțiunea unor factori aleatori care nu conțin elemente sistematice în direcția influențării caracteristicilor de eșantionare calculate. Chiar și cu respectarea strictă a tuturor principiilor de formare a populației eșantionului, eșantionul și caracteristicile generale vor diferi oarecum. Prin urmare, erorile aleatorii rezultate ar trebui să fie estimate statistic și luate în considerare la extinderea rezultatelor observării eșantionului la întreaga populație generală. Estimarea unor astfel de erori este principala problemă rezolvată în teoria observării eșantionului. Sarcină inversă este definiția unei astfel de dimensiuni minime necesare a eșantionului, în care eroarea nu depășește o anumită valoare. Materialul din această secțiune are ca scop dezvoltarea abilităților în rezolvarea acestor probleme.

Eșantionare corespunzătoare... Esența sa constă în selectarea unităților din populația generală ca întreg, fără a o împărți în grupuri, subgrupuri sau serii de unități individuale. În acest caz, unitățile sunt selectate într-o ordine aleatorie, care nu depinde nici de succesiunea aranjării unităților în agregat, nici de valorile atributelor lor.

După ce selecția este efectuată folosind unul dintre algoritmii care implementează principiul aleatoriei sau pe baza unui tabel de numere aleatorii, se determină limitele caracteristicilor generale. Pentru aceasta, media și eroare marginală prelevarea de probe.

Eroare medie a eșantionării repetate aleatorii corespunzătoare determinată de formulă

unde σ este abaterea standard a trăsăturii studiate;

n este volumul (numărul de unități) al eșantionului.

Eroare de eșantionare marginală asociat cu un anumit nivel de probabilitate. La rezolvarea problemelor prezentate mai jos, probabilitatea necesară este 0,954 (t \u003d 2) sau 0,997 (t \u003d 3). Luând în considerare nivelul ales de probabilitate și valoarea corespunzătoare a t, eroarea de eșantionare marginală va fi:

Apoi, se poate argumenta că, pentru o anumită probabilitate, media generală se va încadra în următoarele limite:

La definirea limitelor cota generală atunci când se calculează eroarea medie de eșantionare, se utilizează varianța atributului alternativ, care se calculează utilizând următoarea formulă:

unde w este o proporție de eșantion, adică proporția de unități cu o anumită variantă sau variante ale trăsăturii studiate.

La rezolvarea problemelor individuale, este necesar să se ia în considerare faptul că, cu o varianță necunoscută a unei caracteristici alternative, se poate utiliza valoarea sa maximă posibilă, egală cu 0,25.

Exemplu... Ca rezultat al unui sondaj de sondaj al populației șomere în căutarea unui loc de muncă, realizat pe baza reeșantionarea auto-aleatorieau fost obținute datele date în tabel. 1.14.

Tabelul 1.14

Rezultatele unui sondaj de sondaj al populației șomere

Cu o probabilitate de 0,954, definiți limitele:

a) vârsta medie a populației șomere;

b) ponderea (greutatea specifică) persoanelor sub 25 de ani în numărul total al populației șomere.

Decizie. Pentru a determina eroarea medie de eșantionare, este necesar, în primul rând, să se determine media eșantionului și varianța trăsăturii studiate. Pentru aceasta, la mod manual calcul, se recomandă construirea tabelului 1.15.

Tabelul 1.15

Calculul vârstei medii a populației șomere și a varianței

Pe baza datelor din tabel, se calculează indicatorii necesari:

Proba medie:

;

Varianță:

Deviația rădăcină-medie-pătrat:

.

Eroarea medie de eșantionare va fi:

al anului.

Definim cu probabilitate 0.954 ( t\u003d 2) eroare de eșantionare marginală:

al anului.

Să stabilim limitele mediei generale: (41,2 - 1,6) (41,2 + 1,6) sau:

Astfel, pe baza sondajului-sondaj efectuat cu o probabilitate de 0,954, putem concluziona că vârsta medie a populației șomere în căutarea unui loc de muncă este cuprinsă între 40 și 43 de ani.

Pentru a răspunde la întrebarea pusă la punctul "b" din acest exemplu, vom determina proporția persoanelor cu vârsta sub 25 de ani folosind datele eșantionului și vom calcula varianța proporției:

Să calculăm eroarea medie de eșantionare:

Eroarea de eșantionare marginală cu o probabilitate dată va fi:

Să definim limitele cotei generale:

Prin urmare, cu o probabilitate de 0,954, se poate argumenta că ponderea persoanelor sub vârsta de 25 de ani în totalul populației șomere variază de la 3,9 la 1 1,9%.

La calcularea erorii medii adecvat aleatoriu nerepetabil eșantionarea, este necesar să se ia în considerare corecția pentru eșantionare care nu se repetă:

unde N este volumul (numărul de unități) al populației generale /

Volumul necesar de eșantionare auto-aleatorie determinat de formula:

Dacă selecția nu se repetă, atunci formula ia următoarea formă:

Rezultatul obținut folosind aceste formule este întotdeauna rotunjit la cea mai apropiată valoare întreagă.

Exemplu.Este necesar să se determine câți elevi din clasele întâi ale școlilor din district trebuie selectați în ordinea eșantionării efective repetitive aleatorii pentru a determina limitele înălțimii medii a elevilor din clasa întâi cu o eroare marginală de 2 cm cu o probabilitate de 0.997.în conformitate cu rezultatele unui sondaj similar într-o altă zonă a fost de 24.

Decizie. Dimensiunea eșantionului necesară la un nivel de probabilitate de 0,997 ( t \u003d 3) va fi:

Astfel, pentru a obține date despre înălțimea medie a elevilor de clasa întâi cu o precizie dată, este necesar să se examineze 52 de școlari.

Prelevare mecanică... Această eșantionare constă în selectarea unităților din lista generală a unităților populației generale la intervale egale în conformitate cu procentul stabilit de selecție. La rezolvarea problemelor pentru a determina eroarea medie a unei probe mecanice, precum și numărul necesar al acesteia, ar trebui folosite formulele de mai sus, care sunt utilizate în cazul unei selecții aleatorii, nerepetabile.

Deci, cu un eșantion de 2%, este selectată fiecare a 50-a unitate (1: 0,02), cu un eșantion de 5%, fiecare a 20-a unitate (1: 0,05) etc.

Astfel, în conformitate cu ponderea acceptată de selecție, populația generală este, așadar, împărțită mecanic în grupuri de dimensiuni egale. Doar o unitate este selectată din fiecare grup.

O caracteristică importantă eșantionarea mecanică este că formarea unei populații eșantion poate fi efectuată fără a recurge la compilarea listelor. În practică, este adesea utilizată ordinea în care sunt plasate efectiv unitățile populației generale. De exemplu, secvența de ieșire a produselor finite dintr-un transportor sau linia de producție, ordinea plasării unităților unui lot de mărfuri în timpul depozitării, transportului, vânzării etc.

Eșantion tipic. Această eșantionare este utilizată atunci când unitățile populației generale sunt grupate în mai multe grupuri tipice mari. Selectarea unităților din eșantion se face în cadrul acestor grupuri proporțional cu volumul acestora pe baza utilizării eșantionării corespunzătoare aleatorii sau mecanice (dacă sunt disponibile informațiile necesare, selecția se poate face și proporțional cu variația trăsătură studiată în grupuri).

Eșantionarea tipică este de obicei utilizată atunci când se studiază populații statistice complexe. De exemplu, cu un sondaj eșantion al productivității muncii lucrătorilor din comerț, constând în grupuri separate pe calificări.

O caracteristică importantă a unui eșantion tipic este că oferă rezultate mai precise în comparație cu alte metode de selectare a unităților dintr-o populație de eșantion.

Eroarea medie a unui eșantion tipic este determinată de formule:

(re-selectare);

(selecție fără repetare),

unde este media varianței intragrup.

Exemplu... Pentru a studia veniturile populației din trei raioane ale regiunii, a fost format un eșantion de 2%, proporțional cu populația acestor raioane. Rezultatele sunt prezentate în tabel. 16.

Tabelul 16

Rezultatele unui sondaj de sondaj al veniturilor populației

Este necesar să se determine limitele venitului mediu pe cap de locuitor al populației din întreaga regiune la un nivel de probabilitate de 0,997.

Decizie. Să calculăm media varianțelor intragrup:

unde N i - volum eu-și grupuri;

n, este dimensiunea eșantionului din grupul i.

Eșantionare în serie... Acest eșantion este utilizat în cazurile în care unitățile populației studiate sunt combinate în grupuri mici sau serii de dimensiuni egale. Unitatea de eșantionare în acest caz este seria. Seriile sunt selectate utilizând eșantionare aleatorie sau mecanică, iar în cadrul seriei selectate, toate unitățile fără excepție sunt examinate.

Calculul erorii medii a unui eșantion serial se bazează pe varianța intergrup:

(re-selectare);

(selecție fără repetare),

unde x i - numărul de persoane selectate eu - serie;

R - numărul total de serii.

Varianța între grupuri pentru grupuri de dimensiuni egale se calculează după cum urmează:

unde x i- in medie seria i;

x - media generală pentru întregul eșantion.

Exemplu... Pentru a controla calitatea componentelor dintr-un lot de produse ambalate în 50 de cutii a câte 20 de produse, a fost realizată o probă în serie de 10%. Pentru cutiile incluse în eșantion, deviația medie a parametrilor produsului de la normă, respectiv, a fost de 9 mm, 11, 12, 8 și 14 mm. Cu o probabilitate de 0,954, determinați abaterea medie a parametrilor pentru întregul lot ca întreg.

Decizie. Proba medie:

mm

Varianță intergrup:

Având în vedere probabilitatea stabilită R = 0,954 (t\u003d 2) eroarea de eșantionare marginală va fi:

mm

Calculele făcute ne permit să concluzionăm că deviația medie a parametrilor tuturor produselor de la normă se află în următoarele intervale:

Următoarele formule sunt utilizate pentru a determina volumul necesar al unei probe seriale pentru o eroare marginală dată:

(re-selectare);

(selecție fără repetare).

Între indicatorii populației eșantion și indicatorii (parametrii) necesari ai populației generale, de regulă, există unele dezacorduri, care se numesc erori de eșantionare.Eroarea generală de eșantionare constă din două tipuri de erori: erori de înregistrare și erori de reprezentativitate.

Erorile de înregistrare sunt inerente oricărei observații statistice și apariția lor poate fi cauzată de neatenția înregistratorului, inexactitatea calculelor, imperfecțiunea instrumentelor de măsurare etc.

Erorile de reprezentativitate sunt inerente numai observației selective și se datorează însăși naturii sale, întrucât, indiferent cât de atentă și corectă este selectarea unităților, indicatorii medii și relativi ai populației eșantionului vor diferi întotdeauna într-o oarecare măsură de indicatorii corespunzători ai populației generale.

Distingeți între erori sistematice și aleatorii de reprezentativitate. Erorile sistematice de reprezentativitate sunt inexactități care apar din cauza nerespectării condițiilor de selectare a unităților din eșantion, nefiind o oportunitate egală pentru fiecare unitate a populației generale de a fi inclusă în eșantion. Erorile aleatorii de reprezentativitate sunt erori care apar datorită faptului că eșantionul nu reproduce cu precizie caracteristicile populației generale (medie, proporție, varianță etc.) datorită naturii discontinue a sondajului.

Dacă se respectă principiul selecției aleatorii, mărimea erorii de eșantionare depinde în primul rând de mărimea eșantionului. Cu cât este mai mare dimensiunea eșantionului, alte lucruri fiind egale, cu atât este mai mică eroarea de eșantionare. Cu o dimensiune mare a eșantionului, acțiunea legii numerelor mari este mai pronunțată, potrivit căreia: cu o probabilitate arbitrară apropiată de unitate, se poate argumenta că, cu o dimensiune suficient de mare a eșantionului și o varianță limitată, caracteristicile eșantionului (ponderea medie) vor diferi în mod arbitrar puțin de caracteristicile generale corespunzătoare. ...

Mărimile erorii de eșantionare sunt, de asemenea, direct legate de gradul de variație a trăsăturii studiate, iar gradul de variație, așa cum sa menționat mai sus, în statistici este caracterizat de dimensiunea varianței (dispersiei): cu cât este mai mică varianța, cu atât este mai mică eroarea de eșantionare, cu atât sunt mai fiabile concluziile statistice. Prin urmare, în practică, varianța este echivalată cu eroarea de eșantionare.

Deoarece parametrul populației generale este valoarea dorită și este necunoscut, este necesar să ne concentrăm nu pe o eroare specifică, ci pe media tuturor eșantioanelor posibile.

Dacă selectăm mai multe seturi de eșantioane din populația generală, atunci fiecare eșantion obținut va da o valoare diferită pentru eroarea specifică.

Rădăcină medie pătrată /și calculate din toate valorile posibile ale erorilor specifice (;) vor fi:

unde * și - eșantion înseamnă; x - media generală;)] - numărul de eșantioane după valoarea є1 \u003d ~ si - x.

Abaterea standard a eșantionului înseamnă de la media generală se numește eroarea medie a eșantionului.

Dependența magnitudinii erorii de eșantionare de mărimea acesteia și de gradul de variație al atributului este exprimată în formula erorii medii de eșantionare / și.

Eroarea medie pătrată (varianța mediilor eșantionului) este direct proporțională cu varianțaO sută și este invers proporțional cu dimensiunea eșantionului n:

unde este varianța trăsăturii în populația generală.

De aici rezultă eroarea medie în vedere generala determinat de formula:

Deci, după determinarea abaterii standard de la eșantion, este posibil să se stabilească valoarea erorii medii de eșantionare, a cărei valoare, după cum urmează din formulă, este cu atât mai mare, cu cât variația variabilei aleatoare este mai mare și cu cât este mai mică, cu atât este mai mare dimensiunea eșantionului.

Prin urmare, pe măsură ce dimensiunea eșantionului crește, dimensiunea erorii medii scade. Dacă, de exemplu, este necesar să se reducă eroarea de eșantionare medie la jumătate, atunci dimensiunea eșantionului ar trebui mărită de patru ori; dacă este necesar să se reducă eroarea de eșantionare de trei ori, atunci dimensiunea eșantionului ar trebui mărită de nouă ori etc.

În calculele practice, se utilizează două formule pentru eroarea de eșantionare medie pentru medie și pentru proporție.

Într-un studiu selectiv al indicatorilor medii, formula erorii medii este următoarea:

Când studiați indicatori relativi (caracteristici particulare) formula pentru eroarea medie este:

under - ponderea caracteristicii în populația generală.

Aplicarea formulelor de mai sus pentru eroarea medie presupune că varianța generală și fracția generală sunt cunoscute. Cu toate acestea, în realitate, acești indicatori sunt necunoscuți și nu pot fi calculați din cauza lipsei de date privind populația generală. Prin urmare, este necesar să se înlocuiască varianța generală și cota generală cu alte valori apropiate acestora.

În statistica matematică, s-a dovedit că astfel de valori pot fi varianța eșantionului (st) și ponderea eșantionului (co).

Cu toate acestea, formulele medii de eroare pot fi scrise după cum urmează:

Aceste formule oferă mijloacele pentru a determina eroarea medie de eșantionare. Aplicarea practică a eșantionării simple aleatorii este limitată. În primul rând, este practic impracticabil și, uneori, este imposibil să reexaminăm aceleași unități. Utilizarea eșantionării repetate în locul eșantionării repetate este, de asemenea, dictată de cerința de a crește gradul de precizie și fiabilitate a eșantionului. Prin urmare, în practică, se folosește adesea metoda selecției aleatorii nerepetabile. Conform acestei metode de selecție, unitatea de populație selectată pentru eșantion nu participă la o selecție suplimentară. Unitățile sunt selectate din populația generală, reduse cu numărul de unități selectate anterior. Prin urmare, în legătură cu modificarea dimensiunii populației generale după fiecare selecție și probabilitatea selecției pentru unitățile care rămân, un factor de corecție este introdus în formulele pentru eroarea medie de eșantionare

unde N este dimensiunea populației generale; p - mărimea eșantionului. Pentru o valoare suficient de mare de N, unitatea din numitor poate fi neglijată. Atunci

În consecință, formulele pentru eroarea de eșantionare medie pentru selecția non-repetitivă pentru medie și, respectiv, pentru proporție, sunt

Pentru că p este întotdeauna mai mic decât M, atunci factorul suplimentar este întotdeauna mai mic decât unul. În consecință, valoarea absolută a erorii de eșantionare va fi întotdeauna mai mică la eșantionarea fără repetare decât la eșantionarea repetată.

Dacă dimensiunea eșantionului este suficient de mare, atunci valoarea 1 ^ este aproape de unitate și, prin urmare, poate fi neglijată. Apoi, eroarea medie a eșantionării repetate aleatorii este determinată de formula eșantionării repetate aleatorii efective.

Să calculăm pentru exemplul nostru eroarea medie pentru randament și proporția de parcele cu un randament de 25 c / ha sau mai mult.

Eroare medie de eșantionare

a) randament mediu de orz

Randamentul mediu de orz în populația generală х -G ^ \u003d 25,1 ± 0,12 c / ha, adică este în intervalul de la 24,98 la 25,22 c / ha.

Ponderea parcelelor cu un randament de 25 kg / ha sau mai mult în populația generală p

T- ^ T \u003d 0,80 ± 0,07, adică este în intervalul de la 73 la 87%.

Eroarea medie de eșantionare arată posibilele abateri ale caracteristicilor eșantionului de la caracteristicile populației generale. În același timp, atunci când efectuează observații selective, cercetătorii se confruntă adesea cu sarcina de a calcula nu numai eroarea medie, ci și de a determina limitarea posibilă eroare prelevarea de probe. Cunoscând eroarea medie, este posibil să se determine limitele dincolo de care eroarea de eșantionare nu va trece. Cu toate acestea, este posibil să se afirme că aceste abateri nu vor depăși o valoare dată, nu cu certitudine absolută, ci doar cu un anumit grad de probabilitate. Nivelul de probabilitate care se ia la determinarea limitelor posibile care conțin valorile parametrilor populației generale se numește nivel de probabilitate de încredere.

Probabilitate de încredere- aceasta este destul de mare și, astfel încât este practic considerată implementată în fiecare caz specific, probabilitatea, care garantează concluzii statistice fiabile. O denotăm prin D iar probabilitatea depășirii acestui nivel este a. Asa de,a =1 - R Probabilitatea numit nivelul de semnificație(materialitate), care caracterizează numărul relativ de concluzii eronate în numărul total de concluzii și este definit ca diferența dintre una și nivelul de încredere care este acceptat.

Nivelul de încredere este stabilit de cercetător pe baza gradului de responsabilitate și a naturii sarcinilor care sunt rezolvate. În studiile statistice în economie, nivelul de încredere este cel mai adesea luat D \u003d 0,95; P \u003d 0,99 (respectiv, nivelul de semnificațiea = 0,05; a \u003d 0,01) mai rarD \u003d 0,999. De exemplu, nivelul de încredereГ \u003d 0,99 înseamnă că eroarea de estimare în 99 de cazuri din 100 nu va depăși valoarea stabilită și numai într-un singur caz din 100 poate atinge valoarea calculată sau să o depășească.

Se numește eroarea de eșantionare, calculată cu un anumit grad de probabilitate fiabilăeroare de eșantionare marginală Er.

Să luăm în considerare modul în care se stabilește valoarea unei posibile erori de eșantionare marginală. Cantitateaep este legată de deviația normalizată și, care este definită ca raportul dintre eroarea de eșantionare marginalăep la eroarea medieși:

Pentru comoditate în calcule, abaterea unei variabile aleatorii de la valoarea sa medie este de obicei exprimată în unități ale abaterii standard. Expresie

numitabaterea normalizată. în În literatura statisticăși numitcoeficient de încredere, sau factorul de pliere al erorii medii de eșantionare.

Deci, abaterea normalizată a mediei probei poate fi determinată de formula:

și _є_r_

Din expresie1 puteți găsi posibila eroare de eșantionare marginală

ep \u003d u / l.

Înlocuind în loc deîn valoarea sa, prezentăm formulele pentru erorile de eșantionare marginale pentru medie și pentru proporția cu o selecție aleatorie nerepetată:

În consecință, eroarea de eșantionare marginală depinde de valoarea erorii medii și de deviația normalizată și este egală cu ± multiplu din numărul de erori medii de eșantionare.

Erorile de eșantionare medii și marginale sunt valori numite și sunt exprimate în aceleași unități ca media aritmetică și deviația standard.

Abaterea normalizată este funcțional legată de probabilitate. Pentru a găsi valoriși tabele speciale compilate (ext. 2), care pot fi folosite pentru a găsi valoareași la un nivel dat de valori de încredere și probabilitate la un nivel cunoscut și.

Iată valorileși și probabilitățile corespunzătoare pentru eșantioane cu dimensiunean\u003e 30, care este cel mai des folosit în calculele practice:

Prin urmare, pentruu \u003d 1 probabilitatea devierii caracteristicilor eșantionului de la cele generale prin valoarea unei singure erori de eșantionare medie este de 0,6827. Aceasta înseamnă că, în medie, din fiecare 1000 de eșantioane, 683 vor da caracteristici generalizate care vor diferi de caracteristicile generale generalizate cu cel puțin o eroare medie o singură dată. Pentru u \u003d 2, probabilitatea este 0,9545. în Aceasta înseamnă că din fiecare1000 de eșantioane 954 vor da caracteristici generalizate care vor diferi de caracteristicile generale generalizate de cel mult două ori eroarea medie de eșantionare etc.

Cu toate acestea, datorită faptului că, de regulă, se efectuează un singur eșantion, spunem că, de exemplu, cu o probabilitate de 0,9545, se poate garanta că mărimea erorii marginale nu depășește de două ori media erorii de eșantionare.

Se demonstrează matematic că raportul dintre eroarea de eșantionare și eroarea medie, de regulă, nu depășește± 3d pentru un număr suficient de mare n, în ciuda faptului că eroarea de eșantionare poate dobândi orice valori. Cu alte cuvinte, putem spune că, cu o probabilitate de judecată suficient de mare (P \u003d 0,9973), eroarea de eșantionare marginală, de regulă, nu depășește trei erori medii de eșantionare. Prin urmare, valoarea Ep \u003d 3d poate fi luată ca limită a unei posibile erori de eșantionare.

Să determinăm, de exemplu, eroarea marginală de eșantionare pentru randamentul mediu și proporția de parcele cu un randament de 25 c / ha sau mai mult. Se presupune că nivelul de încredere al probabilității este egal cu P \u003d 0,9545. în Conform tabelului (app..2) găsim valorile u \u003d 2. Erorile medii de eșantionare pentru randament și ponderea parcelelor cu randament de 25 c / ha și mai mult au fost găsite mai devreme și, în consecință, au fost: Ts ~ \u003d ± 0,12 c / ha;MR \u003d ± 0,07.

Eroare marginală a randamentului mediu de orz:

Deci, diferența dintre randamentul mediu al eșantionului și media generală nu va fi mai mare de 0,24 c / ha. Limitele randamentului mediu în populația generală: x \u003d x ± este ~ \u003d 25,1 + 0,24, adică de la 24,86 la 25,34 c / ha.

Eroarea limitativă a ponderii parcelelor cu un randament de 25 kg / ha și mai mult:

În consecință, eroarea marginală la determinarea proporției parcelelor cu un randament de 25 kg / ha sau mai mult nu va depăși 14%, adică proporția parcelelor cu un randament specificat în populația generală se încadrează în: r \u003d a\u003e ± ep \u003d 0,80 ± 0,14, adică de la 66 la 94%.

Eroarea medie de eșantionare arată cât de mult deviază parametrul populației eșantionului de la parametrul corespunzător al populației generale. Dacă calculăm media erorilor tuturor eșantioanelor posibile ale unui anumit tip dintr-un anumit volum ( n) extrase din aceeași populație generală, apoi obținem caracteristicile lor generalizatoare - eroare medie de eșantionare ().

În teoria observației selective, sunt derivate formule de determinare, care sunt individuale pentru căi diferite selecție (repetată și nerepetată), tipurile de eșantioane utilizate și tipurile de indicatori statistici estimate.

De exemplu, dacă se utilizează eșantionări repetate aleatorii corespunzătoare, atunci este definit ca:

La evaluarea valorii medii a unei caracteristici;

Dacă caracteristica este alternativă și cota este evaluată.

În cazul unei selecții nerepetitive, de fapt aleatorii, se face o modificare a formulelor (1 - n / N):

- pentru valoarea medie a caracteristicii;

- pentru o cotă.

Probabilitatea de a obține exact această cantitate de eroare este întotdeauna 0,683. În practică, ei preferă să obțină date cu o probabilitate mai mare, dar acest lucru duce la o creștere a erorii de eșantionare.

Eroarea de eșantionare marginală () este egală cu multiplicarea numărului de erori de eșantionare medii (în teoria eșantionării, este obișnuit să se numească coeficientul t coeficientul de încredere):

Dacă eroarea de eșantionare este dublată (t \u003d 2), atunci obținem o probabilitate mult mai mare ca aceasta să nu depășească o anumită limită (în cazul nostru, eroarea dublă medie) - 0,954. Dacă luăm t \u003d 3, atunci nivelul de încredere va fi 0,997 - aproape certitudine.

Marja erorii de eșantionare depinde de următorii factori:

  • gradul de variație a unităților populației generale;
  • marime de mostra;
  • schemele de selecție selectate (selecția fără repetare dă o valoare de eroare mai mică);
  • nivel de încredere.

Dacă dimensiunea eșantionului este mai mare de 30, atunci valoarea t este determinată în funcție de tabelul de distribuție normal, dacă este mai mică - în conformitate cu tabelul de distribuție al Studentului.

Iată câteva valori ale coeficientului de încredere din tabelul de distribuție normal.

Intervalul de încredere pentru valoarea medie a caracteristicii și pentru ponderea în populația generală este stabilit după cum urmează:

Deci, determinarea limitelor mediei generale și a proporției constă în următoarele etape:

Erori de eșantionare la tipuri diferite selecţie

  1. Eșantionare efectivă aleatorie și mecanică. Eroarea medie a eșantionării reale aleatorii și mecanice este găsită de formulele prezentate în tabel. 11.3.

Exemplul 11.2. Pentru a studia nivelul de productivitate a capitalului, a fost realizat un sondaj eșantion de 90 de întreprinderi din 225 prin metoda eșantionării repetate aleatorii, în urma cărora au fost obținute datele prezentate în tabel.

În acest exemplu, avem un eșantion de 40% (90: 225 \u003d 0,4 sau 40%). Să determinăm eroarea și limitele sale marginale pentru valoarea medie a unei caracteristici din populația generală în conformitate cu pașii algoritmului:

  1. Pe baza rezultatelor unui sondaj de probă, calculăm media și varianța în eșantion:
Tabelul 11.5.
Rezultatele observației Valorile calculate
nivelul rentabilității activelor, ruble, x i numărul de întreprinderi, f i mijlocul intervalului, x i \\ xb4 x i \\ xb4 f i x i \\ xb4 2 f i
Până la 1,4 13 1,3 16,9 21,97
1,4-1,6 15 1,5 22,5 33,75
1,6-1,8 17 1,7 28,9 49,13
1,8-2,0 15 1,9 28,5 54,15
2,0-2,2 16 2,1 33,6 70,56
2.2 și versiuni ulterioare 14 2,3 32,2 74,06
Total 90 - 162,6 303,62

Proba medie

Varianța selectivă a trăsăturii studiate

Pentru datele noastre, determinăm eroarea de eșantionare marginală, de exemplu, cu o probabilitate de 0,954. Folosind tabelul valorilor probabilității funcției normale de distribuție (vezi extrasul din acesta, dat în apendicele 1), găsim valoarea coeficientului de încredere t corespunzător probabilității 0,954. Cu o probabilitate de 0,954, coeficientul t este 2.

Astfel, în 954 de cazuri din 1000, valoarea medie a randamentului activelor nu va depăși 1,88 ruble. și nu mai puțin de 1,74 ruble.

Mai sus, a fost utilizată o schemă de selecție aleatorie repetată. Să vedem dacă rezultatele sondajului se schimbă dacă presupunem că selecția a fost efectuată conform schemei de selecție fără repetare. În acest caz, eroarea medie este calculată folosind formula

Apoi, cu o probabilitate egală cu 0,954, valoarea erorii de eșantionare marginală va fi:

Limitele de încredere pentru valoarea medie a unei trăsături într-o selecție aleatorie nerepetabilă vor avea următoarele valori:

Prin compararea rezultatelor celor două scheme de eșantionare, se poate concluziona că utilizarea eșantionării aleatorii non-repetitive oferă rezultate mai precise în comparație cu utilizarea eșantionării repetate la același nivel de încredere. Mai mult, cu cât dimensiunea eșantionului este mai mare, cu atât limitele valorilor medii se restrâng mai semnificativ atunci când se trece de la o schemă de selecție la alta.

Pe baza datelor de exemplu, vom determina limitele ponderii întreprinderilor cu un nivel de productivitate a capitalului care nu depășește 2,0 ruble în populația generală:

  1. calculați rata de eșantionare.

Numărul de întreprinderi din eșantion cu un nivel de productivitate a capitalului care nu depășește 2,0 ruble este de 60 de unități. Atunci

m \u003d 60, n \u003d 90, w \u003d m / n \u003d 60: 90 \u003d 0,667;

  1. calculați varianța cotei din eșantion
  1. eroarea medie de eșantionare atunci când se utilizează un proiect de eșantionare repetată va fi

Dacă presupunem că a fost utilizată o schemă de selecție non-repetitivă, atunci eroarea medie de eșantionare, luând în considerare corectarea limitării populației, va fi

  1. stabiliți nivelul de încredere și determinați eroarea de eșantionare marginală.

Cu o valoare de probabilitate P \u003d 0,997 conform tabelului normal de distribuție, obținem valoarea pentru coeficientul de încredere t \u003d 3 (a se vedea extrasul din acesta, dat în apendicele 1):

Astfel, cu o probabilitate de 0,997, se poate argumenta că, în populația generală, ponderea întreprinderilor cu o rentabilitate a activelor care nu depășește 2,0 ruble nu este mai mică de 54,7% și nu mai mult de 78,7%.

  1. Eșantion tipic. Cu un eșantion tipic, atunci populația generală de obiecte este împărțită în k grupuri

N 1 + N 2 +… + N i +… + N k \u003d N.

Cantitatea de unități recuperabile din fiecare grup tipic depinde de metoda de selecție adoptată; numărul lor total formează dimensiunea eșantionului necesar

n 1 + n 2 + ... + n i + ... + n k \u003d n.

Există următoarele două modalități de organizare a selecției în cadrul unui grup tipic: proporțional cu volumul grupurilor tipice și proporțional cu gradul de variabilitate a valorilor trăsăturii în unitățile de observare în grupuri. Să considerăm primul ca fiind cel mai frecvent utilizat.

Selecția proporțională cu mărimea grupurilor tipice presupune că următorul număr de unități de populație va fi selectat din fiecare dintre ele:

n \u003d n i N i / N

unde n i este numărul de unități recuperabile pentru un eșantion din al i-lea grup tipic;

n este dimensiunea eșantionului total;

N i - numărul de unități ale populației generale care alcătuiesc al i-lea grup tipic;

N este numărul total de unități din populația generală.

Selectarea unităților din cadrul grupurilor are loc sub formă de eșantionare aleatorie sau mecanică.

Formulele pentru estimarea erorii de eșantionare medii pentru medie și proporție sunt prezentate în tabel. 11.6.

Iată media diferențelor de grup ale grupurilor tipice.

Exemplul 11.3. Într-una din universitățile din Moscova, a fost realizat un sondaj de sondaj al studenților pentru a determina indicatorul prezenței medii la biblioteca universității de către un student pe semestru. Pentru aceasta, a fost utilizat un eșantion tipic nerepetabil de 5%, ale cărui grupuri tipice corespund numărului cursului. Cu o selecție proporțională cu volumul grupurilor tipice, s-au obținut următoarele date:

Tabelul 11.7.
Număr curs Total studenți, oameni, N i Examinat ca urmare a observării selective, oameni, n i Numărul mediu de vizite la bibliotecă per student pe semestru, x i Varianța eșantionului intragrup,
1 650 33 11 6
2 610 31 8 15
3 580 29 5 18
4 360 18 6 24
5 350 17 10 12
Total 2 550 128 8 -

Numărul de studenți care urmează să fie chestionați în fiecare curs este calculat după cum urmează:

în mod similar pentru alte grupuri:

Distribuția valorilor medii ale eșantionului are întotdeauna o lege de distribuție normală (sau se apropie de ea) la n\u003e 100, indiferent de natura distribuției populației generale. Cu toate acestea, în cazul eșantioanelor mici, se aplică o lege diferită de distribuție - distribuția Studentului. În acest caz, coeficientul de încredere se găsește din tabelul de distribuție t al Studentului în funcție de nivelul de încredere P și de mărimea eșantionului n. Anexa 1 oferă un fragment din tabelul de distribuție t al Studentului, prezentat ca dependența probabilității de încredere de dimensiunea eșantionului și coeficientul de încredere t.

Exemplul 11.4. Să presupunem că un sondaj eșantionat de opt studenți ai academiei a arătat această pregătire pentru munca de testare conform statisticilor, aceștia au petrecut următorul număr de ore: 8,5; 8,0; 7,8; 9,0; 7.2; 6.2; 8,4; 6.6.

Exemplul 11.5. Să calculăm câte din 507 întreprinderi industriale ar trebui să verifice oficiu fiscal, pentru a determina cu o probabilitate de 0,997 ponderea întreprinderilor cu încălcări de impozite. Conform sondajului similar din trecut, valoarea abaterii standard a fost de 0,15; se așteaptă ca eroarea de eșantionare să nu fie mai mare de 0,05.

Dacă se utilizează eșantionare repetată aleatorie,

Pentru o selecție aleatorie nerepetabilă, va trebui să verificați

După cum puteți vedea, utilizarea selecției nerepetabile face posibilă supravegherea unui număr mult mai mic de obiecte.

Exemplul 11.6. Este planificat un sondaj salarii la întreprinderile din industrie prin metoda selecției aleatorii nerepuse. Care ar trebui să fie dimensiunea eșantionului dacă la momentul anchetei numărul angajaților din industrie era de 100.000? Eroarea marginală de eșantionare nu trebuie să depășească 100 de ruble. cu o probabilitate de 0,954. Pe baza rezultatelor anchetelor anterioare privind salariile din industrie, se știe că abaterea standard este de 500 de ruble.

Prin urmare, pentru a rezolva această problemă, este necesar să se includă cel puțin 100 de persoane în eșantion.