Průměrná a omezená chyba odběru vzorků.

Systematické a náhodné chyby

Modulární chyby vzorkování 2

Vzhledem k tomu, že vzorek pokrývá zpravidla velmi malá část všeobecného souhrnného souboru, je třeba předpokládat, že existuje rozdíl mezi hodnocením a charakteristikou obecné populace, které toto posouzení zobrazuje. Tyto rozdíly byly nazývány chyby zobrazení nebo reprezentativnosti. Reprezentativní chyby jsou rozděleny do dvou typů: systematické a náhodné.

Systematické chyby - To je neustálá nadhodnocení nebo podcenění hodnoty posouzení ve srovnání s charakteristikou obecné populace. Důvodem pro vzhled systematické chyby je nedodržení principu rovnocennosti zadávání každé jednotky obecné populace do vzorku, to znamená, že vzorek je tvořen převážně "nejhorší" (nebo "nejlepší") zástupci obecné populace. Dodržování zásady rovnováhy pro vstup každé jednotky do vzorku umožňuje zcela eliminovat tento typ chyby.

Náhodné chyby -ty se mění ze vzorku do vzorku na znamení a velikost rozdílu mezi posouzením a odhadovanou charakteristikou obecné populace. Důvodem výskytu náhodných chyb - hra případu ve formování vzorku tvořící pouze část obecné populace. Tento typ chyby je organicky inherentní v selektivní metodě. Je zcela nemožné je vyloučit, úkolem je předpovědět jejich možnou hodnotu a minimalizovat je. Postup související v souvislosti s touto akcemi vyplývá z zvážení tří typů náhodných chyb: specifický, střední a omezující.

2.2.1 Specifický Chyba je chyba jednoho vzorku. V případě, že průměr tohoto vzorku () je odhad pro obecné (0), a pokud předpokládáme, že tento obecný průměr víme, pak rozdíl \u003d -0 a bude specifickou chybou tohoto vzorku. Pokud se vzorek opakuje z tohoto obecného celku, pokaždé, když dostaneme novou hodnotu určité chyby: ... a tak dále. Pokud jde o tyto specifické chyby, můžete říci následující: Některé z nich se shodují se sebou v rozsahu a podepsat, to znamená, že distribuce chyb probíhá, některé z nich budou rovny 0, shodu hodnocení a parametrem generála je pozorován agregát;

2.2.2 Průměrná chyba - to je průměrné kvadratické všech možných případů specifických chyb hodnotí:, kde - hodnota změny specifických chyb; Frekvence (pravděpodobnost) výskytu určité chyby. Průměrná chyba odběru vzorků ukazuje, jak lze průměr mýlit, pokud existuje rozsudek o posouzení parametru obecné populace. Výše uvedený vzorec odhaluje obsah průměrné chyby, ale nemůže být použit pro praktické výpočty, pokud pouze proto, že zahrnuje znalosti obecného parametru obyvatelstva, které samo o sobě eliminuje potřebu odběru vzorků.



Praktické výpočty průměrné chybové chyby jsou založeny na pozadí, že (průměrná chyba) je v podstatě průměrná kvadratická odchylka všech možných hodnot hodnocení. Tento předpoklad vám umožňuje získat průměrné algoritmy výpočtu chyb založené na datech jednoho jediného vzorku. Průměrná chyba vzorku média může být zejména stanovena na základě následujících úvah. Existuje vzorek (, ...) sestávající z jednotek. Vzorem, selektivní průměr definovaný jako odhad obecného průměru. Každá hodnota (, ...), která stojí pod součtem částky, by měla být považována za nezávislou náhodnou hodnotu, neboť s nekonečným opakováním vzorku, první, druhý atd. Jednotky mohou mít všechny hodnoty od těch, kteří jsou přítomni v obecné populaci. Proto Vzhledem k tomu, jak je známo, rozptyl množství nezávislých náhodných veličin se rovná množství disperzí, . Z toho vyplývá, že průměrná chyba pro vzorkové médium bude rovna a je umístěna v inverzní závislosti na velikosti vzorku (přes kořenové náměstí z něj) a přímo z průměrné kvadratické vychýlení vlastnosti v obecné populaci . To je logické, protože selektivní průměr je bohatým hodnocením pro obecný průměr a jako vzorek se zvyšuje, blíží se ke své hodnotě podle odhadovaného parametru obecné populace. Přímá závislost průměrné chyby z úseků značky je způsobena skutečností, že čím větší je variabilita vlastnosti v obecné populaci, tím obtížnější formace založená na vzorku, aby konstruoval odpovídající model obecné populace. V praxi se průměrná kvadratická odchylka charakteristiky obecné populace nahrazuje posouzením vzorků a pak vzorec pro výpočet průměrné chyby vzorového média získává formulář: Při zvažování výtlaku disperze je selektivní průměrná kvadratická odchylka vypočteno vzorcem \u003d. Protože symbol n je indikován počtem vzorků. V denominátoru při výpočtu průměrné kvadratické odchylky by měl být použit počet vzorků (n), ale tzv. Číslo stupňů svobody (N-1). Podle počtu stupňů svobody znamená počet jednotek v agregátu, který se může svobodně lišit (měnit), pokud je charakteristika definována celkem. V našem případě, protože jeho průměr je definován vzorkem, jednotky se mohou svobodně lišit.

Tabulka 2.2 ukazuje vzorce pro výpočet průměrných chyb různých hodnot vzorku. Jak je vidět z této tabulky, velikost průměrné chyby ve všech odhadech je v zpětné vazbě s velikostí vzorku a v přímém směru s volatilitou. To lze říci, že se vztahuje průměrná chyba selektivního podílu (frekvence). Pod kořenem je alternativní funkce disperze nastavená vzorkem ()

Vzorce uvedené v tabulce 2.2 se týkají tzv náhodného náhodného výběru jednotek do vzorku. S jinými metodami výběru, které budou diskutovány níže, vzorce bude poněkud upravena.

Tabulka 2.2.

Vzorce pro výpočet průměrných chyb vzorku

2.2.3 Chyba vzorkováníZnalost hodnocení a její průměrnou chybu v některých případech je zcela nedostatečné. Například při použití hormonů při krmení zvířat, pouze průměrná velikost nepochybně jejich škodlivých zbytků a průměrné chybové prostředky vystavit spotřebitele vážných nebezpečných produktů. Naléhá na potřebu určit maximum ( omezit chybu). Při použití selektivní metody není chyba nastavena jako specifická hodnota, ale forma stejných hranic

(intervaly) na druhé straně hodnoty oceňování.

Definice hraničních hraničních chyb je založena na vlastnostech distribuce konkrétních chyb. Pro tzv. Velké vzorky, jehož číslo je více než 30 jednotek (), specifické chyby jsou distribuovány v souladu s normálním distribučním zákonem; Pro malé vzorky () jsou specifické chyby distribuovány v souladu se zákonem distribuce gosset

(Student). S ohledem na konkrétní chyby selektivního průměru je funkce normální distribuce: , kde - vzhled hustoty pravděpodobnosti určitých hodnot za předpokladu, že kde vzorek média; - Obecný průměr, - Průměrná chyba pro vzorkové médium. Vzhledem k tomu, že průměrná chyba () je hodnota konstanta, pak v souladu s normálním zákonem jsou distribuovány konkrétní chyby, vyjádřené v akciích průměrné chyby nebo takzvané normalizované odchylky.

Přijímání integrální funkce normální distribuce, můžete nastavit pravděpodobnost, že chyba bude uzavřena v určité změně intervalu t a pravděpodobnost, že chyba bude překračovat tento interval (reverzní událost). Pravděpodobnost, že chyba nepřekročí polovinu průměrné chyby (na druhé straně generálního moderátora), je 0.3829, která bude chyba uzavřena do jedné průměrné chyby - 0,6827, 2 Medium Chyby -0, 9545 atd.

Vztah mezi úrovní pravděpodobnosti a intervalem změny T (a v konečném důsledku intervalu změny chyby) umožňuje přistupovat k intervalu (nebo hranice) mezní chyby, který svázal svou hodnotu s pravděpodobností implementace. Pravděpodobnost implementace je pravděpodobnost, že chyba bude v nějakém intervalu. Pravděpodobnost implementace bude "důvěrná", pokud opačná událost (chyba je mimo interval), má takovou pravděpodobnost vzhledu, který lze zanedbávat. Proto je úroveň důvěry pravděpodobnost stanovena jako pravidlo, menší než 0,90 (pravděpodobnost opačné události je 0,10). Čím vyšší je negativní důsledky vzhledu chyb mimo stanovený interval, tím vyšší je úroveň důvěry pravděpodobnost (0,95; 0,99; 0,9999, a tak dále).

Výběrem úrovně důvěryhodnosti pravděpodobnosti na tabulce integrální integrální integrální tabulka byste měli najít odpovídající hodnotu t a potom pomocí výrazu \u003d určit interval chybového chyby. Význam hodnoty získané v následujícím textu - s přijatými úrovní důvěryhodnosti pravděpodobnosti selekční médium nepřekročí hodnotu.

Pro stanovení hranic omezených chyb založených na velkých vzorcích pro jiné odhady (disperze, střední kvadratická odchylka, sdílení, a tak dále), výše popsaný přístup se používá, s přihlédnutím k tomu, že jeho algoritmus se používá k určení průměrné chyby každé posouzení.

Pokud jde o malé vzorky (), jak již bylo uvedeno, distribuce chyb odhadů odpovídá distribuci T - student v tomto případě. Zvláštností této distribuce je, že jako parametr v něm, spolu s chybou, počet vzorků je přítomen, nebo spíše není počet vzorků a počet stupňů svobody, se zvýšením velikosti velikosti Vzorek, distribuce T-Student se blíží normálně a s těmito distribucemi se téměř shodují. Porovnání hodnot hodnoty T-Student a T - normální distribuce podle stejné pravděpodobnosti spolehlivosti lze říci, že hodnota T-studentu je vždy větší než T - normální distribuci a rozdíly se zvyšují s poklesem Velikost vzorku as zvýšením úrovně důvěryhodnosti pravděpodobnosti. Proto při použití malých vzorků existují velké, širší hranice omezení chyb a tyto hranice rozšiřují s poklesem velikosti vzorku a zvýšení úrovně důvěryhodnosti pravděpodobnosti.

Vzorkování chyb- Jedná se o objektivně vznikající rozpor mezi charakteristikami vzorku a obecnou populací. Záleží na řadě faktorů: stupeň variace studovaného prvku, velikost vzorku, způsob výběru jednotek do selektivního celku, přijal úroveň spolehlivosti výsledku studie.

Pro reprezentativnost vzorku je důležité zajistit míru výběru, aby všechny předměty obecné populace měly stejné pravděpodobnosti dostat do vzorku. Pro zajištění reprezentativnosti vzorku se používají následující metody výběru:

· vlastně-náhodné (jednoduché náhodné) vzorkování (je vybrána první šance na náhodně postižený objekt);

· mechanický (systematický) vzorek;

· typický (Stratified, stratifikovaný) vzorek (objekty jsou vybrány v poměru k reprezentaci různých typů objektů v obecné populaci);

· seriál (hnízdo).

Výběr jednotek do selektivní sady lze opakovat nebo odvrácené. Pro re-selekcekromě vzorku je jednotka vyšetřena, tj. Registrace svých znaků je vrácena obecné populaci a na stejné úrovni s jinými jednotkami se podílí na dalším výběrovém řízení. Pro výběr zachyceníjednotka, která spadala do vzorku, je zkoumána a v dalším výběrovém řízení se nezúčastní

Selektivní pozorování je vždy spojeno s chybou, protože počet vybraných jednotek není roven počáteční (generál). Náhodné chyby odběru vzorků jsou způsobeny působením náhodných faktorů, které neobsahují žádné systémové prvky ve směru dopadu na vypočtené selektivní charakteristiky. Dokonce s přísnými dodržováním všech principů tvorby selektivního souboru, selektivní a obecné vlastnosti budou poněkud odlišné. Získané náhodné chyby proto musí být statisticky vyhodnoceny a zohledněny při distribuci výsledků. selektivní pozorování Pro celý obecný agregát. Vyhodnocení těchto chyb a je hlavní úkol řešen v teorii selektivního pozorování. Inverzní úloha Je to definice takového minimálního potřebného počtu selektivní kombinace, při které chyba nepřesáhne stanovenou hodnotu. Vypracovat dovednosti při řešení těchto úkolů a materiálu této sekce je odeslán.

Vlastně náhodný vzorek. Jeho podstatou spočívá ve výběru jednotek od obecné populace jako celku, aniž by ji oddělily do skupin, podskupin nebo řady jednotlivých jednotek. Současně jsou jednotky vybrány v náhodném pořadí, což nezávisí na pořadí jednotek v agregátu, ani ze svých znaků.

Po výběru pomocí jedné z algoritmů prováděcích principu šancí nebo na základě tabulky náhodných čísel jsou stanoveny hranice obecných charakteristik. Pro tento účel je průměr a maximální chyba Vzorky.

Průměrná chyba re-vlastně vzorkování Určený vzorcem

kde σ je průměrná kvadratická odchylka studovaného atributu;

n je svazek (počet jednotek) selektivního agregátu.

Chyba výběru LIMIT spojené se specifikovanou úrovní pravděpodobnosti. Při řešení níže uvedených úkolů je požadovaná pravděpodobnost 0,954 (t \u003d 2) nebo 0,997 (t \u003d 3). S ohledem na zvolenou úroveň pravděpodobnosti a hodnota odpovídající, bude chybová chyba výběru:

Pak lze argumentovat, že v dané pravděpodobnosti bude obecný průměr v následujících hranicích:

Při určování hranic obecný podíl Při výpočtu průměrné chyby vzorku se používá alternativní disperze funkce, která se vypočítá následujícím vzorcem:

kde W je selektivní poměr, tj. Podíl jednotek se specifickou možností nebo variantem studovaného prvku.

Při řešení individuálních úkolů je nutné vzít v úvahu, že s neznámou disperzí alternativní funkce, může být použita maximální možná hodnota 0,25.

Příklad. V důsledku vzorku průzkumu nezaměstnanosti obyvatelstva, hledající práce provedená na základě vlastně-náhodné re-vzorek byla získána data uvedená v tabulce. 1.14.

Tabulka 1.14.

Výsledky vzorového průzkumu neobsazené populace

S pravděpodobností 0,954 určete hranice:

a) středního věku neobsazené populace;

b) akcie (zvláštní gravitace) osob mladších 25 let, v celkovém počtu neobsazených obyvatelstva.

Rozhodnutí. Pro určení průměrné chyby odběru vzorků je nutná především k určení selektivní průměrné hodnoty a disperze studované rysy. Pro to, kdy manuální metoda Výpočet Je vhodné sestavit tabulku 1.15.

Tabulka 1.15.

Výpočet středního věku neobsazených populace a disperze

Na základě údajů tabulky se vypočítají nezbytné ukazatele:

· Selektivní průměrná hodnota:

;

· Disperze:

· Radantová odchylka:

.

Průměrná chyba vzorkování bude:

roku.

Definujeme pravděpodobnost 0,954 ( t.\u003d 2) Chyba vzorkování terminálu:

roku.

Stanováme hranice obecného průměru: (41.2 - 1.6) (41.2 + 1,6) nebo:

Na základě zvoleného vyšetření s pravděpodobností 0,954 lze dospět k závěru, že průměrný věk nezaměstnaných obyvatelstva hledající práce je od 40 do 43 let.

Odpovědět na otázku, doručeno v odstavci "B" tohoto příkladu, o selektivních údajích, definujeme podíl osob mladších 25 let a vypočítat disperzi podílu:

Vypočítejte průměrnou chybu vzorkování:

Chyba výběru s danou pravděpodobností bude:

Definujeme hranice obecného podílu:

Proto se pravděpodobností 0,954 lze tvrdit, že podíl osob mladších 25 let v celkovém počtu neobsazených obyvatelstva v rozmezí od 3,9 do 1 1,9%.

Při výpočtu průměrné chyby vlastně náhodně reprezentován Vzorky musí být zohledněny korekci pro recyklovatelnost výběru:

kde n je objem (počet jednotek) obecné populace /

Požadovaný objem skutečného vzorku Stanoveno vzorcem:

Pokud je výběr neporušený, pak vzorec získává následující formulář:

Výsledek založený na použití těchto vzorců je vždy zaokrouhlen na celou hodnotu.

Příklad.Je třeba určit, kolik studentů prvních škol okresních škol je třeba vybrat v pořadí skutečného náhodného podnikového vzorku, takže s pravděpodobností 0,997 určit hranice průměrného růstu prvních srovnávačů s limitní chybou 2 cm. Je známo, že v prvních stupních škol okresu studuje 1,100 studentů a růstová rozptyl podle výsledků podobného průzkumu v jiné oblasti, činí 24. \\ T

Rozhodnutí. Požadovaná velikost vzorku na úrovni pravděpodobnosti 0,997 ( t. \u003d 3) bude:

Tak, 52 žáků by tedy měly být zkoumány pro získání údajů o průměrné výšce prvních srovnávačů s danou přesností.

Mechanický vzorek. Tento vzorek spočívá ve výběru jednotek z obecného seznamu jednotek obecné agregace ve stejných intervalech v souladu s stanovením procenta výběru. Při řešení problémů na definici průměrné chyby mechanického vzorku, stejně jako jeho požadované číslo, výše uvedené vzorce aplikované svým náhodným náhodným náhodným výběrem je třeba použít.

Takže při 2% vzorku je vybrána každá 50. jednotka (1: 0,02), s 5% vzorkem - každá 20. jednotka (1: 0,05) atd.

V souladu s přijatými sdílením výběru je tedy obecná populace mechanicky rozdělena do rovnovážných skupin. Ze každé skupiny je ve vzorku vybrána pouze jedna jednotka.

Důležitou funkcí Mechanický vzorek je, že tvorba sady vzorku může být provedena bez uchylu k kompilaci seznamů. V praxi je zakázka, ve kterém jsou všeobecné agregované jednotky skutečně umístěny. Například posloupnost výstupu hotových výrobků z dopravníku nebo potoka, pořadí umístění jednotek šarže zboží během skladování, přepravy, realizace atd.

Typický vzorek. Tento vzorek se aplikuje v případech, kdy jsou jednotky obecné populace kombinovány do několika velkých typických skupin. Výběr jednotek do vzorku se provádí v těchto skupinách v poměru k jejich objemu na základě využití náhodného nebo mechanického odběru vzorků (pokud máte potřebné informace, výběr může být také proveden v poměru k variaci studovaného atributu ve skupinách).

Typický vzorek se obvykle používá při učení komplexu statistické agregáty. Například s selektivním posouzením produktivity práce obchodních pracovníků skládajících se z individuálních týmů kvalifikací.

Důležitým vlastností typického vzorku je, že dává přesnější výsledky ve srovnání s jinými metodami výběru jednotek do selektivního souboru.

Průměrná chyba typického vzorku je určena vzorce:

(re-selekce);

(Výběr zachycení)

kde je průměr intragroup disperze.

Příklad. Za účelem studia příjmů obyvatelstva ve třech oblastech regionu byl vytvořen 2% vzorek, úměrný populaci těchto oblastí. Výsledky jsou uvedeny v tabulce. šestnáct.

Tabulka 16.

Výsledky vzorového průzkumu příjmů obyvatelstva

Je nutné určit hranice průměrných příjmů obyvatelstva v regionu jako celku na úrovni pravděpodobnosti 0,997.

Rozhodnutí. Vypočítat průměr intrikaroup disperzí:

kde N I. - Objem i. I.- a skupiny;

n, - velikost vzorku z / ~ skupiny.

Sériový vzorek. Tento vzorek se používá v případech, kdy jsou jednotky agregátu integrovány do malých izometrických skupin nebo série. Výběrová jednotka v tomto případě je série. Série je vybrána pomocí samo-náhodného nebo mechanického vzorku a uvnitř vybrané série, vše je vyšetřeno bez výjimky.

Výpočet průměrné chyby sériového vzorku leží intergroupová disperze:

(re-selekce);

(Výběr zachycení)

kde x I. - vybrané číslo i. I. - série;

R. - Celkový počet sérií.

Disperze mezigroup s izometrickými skupinami se vypočítá takto:

kde x I.- uprostřed i-a série;

h. - Celkový průměr v celém selektivním agregátu.

Příklad. Aby bylo možné kontrolovat kvalitu komponent ze šarže výrobků, zabalené v 50 krabicích 20 výrobků v každém, byl vyroben 10% sériový vzorek. Podle krabic, které padly do vzorku, průměrná vychýlení parametrů výrobku z normy, resp. 9 mm, 11, 12, 8 a 14 mm. S pravděpodobností 0,954 určete průměrnou odchylku parametrů v celé bitvě jako celku.

Rozhodnutí. Selektivní průměr:

mm.

Velikost katalogové disperze:

S ohledem na stanovenou pravděpodobnost R. = 0,954 (t.\u003d 2) Chyba omezení výběru bude:

mm.

Vyrobené výpočty umožňují dospět k závěru, že průměrná odchylka parametrů všech výrobků z normy je v rámci následujících hranic:

Pro určení požadovaného objemu sériového vzorkování se pro zadanou chybu používají následující vzorce:

(re-selekce);

(Výběr výkonu).

Průměrná chyba vzorkování ukazuje, jak vychýlí průměrný parametr selektivní sady z odpovídajícího parametru obecného. Pokud vypočítáte průměr chyb všech možných vzorků určitého typu zadaného objemu ( n.), extrahován ze stejného generálního souhrnu, pak získáme jejich zobecňující charakteristiky - chyba středního vzorkování ().

V teorii selektivních pozorování jsou vzorce odvozeny pro definici, která jsou individuální pro různé metody výběru (znovu nezávislé), typy použitých vzorků a druhů odhadovaných statistických ukazatelů.

Pokud je například aplikován náhodný vzorek, je definován jako:

Při hodnocení průměrné charakteristické hodnoty;

Pokud je znaménko alternativou a odhaduje se podíl.

S pravděpodobně vlastně náhodným výběrem ve vzorci, změna (1 - N / N):

- pro průměrnou hodnotu znamení;

- pro podíl.

Pravděpodobnost získání přesně takové chyby je vždy rovná 0,683. V praxi je výhodné získat data s větší pravděpodobností, ale to vede ke zvýšení hodnoty vzorové chyby.

Chyba výběru () se rovná t-více počtu chyb při odběru vzorků (v teorii vzorku t volání volání koeficientu důvěry):

Pokud je chyba odběru vzorků zdvojnásobena (t \u003d 2), dostaneme mnohem větší pravděpodobnost, že nepřekročí určitý limit (v našem případě, dvojité průměrné chyby) - 0,954. Pokud berete T \u003d 3, pak bude pravděpodobnost spolehlivosti 0,997 - prakticky přesnost.

Úroveň chybového omezení chyby závisí na následujících faktorech:

  • stupeň variace jednotek obecné populace;
  • vzorkování;
  • vybrané výběrové schémata (pravděpodobní výběr udává menší chybovou hodnotu);
  • Úroveň pravděpodobnosti důvěry.

Pokud je velikost vzorku větší než 30, hodnota T je určena tabulkou normální distribuce, pokud je méně - podle styudentní distribuční tabulky.

Uveďte některé hodnoty koeficientu důvěry z tabulky normální distribuce.

Interval spolehlivosti pro průměrnou hodnotu funkce a pro podíl na obecné populaci je stanoven takto:

Definice hranic obecného průměru a podíl se skládá z následujících kroků:

Chyby odběru vzorků odlišné typy Výběr

  1. Vlastně náhodný a mechanický vzorek. Průměrná chyba skutečného náhodného a mechanického vzorku je umístěn podle vzorců uvedených v tabulce. 11.3.

Příklad 11.2. Pro studium úrovně kapitálových studií byl proveden vzorový průzkum 90 podniků z 225 náhodnou metodou opětovného vzorku, v důsledku toho byla získána data uvedená v tabulce.

Ve zvážení příkladu máme 40% vzorku (90: 225 \u003d 0,4 nebo 40%). Definujeme jeho omezení a hranice pro průměrné znamení obecné populace podél kroků algoritmu:

  1. Podle vzorových průzkumů vypočítáme průměr a disperzi ve vzorkové sadě:
Tabulka 11.5.
Výsledky dohledu Vypočtené hodnoty
úroveň kapitálových studií, rub., x i počet podniků, F I střední interval, X i xb4 X i xb4 f i x i xb4 2 f i
Až 1,4. 13 1,3 16,9 21,97
1,4-1,6 15 1,5 22,5 33,75
1,6-1,8 17 1,7 28,9 49,13
1,8-2,0 15 1,9 28,5 54,15
2,0-2,2 16 2,1 33,6 70,56
2.2 a vyšší 14 2,3 32,2 74,06
CELKOVÝ 90 - 162,6 303,62

Selektivní uprostřed

Selektivní disperze studované funkce

Pro naše data definujeme chybu výběru limit, například s pravděpodobností 0,954. Podle tabulky hodnot pravděpodobnostní funkce normálního distribuce (viz rychlost závěrky, která je uvedena v dodatku 1), zjistíme, že hodnota koeficientu důvěryhodnosti t odpovídající 0,954. S pravděpodobností 0,954, koeficient t je 2.

V 954 případech z 1000, průměrná hodnota nadace nebude vyšší než 1,88 rublů. a ne nižší než 1,74 rublů.

Výše uvedené schéma náhodného selekce bylo použito výše. Podívejme se, zda se výsledky průzkumu změní, za předpokladu, že výběr byl proveden podle schématu výběru ofsetu. V tomto případě je výpočet průměrné chyby prováděn vzorcem

Pak, s pravděpodobností 0,954, bude velikost okrajové chyby vzorkování:

Důvěra Hranice pro průměrnou hodnotu funkce s nehodě náhodným náhodným výběrem budou mít následující hodnoty:

Porovnáním výsledků dvou výběrových systémů lze dospět k závěru, že použití nehodného náhodného náhodného vzorku poskytuje přesnější výsledky ve srovnání s použitím re-selekce za stejnou pravděpodobnost spolehlivosti. V tomto případě, tím větší je velikost vzorku, tím více je v podstatě hranice průměrných hodnot zúžené během přechodu z jednoho selekčního schématu do druhého.

Podle příkladu příkladu definujeme, jaké hranice existuje podíl podniků s úrovní fondu-student, nepřesahující hodnoty 2,0 rublů, v obecné populaci:

  1. vypočítejte selektivní sdílení.

Počet podniků ve vzorku s úrovní kapitálových hlasů nepřesahujících hodnoty 2,0 rublů je 60 jednotek. Pak

m \u003d 60, n \u003d 90, w \u003d m / n \u003d 60: 90 \u003d 0,667;

  1. vypočítejte rozptylu podílu do selektivního agregátu
  1. průměrná chyba odběru vzorků při použití schématu re-selekce bude

Pokud předpokládáte, že byl použit ne-selekční okruh, pak bude průměrná chyba odběru vzorků s přihlédnutím k korekci do končetiny agregátu, bude

  1. požádejte důvěryhodnou pravděpodobnost a definujte chybu výběru.

Když hodnota pravděpodobnosti p \u003d 0,997 je platná na tabulce normálního distribuce, získáme hodnotu pro koeficient důvěryhodnosti t \u003d 3 (viz rychlost závěrky níže v dodatku 1):

S pravděpodobností 0,997, je tedy možné argumentovat, že v obecné populaci, podíl podnicích s úrovní zpráv fondu nepřesahující hodnoty 2,0 rublů není menší než 54,7%, a ne více než 78,7% .

  1. Typický vzorek. V typickém vzorku je obecná sada objektů rozdělena do skupin K, pak

N 1 + n 2 + ... + n i + ... + n k \u003d n.

Objem jednotek extrahovaných z každé typické skupiny závisí na přijatém způsobu výběru; Jejich celkem tvoří požadovanou velikost vzorku

n 1 + n 2 + ... + n i + ... + n k \u003d n.

Existují následující dva způsoby, jak organizovat výběr v rámci typické skupiny: úměrný objemu typických skupin a úměrné stupně měnící se známky známek pozorovacích jednotek ve skupinách. Zvažte první z nich, jako nejčastěji používaný.

Výběr, proporcionální objem typických skupin navrhuje, aby v každém z nich bude vybrán následující počet kompatibilních jednotek:

n \u003d n i · n i / n

kde n i je počet extrahovaných jednotek pro vzorek z typické skupiny I-th;

n - celkový vzorkování;

N I je počet jednotek obecné populace, která byla typická skupina I-yu;

N je celkový počet obecných agregovaných jednotek.

Výběr jednotek uvnitř skupin se vyskytuje v náhodném nebo mechanickém odběru vzorku.

Vzorce pro odhad Průměrná ukázková chyba pro médium a sdílení jsou uvedeny v tabulce. 11.6.

Zde je průměr skupinových disperzí typických skupin.

Příklad 11.3. V jedné z moskevských univerzit byla provedena selektivní zkoumání studentů s cílem určit ukazatel průměrné účasti univerzitní knihovny s jedním studentem pro semestr. Za tímto účelem byl použit 5% netypický typický vzorek, jejichž typické skupiny odpovídají číslu kurzu. Během výběru, proporcionální objem typických skupin, byly získány následující údaje:

Tabulka 11.7.
Číslo kurzu Celkem studenti, lidé, n i Zkoumané v důsledku selektivního pozorování, os., N i Průměrný počet návštěv knihovny je jedním studentem pro semestr, X I Intrikaroup selektivní disperze,
1 650 33 11 6
2 610 31 8 15
3 580 29 5 18
4 360 18 6 24
5 350 17 10 12
CELKOVÝ 2 550 128 8 -

Počet studentů, který má být zkoumán v každém kurzu, vypočítá takto:

podobně jako ostatní skupiny:

Distribuce vzorkových médií má vždy normální distribuční právo (nebo se blíží) s p\u003e 100, bez ohledu na povahu distribuce obecné populace. V případě malých vzorků však existuje jiné distribuční právo - distribuce studenta. V tomto případě je koeficient důvěryhodnosti umístěn na tabulce Distribuce T-Distribuce v závislosti na hodnotě pravděpodobnosti důvěry P a velikosti vzorku p. Příloha 1 ukazuje fragment T-distribuční tabulky studentů, reprezentovaný jako a vztah důvěryhodné pravděpodobnosti od vzorkování a koeficientu důvěryhodnosti T.

Příklad 11.4. Předpokládejme, že vzorový průzkum osmi studentů Akademie ukázal, že příprava řídicí práce Podle statistik strávili následující hodiny: 8.5; 8,0; 7.8; 9,0; 7.2; 6.2; 8.4; 6.6.

Příklad 11.5. Vypočítat, kolik 507 průmyslové podniky Překontrolovat daňová kontrolaProvést pravděpodobnost 0,997 k určení podílu podniků s porušováním daní. Podle minulého podobného vyšetření byla hodnota průměrné kvadratické odchylky 0,15; Předpokládá se, že velikost vzorkové chyby se má dosáhnout vyšší než 0,05.

Při použití re-náhodného výběru by mělo být zkontrolováno

S nesmyslným náhodným výběrem bude nutné zkontrolovat

Jak vidíte, použití hlavního výběru vám umožní zkoumat mnohem menší počet objektů.

Příklad 11.6. Plánuje se provádět průzkum mzdy V podnicích průmyslu metodou náhodně reprezentovaného výběru. Jaký by měl být počet selektivních agregátů, pokud v době průzkumu v průmyslu činil počet zaměstnaných 100 000 lidí? Chyba výběru by neměla překročit 100 rublů. S pravděpodobností 0,954. Podle výsledků předchozích platových průzkumů v průmyslu je známo, že průměrná kvadratická odchylka je 500 rublů.

V důsledku toho by mělo vyřešit úkol, alespoň 100 lidí by mělo být zahrnuto do vzorku.

Zvažte podrobnosti uvedené výše metody tvorby selektivního souhrnu a vyplývající z této chyby reprezentativnosti.

Skutečný a náhodný vzorek je založen na výběru jednotek z obecné populace náhodně bez jakýchkoliv prvků systému. Technicky se náhodný výběr provádí metodou výkresu (například loterie čerpá) nebo na tabulce náhodných čísel.

Self-náhodný výběr "V jeho čisté formě" v praxi selektivní pozorování je zřídka aplikován, ale je to počáteční jedno mezi jinými typy výběru, implementuje základní principy selektivního pozorování. Zvažte některé otázky teorie selektivní metody a chybový vzorec pro jednoduchý náhodný vzorek.

Chyba selektivního pozorování je rozdíl mezi hodnotou parametru v obecné populaci a její hodnotu vypočtená podle výsledků pozorování vzorku. Pro průměrnou kvantitativní funkci je určena chyba vzorkování

Indikátor se nazývá výběrová okrajová chyba.

Selektivní průměr je náhodná hodnota, která může mít různé hodnoty v závislosti na tom, které jednotky stiskněte vzorek. V důsledku toho jsou chyby odběru vzorků také náhodné hodnoty a mohou mít různé hodnoty. Proto definují průměr možné chyby - Průměrná chyba vzorkování, která závisí na:

  • 1) Objem vzorkování: Čím vyšší je číslo, tím menší je hodnota průměrné chyby;
  • 2) Stupeň změny studovaného prvku: čím méně variabilita funkce, a následně disperze, tím méně průměrné chyby vzorkování.

S náhodným opětovným výběrem se vypočítá průměrná chyba

Prakticky, obecná disperze rozhodně není známa, ale v teorii pravděpodobnosti je to prokázáno

Vzhledem k tomu, že hodnota s dostatečně velkým n je blízko 1, můžeme předpokládat, že. Pak lze vypočítat průměrnou chybu vzorkování:

Ale v případech malých vzorků (na N30) musí být zvážen koeficient a průměrná chyba malých vzorků počítat na vzorci

S náhodným non-náhodným vzorkem jsou výše uvedené vzorce upraveny podle velikosti. Pak průměrná chyba korpitelného vzorku:

Protože Vždy méně, pak je multiplikátor () vždy menší než 1. To znamená, že průměrná chyba s neporušeným výběrem je vždy menší než při opakování.

Mechanický vzorek se používá, když je obecný soubor jakýmkoliv způsobem zefektivněn (například seznamy voličů podle abecedy, telefonní čísla, domy, byty). Výběr jednotek se provádí prostřednictvím určitého intervalu, který je roven zpětné hodnotě procenta vzorkování. Takže s 2% vzorkem, každý 50 jednotek je vybrána \u003d 1 / 0,02, při 5% každé 1 / 0,05 \u003d 20 jednotky obecné populace.

Začátek odkazu je vybrán různé způsoby: náhodně, od středu intervalu, se změnou na začátku reference. Hlavní věc je vyhnout se systematické chybě. Například při 5% vzorku, pokud je první jednotka vybrána 13., pak následující 33, 53, 73 atd.

Přesnost je mechanický výběr v blízkosti náhodného vzorku. Proto určit průměrnou chybu mechanického vzorku použijte vzorce skutečného a náhodného výběru.

V typickém výběru je zkoumaná sada předem rozdělena do homogenních, stejných skupin typů. Například při zkoumání podniků to může být průmysl, sub-sektory, ve studiu obyvatelstva, sociálních nebo věkových skupin. Pak je zde nezávislá volba z každé skupiny s mechanickým nebo skutečným a náhodným způsobem.

Typický vzorek poskytuje přesnější výsledky ve srovnání s jinými metodami. Typifikace obecné populace poskytuje reprezentativní kancelář ve vzorku každé typologické skupiny, což umožňuje odstranit účinek montované disperze na průměrnou chybu vzorku. V důsledku toho, když je typická chyba odběru vzorků v souladu s pravidly přidávání disperzí (), je nutné zvážit pouze průměr skupinových disperzí. Průměrná chyba vzorkování:

s opětovným výběrem

s nevratným výběrem

kde je průměrem intrikaroup disperzí ve vzorku.

Výběr sériového (nebo hnízda) je aplikován v případě, kdy je obecná sada rozdělena do série nebo skupiny před začátkem průzkumu vzorku. Tyto série mohou být balení hotových výrobků, skupin studentů, brigády. Série průzkumu je vybrána mechanickým nebo náhodným způsobem a v sérii pevných průzkumů jednotek. Průměrná chybová chyba odběru vzorků proto závisí pouze na katalogu (intersekren) disperze, která se vypočítá vzorec:

kde r je počet vybraných sérií;

Průměrný I-ta série.

Vypočítá se průměrná chyba sériového vzorku:

s opětovným výběrem

s nevratným výběrem

kde r je celkový počet sérií.

Kombinovaný výběr je kombinace zvažovaných výběrových metod.

Průměrná chyba vzorkování v jakémkoli způsobu výběru závisí především na absolutní velikosti vzorku a v menší míře - od procenta vzorku. Předpokládejme, že 225 pozorování se koná v prvním případě z obecné populace 4500 jednotek a ve druhé - ve 225 000 jednotkách. Disperze v obou případech se rovná 25. Poté v prvním případě, s výběru 5% bude vzorová chyba:

Ve druhém případě se při výběru 0,1% bude roven:

S poklesem procentního podílu odběru vzorků 50 krát se chyba odběru vzorků mírně zvýšila, protože velikost vzorku se nezměnila.

Předpokládejme, že velikost vzorků se zvýšila na 625 pozorování. V tomto případě je chyba vzorkování:

Zvýšení vzorku 2,8 krát se stejným počtem obecné populace snižuje velikosti vzorku více než 1,6 krát.

Nesrovnalosti mezi hodnotou jakéhokoli indikátoru nalezeného statistickým pozorováním a jeho platné velikosti se nazývají chyby pozorování . V závislosti na příčinách výskytu existují chyby registrace a chyby reprezentativnosti.

Registrační chyby vznikají v důsledku nesprávného zřízení faktů nebo chybného záznamu v procesu pozorování nebo průzkumu. Jsou náhodné nebo systematické. Náhodné registrační chyby mohou být provedeny tak, jak bylo dotázáno ve svých odpovědích a registrátorů. Systematické chyby mohou být úmyslné a neúmyslné. Úmyslné - vědomé, tendenčnímu zkreslení skutečné situace případu. Neúmyslné jsou způsobeny různými náhodnými příčinami (nedbalost, nepozornost).

Reprezentativní chyby (Recenze) vznikají v důsledku neúplného průzkumu a v případě, že zkoumaný totalita není plně reprodukována obecnou populací. Mohou být náhodné a systematické. Náhodné chyby reprezentativnosti jsou odchylky vyplývající z nezaplaceného pozorování vzhledem k tomu, že kombinace vybraných pozorovacích jednotek (vzorek) neúplně reprodukuje celou celek obecně. Systematické chyby reprezentativnosti jsou odchylky vyplývající z porušení principů náhodného výběru jednotek. Reprezentativní chyby jsou organicky inherentní v selektivním pozorování a dochází z důvodu, že selektivní sada zcela reprodukuje obecný. Vyhýbání se chybám reprezentativnosti nelze zabránit, nicméně použití metod teorie pravděpodobnosti založené na použití limitních větrodnostů zákona velkého čísla mohou být tyto chyby sníženy na minimální hodnoty, jejichž hranice jsou instalovány s dostatečně velká přesnost.

Chyby odběru vzorků - rozdíl mezi vlastnostmi selektivního a všeobecného souhrnu. Pro průměrnou hodnotu bude chyba určena vzorcem

kde

Hodnota
volala maximální chyba vzorky.

Odběr vzorků chyb - náhodná hodnota. Mezní věty zákona velkých čísel jsou věnovány studiu vzorů náhodných chyb vzorků. Tyto vzory jsou nejvíce podrobně popsány v teorémech P. L. Chebyshev a A. M. Lyapunov.

Teorem P. L. Chebyshev s ohledem na zváženou metodu je možné formulovat takto: s dostatečně velkým počtem nezávislých pozorování, je možné s pravděpodobností v blízkosti jednoho (tj. Téměř spolehlivosti), bude argumentovat, že odchylka vzorku Střední od generála bude stejně malé. V P. L. Chebyshevovi teorému bylo prokázáno, že velikost chyby by neměla překročit . Na otočení Vyjádření průměrné kvadratické odchylky vzorového média z obecného středu závisí na přenosu rysy v obecné populaci a počet vybraných jednotek n.. Tato závislost je vyjádřena vzorcem

, (7.2)

kde záleží také na způsobu odběru vzorků.

Velikost =volání průměrná chyba vzorkování. V tomto výrazu - obecná disperze, n.- Objem selektivního agregátu.

Zvažte, jak počet vybraných jednotek ovlivňuje hodnotu průměrné chyby. n.. Je logický, aby se ujistil, že při výběru velkého počtu nesrovnalostí mezi průměry bude menší než to, tj. Existuje zpětná vazba mezi průměrnou chybou vzorku a počtem vybraných jednotek. Zároveň není jednoduše tvořena inverzní matematickou závislost, ale takovou závislost, která ukazuje, že čtverec nesrovnalostí mezi průměry je nepřímo úměrné počtu vybraných jednotek.

Zvýšení sekcí funkce znamená zvýšení průměrné kvadratické odchylky a následně chyby. Pokud předpokládáme, že všechny jednotky budou mít stejnou hodnotu znaku, pak průměrná kvadratická odchylka bude nulová a ukázková chyba bude také zmizet. Pak není třeba aplikovat vzorek. Je však třeba mít na paměti, že velikost údajů v obecné populaci není známa, protože rozměry jednotek v něm nejsou známy. Můžete vypočítat pouze části znaku ve vzorkové sadě. Poměr mezi disperzí obecného a selektivního agregátu je vyjádřen vzorcem

Od hodnoty s poměrně velkým n.v blízkosti jednoho, jeden může přibližně věřit, že selektivní disperze se rovná obecné disperze, tj.

Průměrná chyba vzorkování vyplývá, které odchylky vlastností selektivního souboru z odpovídajících charakteristik obecné populace jsou možné. Velikost této chyby však může být posuzována určitou pravděpodobností. Pravděpodobnost označuje násobitel

Teorem A. M. Lyapunova . A. M. Lyapunov se ukázal, že distribuce selektivních průměrů (v důsledku toho jejich odchylky od generálního moderátora) s dostatečně velkým počtem nezávislých pozorování přibližně obvykle za předpokladu, že obecná populace má konečnou průměrnou a omezenou disperzi.

Matematicky teorem lyapunovamůžete psát takto:

(7.3)

kde
, (7.4)

kde
- matematická konstanta;

chyba výběru LIMIT , což umožňuje zjistit, jaké limity jsou hodnota generálního moderátora.

Hodnoty tohoto integrálu pro různé hodnoty koeficientu důvěry t.vypočteny a jsou uvedeny ve speciálních matematických tabulkách. Zejména kdy:

InfoFar as. t.označuje pravděpodobnost nesouladu
, tj. Na pravděpodobnost, na které se velikost, obecný průměr se liší od selektivního média, může být číst takto: s pravděpodobností 0,683, lze ji argumentovat, že rozdíl mezi selektivními a obecnými průměry nepřekročí jednu hodnotu průměrné chyby vzorku. Jinými slovy, v 68,3% případů, reprezentativnost chyba nebude mimo limity
S pravděpodobností 0,954 lze argumentovat, že chyba reprezentativnosti nepřesahuje
(tj. V 95% případů). S pravděpodobností 0,997, tj. Spíše blízko jednoho, lze očekávat, že rozdíl mezi vzorkem a obecným průměrem nebude překročit třídenní střední chybu vzorku atd.

Logicky, připojení zde vypadá zcela jasně: čím více je povoleno limity, ve kterých je povolena možná chyba, častěji posoudit jeho velikost.

Znát selektivní střední hodnotu
a omezit chybu vzorkování
, můžete definovat hranice (limity), ve kterých byl obecný průměr uzavřen

1 . Vlastně náhodný vzorek - Tato metoda je zaměřena na vzorek jednotek od obecné populace bez jakéhokoliv odstranění na straně nebo skupině. Současně dodržovat základní princip odběru vzorků - rovných příležitostí pro všechny jednotky obecné populace, které mají být vybrány - schéma náhodné extrakce jednotek výkresem (loterií) nebo tabulka náhodných čísel. Opakovaný a nerubustný výběr jednotek

Průměrná chyba skutečného náhodného vzorku je předpokládaný submisivní odchylkou možných hodnot vzorového média od obecného moderátora. Chyby při odběru vzorků s cenově dostupnou metodou výběru jsou uvedeny v tabulce. 7.2.

Tabulka 7.2.

Průměrná chyba odběru vzorků μ

Ve výběru

opakovaný

zachytit

Pro střední

Tabulka používá následující notaci:

- disperze selektivního agregátu;

- počet vzorků;

- počet generálních agregátů;

- selektivní podíl jednotek se studovaným znakem;

- počet jednotek se studovaným znakem;

- Počet vzorku.

Zvýšit přesnost namísto násobitele musí být přijato multiplikátor
Ale s velkými čísly N.rozdíl mezi těmito výrazy nezáleží.

Maximální chyba náhodného vzorku
vypočteno vzorcem

, (7.6)

kde t. - Součinitel důvěryhodnosti závisí na hodnotě pravděpodobnosti.

Příklad.Při zkoumání sto vzorků produktů vybraných ze strany v náhodném pořadí, 20 se ukázalo být nestandardní. S pravděpodobností 0,954 určete limity, ve kterých existuje podíl nestandardních produktů ve straně.

Rozhodnutí. Vypočítat obecný podíl ( R.):
.

Podíl nestandardních produktů:
.

Omezující chyba selektivního laloku s pravděpodobností 0,954 se vypočítá vzorcem (7.6) pomocí tabulky vzorce. 7.2 Pro akci:

S pravděpodobností 0,954 lze argumentovat, že podíl nestandardních produktů v šarži zboží je v rozmezí 12% ≤ P.≤ 28 %.

V praxi navrhování selektivního pozorování je třeba určit velikost vzorku, který je nezbytný pro zajištění určité přesnosti výpočtu obecných průměru. Chyba výběru a jeho pravděpodobnost jsou zadány. Od vzorce
a vzorce průměrných chyb vzorkování jsou stanoveny požadovaným počtem odběru vzorků. Vzorce pro určení velikosti vzorku ( n.) Závisí na způsobu výběru. Výpočet velikosti vzorku pro náhodný vzorek je uveden v tabulce. 7.3.

Tabulka 7.3.

Odhadovaný výběr

pro střední

Opakovaný

Zachytit

2 . Mechanický vzorek - Zároveň metoda probíhá z účetnictví pro některé funkce umístění objektů v obecné populaci, jejich objednání (na seznamu, číslo, abeceda). Mechanický vzorek se provádí výběrem určitých objektů obecné populace prostřednictvím určitého intervalu (každých 10. nebo 20.). Interval se vypočítá ve vztahu k kde n.- počet vzorků, N.- počet generálních agregátů. Pokud by tedy jeden z agregátu 500 000 jednotek měl získat 2% vzorek, tj. Výběr 10 000 jednotek, podíl výběru bude
Výběr jednotek se provádí v souladu se stanoveným poměrem prostřednictvím stejných intervalů. Pokud je umístění objektů v obecné populaci náhodné, je mechanický vzorek obsahu podobný náhodnému výběru. S mechanickým výběrem platí pouze nerepomotivní vzorek.

Průměrná chyba a počet odběru vzorků během mechanického selekce se vypočítá vzorce skutečného odběru vzorků (viz tabulka 7.2 a 7.3).

3 . Typický vzorek , ve které je obecná populace rozdělena některými základními rysy pro typické skupiny; Výběr jednotek je vyroben z typických skupin. V tomto případě metody výběru je obecná populace rozložena homogenním v některých ohledech skupiny, která má své vlastní vlastnosti, a otázka se sníží na stanovení vzorků z každé skupiny. Možná jednotný vzorek - V této metodě je z každé typické skupiny vybrán stejný počet jednotek.
Tento přístup je odůvodněn pouze s rovností počtu zdrojových typických skupin. V typickém výběru, nepřiměřené objem skupin, celkový počet vybraných jednotek je rozdělen do počtu typických skupin, výsledná hodnota dává počtu výběru z každé typické skupiny.

Pokročilejší forma výběru proporcionální vzorek . Proporcionální je schéma tvorby selektivního agregátu, kdy počet vzorků odebraných z každé typické skupiny v obecné populaci je úměrný číselům, disperzím (nebo kombinovaným a číslům a disperzím). Podmíněně určete počet vzorků 100 jednotek a vyberte jednotky ze skupin:

v poměru k počtu jejich generálního agregátu (Tabulka 7.4). Tabulka označuje:

N. i. I. - počet typické skupiny;

d. j. - Podíl ( N. I / N.);

N.- počet generálních agregátů;

n. i. I. - Vypočítá se počet vzorků z typické skupiny:

, (7.7)

n.- počet vzorků z obecné populace.

Tabulka 7.4.

N. i. I.

d. j.

n. i. I.

v poměru k průměrné kvadratické odchylce (Tabulka 7.5).

zde . i. I. - Průměrná kvadratická odchylka typických skupin;

n. i. I. - počet vzorků z typické skupiny je vypočítán vzorcem

(7.8)

Tabulka 7.5.

N. i. I.

n. i. I.

kombinovaný (Tabulka 7.6).

Velikost vzorku se vypočítá vzorec

. (7.9)

Tabulka 7.6.

i. I. N. i. I.

Při provádění typického vzorku se okamžitý výběr z každé skupiny provádí náhodným výběrem.

Chyby při odběru vzorků se střední vzorky vypočítávají vzorce tabulky. 7.7 V závislosti na způsobu výběru typických skupin.

Tabulka 7.7.

Způsob výběru

Opakovaný

Zachytit

pro střední

pro podíl

pro střední

pro podíl

Nepřiměřené objem skupiny

Proporcionální svazek

Proporcionální množství ve skupinách (je nejvyšší)

tady
- průměr intragroup disperzí typických skupin;

- podíl jednotek se studovaným označením;

- průměr intrikaroup disperzí pro podíl;

- sekundární kvadratická odchylka ve vzorku i. I.Typická skupina;

- velikost vzorku z typické skupiny;

- celkový vzorkování;

- objem typické skupiny;

- objem obecné populace.

Počet vzorků z každé typické skupiny by měl být úměrný průměrné kvadratické odchylky v této skupině
Trvanlivost
provedené vzorce uvedenými v tabulce. 7.8.

Tabulka 7.8.

4 . Sériový vzorek - Je vhodné v případech, kdy jsou jednotky agregátu kombinovány do malých skupin nebo série. S sériovým vzorkem je obecná populace rozdělena do stejné skupiny - série. V selektivní sadě série jsou vybrány. Podstata sériového vzorku spočívá v náhodném nebo mechanickém selekci série, ve kterém se provádí pevné vyšetření jednotek. Průměrná chyba sériového vzorku s izometrickými řadami závisí na velikosti pouze montážní disperze. Střední chyby jsou shrnuty v tabulce. 7.9.

Tabulka 7.9.

Metoda výběrové řady

pro střední

pro podíl

Opakovaný

Zachytit

Tady R.- počet epizod v obecné populaci;

r.- počet vybraných sérií;

- Intersecore (intergroup) disperze média;

- Intersecienne (intergroup) disperze podílu.

S sériovým výběrem je požadovaný počet vybraných sérií určen stejným způsobem jako u skutečného náhodného způsobu výběru.

Výpočet velikosti sériového vzorku je vyroben vzorce uvedenými v tabulce. 7.10.

Tabulka 7.10.

Příklad.V mechanickém obchodě rostliny v deseti brigádách pracuje 100 pracovníků. Pro studium kvalifikací pracovníků bylo vyrobeno 20% sériového hlavního vzorku, který zahrnoval dva brigády. Dostal následující rozdělení dotazovaných pracovníků v vypouštění:

Vývojové výboje v brigádě 1

Vývojové výboje v brigádě 2

Vývojové výboje v brigádě 1

Vývojové výboje v brigádě 2

Je nutné určit s pravděpodobností 0,997 limitů, ve kterých se nachází průměrný vypouštění pracovníků mechanické dílny.

Rozhodnutí.Definujeme selektivní médium v \u200b\u200bbrigádách a celkový průměr jako průměrný vážený průměrný průměr:

Definujeme disperzi křížové spermií podle vzorců (5.25):

Vypočítejte průměrnou chybu vzorkování podle záložky vzorce. 7.9:

Vypočítáme chybu výběru s pravděpodobností 0,997:

S pravděpodobností 0,997 lze argumentovat, že průměrný vypouštění pracovního mechanického workshopu je uvnitř