Otevřená knihovna je otevřená knihovna vzdělávacích informací. Srovnatelnost statistických seskupení

Sekundární seskupení

Sekundární seskupení je vytváření nových skupin založených na dříve vytvořeném seskupení. K vytvoření nových skupin se používají dvě metody na základě dříve vytvořeného seskupení.

Prvním způsobem je zvětšení počátečních intervalů. Toto je nejjednodušší a nejběžnější způsob.

Druhá metoda se obvykle nazývá metoda přeskupení akcií a spočívá ve skutečnosti, že ke každé skupině je přiřazen určitý podíl jednotek populace. Podívejme se na dva způsoby s příkladem.

Existuje skupina zaměstnanců dvou oddělení jedné z moskevských bank podle velikosti měsíční mzdy (podmíněná čísla).

Tabulka 3.6

Úvěrové oddělení	Směnárna
Skupina č.		Počet zaměstnanců, lidé	Skupina č.	Plat, třít. za měsíc	Počet zaměstnanců, lidé
	2000 - 2500			2000 - 3000
	2500 - 3000			3000 - 5000
	3000 - 4000			5000 - 7000
	4000 - 5000			7000 a více
	5000 a více			-	-
	Celkový			Celkový

Uvedené údaje neumožňují porovnat rozdělení pracovníků podle velikosti měsíčních mezd, protože intervaly jsou různé, v tomto ohledu je nesmírně důležité uvést tyto distribuční řady do srovnatelné podoby.

Udělejme sekundární seskupení, které vytvoří skupiny s novými zvětšenými intervaly.

Tabulka 3.7

V případě sekundárního seskupení metodou přeskupování podílů stanovujeme nové intervaly pro rozdělování pracovníků podle velikosti měsíční mzdy, zatímco pro každý interval stanovujeme určitý podíl jednotek populace. V našem příkladu ponecháváme jedno ze seskupení (pomocí správy úvěrů) nezměněné. A na měnové desce provedeme přeskupení následujícím způsobem. V první skupině s intervalem od 2000 do 3000 rublů. frekvence je 2. Pokud jde o seskupování podle správy úvěrů, je tento interval nesmírně důležité rozdělit se na dva stejné intervaly: od 2000 do 2500 rublů. a od 2 500 do 3 000 rublů, zatímco původní frekvence je rozdělena rovnoměrně. Další interval je od 3 000 do 5 000 rublů. v souladu s tím musí být rozdělen do dvou stejných intervalů: od 3 000 do 4 000 rublů. a od 4 000 do 5 000 rublů, zatímco původní frekvence je rozdělena rovnoměrně (6: 2 \u003d 3). Je nesmírně důležité spojit poslední dvě skupiny do jedné s intervalem 5 000 rublů. a vyšší.

Tabulka 3.8

Skupina č.	Plat, třít. za měsíc	Číslo úvěru pro správu zaměstnanců	Směnný počet vedoucích pracovníků
lidé	v% k celkovému počtu	lidé	v% k celkovému počtu
	2000 - 2500		8,33	3,33
	2500 - 3000		16,67	3,33
	3000 - 4000		25,00	10,00
	4000 - 5000		33,33	10,00
	5000 a vyšší		16,67	73,34
	Celkový		100,00	100,00

testovací otázky

(Vyberte správnou odpověď)

1. Statistický souhrn obsahuje:

a) počítání pouze součtů v datech;

b) seskupování údajů a výpočet součtů;

c) seskupování údajů, výpočet součtů a výpočet souhrnných ukazatelů.

2. Seskupení, ve kterém je studována struktura populace, se obvykle nazývá:

a) typologický; b) strukturální; c) analytické.

3. Atribut seskupení může být:

a) kvantitativní;

b) vysoká kvalita;

c) kvantitativní i kvalitativní.

4. Velikost intervalu se stanoví:

a) horní mez intervalu;

b) spodní hranici intervalu;

c) rozdíl mezi horní a dolní hranicí.

5. Variační řada distribuce je konstruována:

a) na kvalitativním základě;

b) kvantitativně.

6. Frekvence jsou:

a) absolutní čísla;

b) relativní čísla.

7. Frekvence jsou:

a) absolutní čísla;

b) relativní čísla.

8. V diskrétní variační řadě jsou hodnoty prvku vyjádřeny:

a) ve formě čísel;

b) ve formě intervalů.

9. Řada variačních intervalů je graficky znázorněna jako:

a) distribuční polygon;

b) histogramy;

c) kumuluje.

10. Sekundární seskupení se provádí metodou:

a) zkrácení intervalů;

b) konsolidace intervalů;

c) snižování i rozšiřování intervalů;

d) sdílení seskupení.

Téma 3. STATISTICKÉ SHRNUTÍ A Seskupení údajů.

Souhrnné cíle a obsah

Statistické shrnutí je vědecky organizované zpracování statistických pozorovacích materiálů. Účelem shrnutí je získat na základě konsolidovaných materiálů zobecňující statistické ukazatele, které odrážejí podstatu sociálně-ekonomických jevů.

Statistické souhrny se liší několika způsoby:

Složitostí konstrukce shrnutí může být jednoduché nebo složité. Pokud reprezentujeme obecné výsledky za studovanou populaci jako celek bez jakékoli předběžné systematizace shromážděného materiálu, je to tak jednoduché shrnutí .Komplexní shrnutí je komplex operací, které zahrnují seskupení pozorovacích jednotek, výpočet součtů pro každou skupinu a pro celek a prezentaci výsledků seskupení a shrnutí ve formě statistických tabulek.

Podle metody vývoje souhrny jsou rozděleny do centralizované , když jsou všechna data soustředěna v jedné organizaci a sbírána podle vyvinuté metodiky (používané pro zpracování materiálů jednorázových statistických pozorování). Když decentralizovaný zevšeobecňování materiálu se provádí zdola nahoru podél hierarchického žebříčku řízení a v každém z nich se provádí odpovídající zpracování (používá se ke zpracování statistického výkaznictví).

Provedení technikou shrnutí je rozděleno na mechanizované a manuální.

Statistickým shrnutím je tedy systematizace a seskupování digitálních dat, charakteristika vytvořených skupin, systém ukazatelů, výpočet odpovídajících součtů a prezentace souhrnných výsledků ve formě tabulek, grafů.

K provedení souhrnu je vypracován plán, který stanoví organizační otázky: kdo a kdy budou všechny operace provedeny, postup pro jeho provádění, složení informací, které mají být zveřejněny v periodikách.

Metoda seskupování

Ve fázi shrnutí jsou počáteční informace systematizované, vytvářejí se oddělené statistické populace, tj. provede se statistické seskupení.

Seskupení - Jedná se o rozdělení populace na skupiny, které jsou nějakým způsobem homogenní.

Zvláštní typ seskupení je klasifikace... Vychází z nejdůležitějších rysů, které se mění jen velmi málo (například klasifikace odvětví národní ekonomiky, klasifikace dlouhodobých aktiv).

Charakteristické znaky klasifikace:

Základem je kvalitativní rys.

Jsou standardní.

Jsou odolní.

To znamená, že klasifikace je legalizované, obecně uznávané, normativní seskupení. Klasifikace je základem seskupení.

Atribut seskupení- Toto je znaménko, pomocí kterého se jednotlivé jednotky populace spojují do homogenních skupin. Jsou atribuční - na kvalitativním základě a kvantitativní.

Klasifikace skupinových znaků

Formou vyjádření

atributivní které nemají kvantitativní vyjádření (profese, vzdělání);

kvantitativní : 1)oddělený(diskontinuální), jejichž hodnoty jsou vyjádřeny pouze v celých číslech (počet pokojů, děti); 2) nepřetržitě,hodnoty, které mohou být celé i zlomkové.

Podle povahy oscilace

alternativní které některé jednotky vlastní a jiné ne (kvalita);

mající mnoho kvantitativních hodnot

Role prvku ve vztahu studovaných jevů

faktoriální, ovlivňují další příznaky;

efektivní, ovlivněny ostatními

Sturgessův vzorec se používá k nalezení počtu skupin

n \u003d 1 + 3,322 lgN,

kde N je počet prvků v populaci.

Podle tohoto vzorce závisí výběr počtu skupin na velikosti populace.

Nevýhodou vzorce je to, že jeho použití dává dobré výsledky, pokud populace sestává z velkého počtu jednotek a rozdělení jednotek na základě seskupení je téměř normální.

Dalším způsobem, jak určit počet skupin, je použití indikátoru standardní odchylky (). Vypočítá se

kde je průměrná hodnota atributu v populaci, která je určena vzorcem;

E hodnota proměnné funkce;

standardní odchylka.

Pokud je hodnota intervalu 0,5, pak je populace rozdělena do 12 skupin, a když je hodnota intervalu 2/3 a, pak je populace rozdělena do 9 a 6 skupin.

Pokud jsou rozděleny do 6 skupin, získají se následující intervaly:

Tyto metody nezaručují, že se nevytvoří „prázdné“ nebo malé skupiny. Skupiny jsou považovány za „prázdné“, pokud neobsahují žádnou jednotku populace. Přítomnost takových intervalů znamená, že seskupení není sestaveno správně.

Po určení počtu skupin by měly být stanoveny intervaly seskupování.

Interval- představuje interval mezi maximální a minimální hodnotou charakteristiky ve skupině.

Každý interval má svou vlastní hodnotu, horní a dolní hranici nebo alespoň jednu z nich.

Dolní mez intervalu je nejmenší hodnota prvku v intervalu a horní mez je největší hodnota prvku v něm. Hodnota intervalu je rozdíl mezi horní a dolní mezí intervalu.

Intervaly seskupení jsou v závislosti na jejich velikosti stejné a nerovnoměrné. Nerovnosti se dělí na postupně rostoucí, postupně klesající, svévolné a specializované.

Pokud se variace zvláštnosti projeví v relativně úzkých hranicích a distribuce je víceméně rovnoměrná, pak se vytvoří seskupení v pravidelných intervalech .

Hmax - Xmin

h \u003d ----------------;

Před určením rozsahu variace se doporučuje vyloučit z populace neobvyklá pozorování.

Hodnota získaná vzorcem se zaokrouhlí. Je to krok intervalu.

Pro určení kroku intervalu existují následující pravidla.

Pokud je hodnota intervalu hodnota, která má jedno desetinné místo (například 0,66; 1,372; 5,8), je vhodné zaokrouhlit získané hodnoty na desetiny a použít je jako krok intervalu. (0,7; 1,4; 5,8).

Pokud má vypočtená hodnota intervalu dvě významné číslice před desetinnou čárkou a několik desetinných míst, musí být tato hodnota zaokrouhlena nahoru na

Například Xmax \u003d 180, Xmin \u003d 80, n \u003d 5.

h \u003d (Xmax - Xmin) / p;

h \u003d (180 - 80) / 5 \u003d 20;

Proto jsme dostali následující intervaly

80-100; 100-120; 120-140; 140-160; 160-180.

b) nerovný,když se šířka intervalu postupně zvětšuje a horní interval se často vůbec nezakrývá. Nerovnoměrné intervaly se v ekonomické praxi používají častěji.

v) otevřeno,pokud je k dispozici pouze horní nebo horní část spodní řádek. Potřeba otevřených intervalů je způsobena šířením kvantitativních hodnot, které vyžadují vytvoření mnoha skupin, pokud jsou odděleny oběma hranicemi.

d) zavřenokdyž existuje dolní i horní hranice. Pokud jsou nedělitelné jednotky, lidé, pak 1-3, 4-7, 8-11. Při nepřetržité změně funkce slouží stejné číslo jako horní a dolní hranice dvou sousedních skupin (90-120, 120-150, 150-180).

S takovou konstrukcí intervalů je otázka přiřazování jednotek předmětu pozorování skupinám v praxi řešena dvěma způsoby: podle principu „inkluzivní“ a „výhradně“.

Aplikace závisí na způsobu psaní intervalů, zejména na první a poslední skupině.

180 a více - výhradně - 180 je zahrnuto v posledním

nad 180 - včetně - 180 je zahrnuto v předchozím.

V praxi se setkáváme s oběma, ale přednost se dává zásadě „výhradně“.

Střed intervalů je určen několika metodami.

Sečteme horní a dolní mez intervalu a vydělíme 2.

Střed 2. intervalu plus hodnota intervalu.

Střed 2. intervalu mínus hodnota intervalu (pro otevřený).

Do středu předposledního intervalu přidejte hodnotu intervalu (pro otevřené).

Typy statistických seskupení

Typologické seskupení. Podstata: Izolace hlavních typů od souboru vlastností charakterizujících studované jevy do kvalitativně homogenních. Pokud atribuční vlastnost, pak je počet skupin určen vlastnostmi studovaného jevu. Například seskupení populace podle pohlaví a věku, počet podle let, PPP, včetně pracovníků, studentů, inženýrů, zaměstnanců, MNP. Výběr typů na základě kvantitativní znakspočívá v určení skupin při zohlednění hodnot studovaných charakteristik. Příklad: školka 0-2; předškolní 3-6; škola 7-17; zdatný 16-54 pro ženy a 16-59 pro muže.

Typologická uskupení se široce používají při studiu sociálně-ekonomických jevů a procesů.

Seskupení podle forem vlastnictví v roce 1998

Strukturální seskupení. Toto jsou seskupení používaná ke studiu struktury studované populace. Většina strukturálních uskupení se vyrábí na základě tvorby kvalitativně homogenních skupin. S pomocí těchto seskupení lze studovat: složení obyvatelstva podle pohlaví, věku, místa pobytu, složení podniků podle počtu zaměstnanců, náklady na stálá aktiva.

Seskupení populace Ruska podle místa pobytu

pro 1959-1994

Analytické seskupení (faktoriální). Používá se ke studiu vztahu mezi jednotlivými vlastnostmi. Například mezi pracovní zkušeností a kvalifikací, dělnickou třídou a vzděláváním. Zvláštnosti analytického seskupení: zaprvé je založen faktorový znak; za druhé, každá vybraná skupina je charakterizována průměrnými hodnotami efektivní vlastnosti.

Seskupení ruských komerčních bank podle výše rozvahových aktiv

Skupina bank podle objemu rozvahových aktiv, mil.	Počet bank, jednotek	V průměru pro jednu banku
Skupina bank podle objemu rozvahových aktiv, mil.	Počet bank, jednotek	počet zaměstnanců, lidé	Rozvahový zisk, miliardy rublů




50 000 a více

Kombinované seskupení. Toto je vytvoření skupin podle dvou nebo více charakteristik, braných v určité kombinaci. Současně jsou atribuční znaky umístěny na začátku v určité sekvenci na základě logiky vztahu indikátorů. Například, skupiny jsou tvořeny formami řízení, jsou rozděleny do podskupin podle úrovně ziskovosti nebo produktivity práce, produktivity kapitálu.

V závislosti na počtu značek položených na jejich základně se dělí na:

Jednoduchý je seskupení založené na jednom atributu.

Komplex seskupování se provádí na dvou nebo více základech

Sekundární seskupení

Sekundární seskupení se nazývá přeskupení již seskupeného materiálu.

K tomu se uchylují:

Když z velkého počtu původně vytvořených skupin je nutné získat menší počet větších skupin.

Pokud je pro účely srovnání nutné převést různě seskupený materiál do srovnatelné podoby.

Statistické distribuční řady

Mezi jednoduchými seskupeními jsou zvlášť rozlišeny distribuční řady.

Distribuční série představují uspořádané uspořádání jednotek studované populace do skupin podle skupinových charakteristik.

Distribuční řady vytvořené podle kvalitativních charakteristik se nazývají atributivní.

Pokud je řada seskupena podle kvantitativního kritéria, variační řada.

Variační řady jsou diskrétní (diskontinuální) a intervalové (kontinuální).

Variační řada se skládá ze dvou prvků: variant a frekvencí.

Volba - jedná se o samostatnou hodnotu proměnné, kterou používá v distribuční řadě.

Frekvence toto je počet jednotlivých variant nebo každá skupina variační řady.

Frekvence vyjádřené ve zlomcích jednotky nebo v% z celkového počtu se nazývají časté. Součet frekvencí je objem distribuční řady.

Například uvedením.

Například diskrétní série.

	Počet studentů	V% k celkovému počtu

Povaha distribuce v diskrétních řadách je graficky znázorněna jako distribuční polygon.

Příklad intervalové řady.

Rozdělení pracovníků podle výroby

Generace, tr.	Počet pracovníků	Kumulativní (kumulované) číslo

Řada distribučních intervalů je graficky znázorněna jako histogram.

V praxi je potřeba transformovat distribuční řady do kumulativní série,na základě akumulovaných frekvencí. Mohou být použity k určení strukturálních prostředků, které usnadňují analýzu dat distribučních řad.

Akumulované frekvence jsou určeny postupným přičtením k frekvencím (nebo částem) první skupiny těchto indikátorů následných skupin distribučních řad. Kumulace a ogivy se používají k ilustraci distribučních řad. Pro jejich vykreslení jsou hodnoty diskrétního prvku (nebo konců intervalů) označeny na ose abscis a kumulativní součty frekvencí (kumulativní) nebo frekvencí (ogive) odpovídající těmto hodnotám prvku jsou označeny na souřadné ose.

Jedním z nejdůležitějších požadavků na statistické distribuční řady je zajistit jejich srovnatelnost v čase a prostoru.... Tuto podmínku poskytují variační řady se stejnými intervaly.

Frekvence jednotlivých nerovnoměrných intervalů v těchto řadách však nejsou přímo srovnatelné. V takových případech pro zajištění nezbytné srovnatelnosti vypočítat hustota distribuce , tj. určit, kolik jednotek v každé skupině je na jednotku intervalu.

Skladujte skupiny podle obratu, tr.	Počet obchodů	Intervalová hodnota, tr.	Distribuční hustota, jednotky (1: 2)

Porovnání frekvencí jednotlivých skupin ukazuje, že nejčastěji existují obchody s intervalem 250-450 tr.

Při konstrukci grafu distribuce variačních řad s nerovnými intervaly se výška obdélníků určuje úměrně ne k frekvencím, ale k ukazatelům distribuční hustoty hodnot studovaného atributu v odpovídajících intervalech.

Statistické tabulky

Výsledky shrnutí a seskupení pozorovacích materiálů jsou prezentovány ve formě statistických tabulek. Umožňují vám prezentovat materiál nejpohodlnějším, nejkompaktnějším, vizuálním a racionálním způsobem.

Ve statistických tabulkách se rozlišuje předmět a predikát. Předmět - je objekt uvedený v tabulce a představuje skupiny a podskupiny, které jsou charakterizovány řadou ukazatelů. Předvídatelný tabulka pojmenuje indikátory, se kterými je objekt studován, tj. předmět.

Statistické tabulky mohou být jednoduché nebo složité.

NA jednoduchý zahrnuje hnědé tabulky, ve kterých seznam jednotlivých objektů slouží jako předmět.

V komplex v tabulkách je předmětem kolekce, rozdělená do skupin podle jedné nebo více charakteristik.

Nazývají se tabulky, jejichž předmět je seskupen podle jednoho atributu skupina.

Pokud jsou v předmětu dvě nebo více seskupení, vyvolá se tabulka kombinační.

Složité tabulky zahrnují korelační a bilanční tabulky.

Rozdělení tabulek na jednoduché, skupinové a kombinované tabulky je založeno na stupni rozebrání předmětu. Predikát však může být zastoupen různými způsoby.

Pokud všechny indikátory predikátu charakterizují předmět samostatně, nezávisle na sobě, pak se takový vývoj predikátu nazývá prostý. Pokud je v predikátu zkombinován jeden znak s jiným, pak se takový vývoj predikátu nazývá složitý.

Statistické tabulky byly poprvé použity při prezentaci statistických údajů v roce 1727 v Rusku I.K. Kirilov v díle "Kvetoucí stát všeho ruského státu"

Použití kombinačních tabulek sahá až do pozdějšího období (1882).

Technické body při sestavování tabulek zahrnují:

Jasnost čísel.

Jednotky měření jsou uvedeny v samostatných sloupcích.

Duplicitní termíny jsou umístěny v obecných záhlaví.

Sloupce a řádky musí být očíslovány.

Ve skupinových a kombinačních tabulkách je vždy nutné uvést souhrnné sloupce a řádky.

Čísla jsou zaokrouhlena se stejnou přesností. Pokud jedna hodnota mnohokrát přesáhne jinou, je lepší vyjádřit získané dynamické ukazatele nikoli v%, ale v časech. Například místo 586% by mělo být 5,9krát více.

V analytických tabulkách by měl být absolutní počet nejmenší. Pokud se v zájmu výzkumu stanoví víceciferná čísla, pak by se mělo od pravého důvodu vyčlenit miliony tisíc jednotek. Například 1458946 p., 1 458 946 p. nebo můžete zaokrouhlit na 2-3 desetinná místa 1,46 milionu rublů.

Pokud jsou v tabulce spolu s údaji o hlášení uvedeny informace o pořadí výpočtu, jsou provedeny výhrady ve formě poznámek pod čarou.

S neúplným objemem studované populace nebo chybějícími počátečními údaji jsou všechny termíny nejprve uvedeny v řádku „celkové součty“ a poté, po vysvětlení, jsou jejich nejdůležitější složky uvedeny v řádku „včetně“.

Jednotlivé buňky nelze vyplnit z následujících důvodů:

a) "x" - buňka není plněna;

b) „...“ - neexistují žádné informace;

c) „-“ - samotný jev chybí;

d) 0,0 - při zaokrouhlování s větší přesností se může objevit významná číslice.

Statistické grafy

Statistický graf je výkres, na kterém jsou zobrazeny statistické údaje za použití obvyklých geometrických tvarů (čáry, body, symboly).

Za zakladatele grafické metody ve statistice se považuje anglický ekonom W. Playfair (1731-1798). Ve své práci „Obchodní a politický atlas“ (1786) byly nejprve použity metody grafického znázornění statistických dat (lineární, sloupcový, sektorový a další diagramy).

Hlavní prvky grafu zahrnout:

Grafické pole je místo, kde se provádí. Obecně se uznává, že nejoptimálnější pro vizuální vnímání je graf vytvořený na pravoúhlém poli s poměrem stran 1: 1,3 až 1: 1,5 (pravidlo "zlatého řezu"). Někdy se také používá čtvercová krabice.

Grafický obrázek - jedná se o symbolická označení, pomocí kterých se zobrazují statistické údaje.

Prostorové a měřítkové památky. Prostorové památky určit umístění symbolů v poli grafu. Jsou definovány mřížkou nebo konturami. Měřítko - dát grafickým obrázkům kvantitativní význam, který je zprostředkován pomocí měřítkového systému .

Vysvětlení grafu - toto vysvětlení jeho obsahu, zahrnuje název grafu, vysvětlení měřítka měřítka, vysvětlení jednotlivých prvků grafického obrazu.

Otázka 10. Sekundární seskupení, způsoby jeho implementace.

Seskupení - Jedná se o rozdělení studované statistické populace na části podle jedné nebo více skupinových charakteristik. Správně provedené seskupení do značné míry zajišťuje spolehlivost celé statistické studie.

Primární seskupení se provádí na základě třídění primárních zdrojových dat.

Seskupení postavená na stejné časové období, ale pro různé regiony, nebo naopak pro jednu oblast, ale pro dvě různá časová období, se může ukázat jako nesrovnatelná z důvodu odlišného počtu vybraných skupin nebo rozdílu v hranicích intervalů. V tomto případě musíte přeskupit data pomocí sekundárního seskupení.

Sekundární seskupení - operace k vytvoření nových skupin na základě dříve provedeného seskupení.

Existují dva způsoby, jak vytvořit nové skupiny.

1. nejjednodušší a nejběžnější způsob je změnit (často zvětšit) počáteční intervaly.

2. Dole přesmyk- metoda spočívá ve vytvoření nových skupin na základě přiřazení určité skupiny jednotek obyvatelstvu každé skupině.

Příklad. Je nutné přeskupit data a vytvořit nové skupiny s intervaly až 500, 500 - 1000, 1000 - 2000, 2000 - 3000, přes 3000 rublů. podle údajů o rozdělení zakázek stavební firmy podle zisku.

Stůl. Rozdělení zakázek stavební společnosti podle zisku

První nová skupina bude zahrnovat celou 1. skupinu smluv a část druhé skupiny. Chcete-li vytvořit skupinu až 500 tisíc rublů, je nutné vzít 100 tisíc rublů z intervalu druhé skupiny. Velikost intervalu pro tuto skupinu bude 600 tisíc rublů. V důsledku toho je nutné vzít z toho 1/6 (100: 600). Podobná část v nově vytvořené nové skupině musí být převzata z počtu smluv, tj. 20 1/6 - 3 smluv. Poté bude v 1. skupině uzavřeno 16 + 3 \u003d 19 smluv. Druhou novou skupinu tvoří smlouvy druhé skupiny mínus smlouvy uvedené v 1., tj. 20 - 3 \u003d 17 jednotek. Nově vytvořená třetí skupina bude zahrnovat všechny smlouvy třetí skupiny a část smluv 4. skupiny. Chcete-li určit tuto část z intervalu 1800 - 3 000 (šířka intervalu je 1200 tisíc rublů), musíte k předchozímu přidat 200 tisíc rublů. (takže horní mez intervalu byla 2000 rublů). Je proto nezbytné vzít část intervalu rovnou 200: 1200, tj. 1/6. V této skupině je 74 smluv, což znamená, že musíte vzít 74 ¦ (1: 6) \u003d 12 jednotek. Třetí nová skupina bude zahrnovat: 44 smluv N-12 - 56. Nově vytvořená čtvrtá skupina bude zahrnovat: 74 - 12 \u003d 62 smluv zbývajících z předchozí 4. skupiny. Pátá nově vytvořená skupina bude sestávat ze smluv z 5. a 6. předchozí skupiny: 37 + 9 \u003d 46 smluv. Technika přeskupování je uvedena v tabulce.

Podstata a typy statistických seskupení.
Seskupení podle kvantitativních kritérií.
Distribuční řady, jejich typy a grafické znázornění.

Podstata a typy statistických seskupení

V důsledku první fáze statistického výzkumu (statistické pozorování) se získá jeden statistické informace, což je velké množství primárních, rozptýlených informací o jednotlivých jednotkách předmětu výzkumu (například záznamy o každém občanu země v sčítání lidu: pohlaví, národnost, věk, vzdělání atd.).

Dalším úkolem statistiky je uvést tyto materiály v určitém pořadí, systematizovat a na tomto základě podat souhrnný popis celého souboru skutečností, aby bylo možné studovat charakteristické rysy a charakteristické rysy studovaného jevu a identifikovat vzorce jeho vývoje. Toho je dosaženo ve druhé fázi statistického výzkumu, jehož první fází je statistické shrnutí.

Statistické shrnutí Je vědecky organizované zpracování primárních dat za účelem získání zobecňujících charakteristik zkoumaného jevu pro řadu základních funkcí.

Pokud se pro studovanou sadu pozorovacích jednotek počítají pouze celkové součty, souhrn se nazývá jednoduchý. Například: Chcete-li zjistit celkový počet studentů vysokých škol Ukrajiny, stačí k určitému datu přidat počet studentů všech vysokých škol.
Statistické shrnutí obsahuje následující základní prvky:

výběr skupinových charakteristik (například po sčítání lze populaci rozdělit do skupin podle charakteristik: pohlaví, věk, národnost);
distribuce dat do částí (skupin a podskupin);
výpočet údajů o konečné skupině pomocí systému statistických ukazatelů.
systematizace výsledků získaných ve formě statistických tabulek.

Kombinace jednotlivých jednotek statistické populace do skupin se provádí pomocí metody seskupování.

Statistické seskupení Je proces vytváření homogenních skupin podle řady základních rysů. Seskupování se provádí buď rozdělením populace do samostatných částí, které se vyznačují vnitřní homogenitou a liší se v řadě charakteristik, nebo sloučením jednotlivých jednotek do skupin podle typických charakteristik (například seskupení průmyslových podniků podle formy vlastnictví, seskupení populace podle průměrného příjmu na hlavu, seskupení komerčních bank podle výše aktiv rozvahy atd.).

Známky, kterými jsou jednotky studované populace rozděleny do skupin, se nazývají seskupování znamenínebo základ seskupení... Pokud je seskupení získáno kvantitativně, nazývá se kvantitativní, kvalitativně - atribuční nebo kvalitativní.
Ve statistické analýze jsou skupině přiřazeny následující funkce:

identifikace sociálně-ekonomických typů jevů;
studium strukturních a strukturálních změn;
analýza vztahů mezi jevy.

V souladu s těmito funkcemi se rozlišují typologické, strukturální a analytické (faktorové) skupiny.
Typologické seskupení je distribuce kvality heterogenní agregovat do tříd, sociálně-ekonomické homogenní typy. Tento typ zahrnuje seskupení zemí podle sociopolitické struktury, podniky - podle formy vlastnictví, populace - podle místa pobytu (městské a venkovské).

Oddělení homogenní agregovat do skupin za účelem identifikace jeho vnitřní struktury se nazývá strukturální seskupení. Charakterizuje složení populace, objem (hmotnost) jednotlivých skupin.
Tabulka 1 - Seskupení spotřebitelů jogurtu podle věku

Analýza strukturních seskupení, která se berou v několika obdobích nebo bodech v čase, ukazuje změnu struktury zkoumaných jevů, tj. strukturální zlomy, což odráží vzorce jejich vývoje.

Analytické skupiny jsou používány ke studiu přítomnosti vztahu mezi studovanými jevy. Za tímto účelem by údaje měly být seskupeny podle jedné z charakteristik, průměrná hodnota druhé charakteristiky by měla být vypočtena v každé skupině a pak by měly být porovnány změny studovaných charakteristik. Pokud se zvýšením nebo snížením atributu seskupení zvýší hodnoty druhého atributu, pak mezi nimi existuje spojení (přímé nebo inverzní).
Tabulka 2 - Seskupení obchodů podle počtu zaměstnanců (podmíněné údaje)

Počet zaměstnanců, lidé	Počet obchodů	Průměrná skutečná délka pracovního týdne, h





100 a více

Údaje ukazují, že existuje vztah mezi velikostí podniku a zaměstnáním jeho zaměstnanců: čím více je obchod zaměstnán, tím kratší je pracovní týden.

Jsou-li skupiny vytvořené podle jedné charakteristiky rozděleny do skupin podle druhé atd. funkce, pak se takové seskupení nazývá kombinovaný... Například distribucí skupin spotřebitelů jogurtu podle pohlaví získáme kombinované seskupení.
Tabulka 3 - Seskupení spotřebitelů jogurtu podle věku a pohlaví

Skupiny spotřebitelů podle věku, let	Počet spotřebitelů, lidé

			mužský	ženský
Méně než 20 20-30 30-40 40-50 50-60 Více než 60	10 40 30 10 6 4	4 17 12 6 3 1		6 23 18 4 3 3

Seskupení podle množství

Při sestavování strukturálních seskupení na základě kvantitativních charakteristik se stanoví počet skupin a intervaly seskupování.

Interval- kvantitativní hodnota, která definuje a odděluje jednu skupinu od druhé, tj. vymezuje kvantitativní hranice skupin.
Intervaly mohou být stejné nebo nerovnoměrné. Například: podle počtu zaměstnanců lze podniky rozdělit do skupin: až 100, 100–200, 200–500, 500–1 000, 1 000 a více. Důvodem je skutečnost, že změna znaménka o 50-100 lidí. je zásadní pro malé podniky, ale ne pro velké podniky.
Pro skupiny se stejnými intervaly je hodnota (délka, krok) intervalu určena vzorcem:

,
kde, - největší a nejmenší hodnota prvku;
k - počet skupin (intervalů), stanovený Sturgessovým vzorcem:

kde N je počet jednotek v populaci.
Nečísla získaná ve výpočtech se zaokrouhlí nahoru.
Například: je třeba seskupit ve stejných intervalech 20 pracovníků pracujících v dílnách podle jejich produktivity práce. Nejvyšší produktivita je 180 dílů na směnu, nejnižší 60.
Počet skupin:
Délka intervalu: děti
Dolní limit 1. skupiny je 60 dílů, horní limit 60 + 20 \u003d 80 dílů. Druhá skupina: dolní hranice 80, horní 80 + 20 \u003d 100 atd. Výsledkem je taková intervalová řada (nebo takové skupiny pracovníků), podrobnosti:

1. skupina: 60–80
2. skupina: 80-100
3. skupina: 100-120
4. skupina: 120-140
5 skupina: 140-160
Skupina 6: 160-180

V tomto rozdělení existuje nejistota, která skupina má přiřadit jednotku populace, jejíž hodnota se rovná mezní hodnotě intervalu (pracovníci s produktivitou 80, 100, 200 atd. Dětí / cm). Pro odstranění nejistoty se používá princip rovnoměrnosti: levá spodní hranice intervalu zahrnuje určenou hodnotu a horní ne. To znamená, že pracovník produkující 100 dětí / cm je zařazen do skupiny 3.

Skupinové intervaly mohou být zavřeno- jsou - li stanoveny horní a dolní meze (jako v příkladu), a - otevřenokdyž je zadána pouze jedna z hranic. Například intervaly „méně než 60“ nebo „180 a vyšší“ jsou otevřené intervaly. Pro výpočet ukazatelů statistické populace musí být otevřené intervaly „uzavřené“. K tomu použijte hodnotu intervalu sousedícího s „otevřeným“. V příkladu dostaneme: 40-60 a 180-200.

Výše uvedené se týká seskupení, která jsou vytvářena na základě analýzy primárního statistického materiálu. Často se však musí používat již existující seskupení, která nesplňují požadavky analýzy. Například seskupení nemusí být srovnatelné kvůli odlišnému počtu skupin nebo nerovným mezím intervalu. Pro přiblížení seskupení do srovnatelné podoby se používá metoda sekundární seskupení, která spočívá ve vytvoření nových skupin na základě dříve provedeného seskupení. Toto přeskupení je možné dvěma způsoby: 1) kombinací původních intervalů (tj. Jejich zvětšením); 2) sdílení přeskupení.
Vezměme si příklad za podmíněný.

Tabulka 3 - Seskupení akcionářů podle výše dividend na akcii.

1. okres
Číslo skupiny		Počet akcionářů,%	Číslo skupiny	Skupiny akcionářů podle velikosti dividend, UAH	Počet akcionářů,%
1 2 3 4 5	1 – 4 4 – 8 8–12 12–16 16–20	18 12 40 25 5	1 2 3 4 –	1– 6 6–12 12–20 20–30 –	10 20 40 30 –

Předložené údaje nám neumožňují porovnat rozdělení akcionářů ve dvou okresech z hlediska výše dividend kvůli různému počtu skupin (5 a 4) a rozdílné délce intervalu. Jako základ pro seskupení 2. okresu (jako větší) vytvoříme sekundární seskupení akcionářů 1. okresu.

Tabulka 4 - Sekundární seskupení akcionářů podle výše dividend na akcii

Číslo skupiny	Skupiny akcionářů podle velikosti dividend,%	Počet akcionářů,%
Číslo skupiny	Skupiny akcionářů podle velikosti dividend,%
1 2 3 4	1 – 6 6–12 12–20 20–30	10 20 40 30	24 46 30 –	18+0,512=24 0,512+40=46 25+5=30

Analýza srovnatelných údajů ze sekundárního seskupení nám umožňuje dospět k závěru: akcionáři druhého regionu mají vyšší dividendy: (12 a více UAH obdrží 40 + 30 \u003d 70% akcionářů a v prvním - pouze 30%).

Distribuční řady, jejich typy a grafické znázornění

Statistické distribuční řady - jedná se o uspořádané rozdělení jednotek studované populace do skupin podle určitého proměnlivého atributu (předchozí příklad je distribuční řada). To, jako druh strukturálního seskupení, charakterizuje složení (nebo strukturu) zkoumaného jevu, umožňuje posoudit homogenitu agregátu, distribuční vzorce a limity variace agregačních jednotek.

Řídí se distribuční řady založené na atributu atributivní (rozdělení populace podle pohlaví, zaměstnání, profese atd.).
Řady postavené na kvantitativním základě - variační (rozdělení populace podle délky služby, mzdy, věku.).

Strukturálně je variační řada distribuce tabulka, v jejímž prvním sloupci jsou varianty nebo jejich intervaly, ve druhém - frekvencích a (a) frekvencích (třetí sloupec). Přijaté možnosti označení, frekvence -, frekvence -.
Možnosti, tj. numerické hodnoty kvantitativní vlastnosti v variační řadě distribuce mohou být kladné nebo záporné. Při seskupování podniků podle výsledků jejich činnosti jsou tedy možnosti kladné (zisk) nebo záporné (ztráty).

Frekvence – jedná se o čísla, která ukazují, jak často jsou určité možnosti v dané populaci nalezeny. Vyvolá se součet všech frekvencí hlasitost populace a ukazuje počet jednotek obyvatelstva označený N.

Frekvence – jedná se o frekvence vyjádřené ve formě relativních hodnot: zlomky jedné nebo v procentech, vypočtené jako poměr frekvence k objemu populace. Součet frekvencí se vždy rovná jedné nebo 100%. Nahrazení frekvencí frekvencemi umožňuje porovnat řadu variací s různým počtem pozorování.
Pro analýzu populace jsou variační řady doplněny o takové prvky, jako je akumulovaná frekvence, akumulovaná frekvence a distribuční hustota.

Kumulovaná frekvence(Sf) ukazuje počet jednotek obyvatel, pro které hodnota opcí není větší než daná, je určena součtem frekvencí všech předchozích intervalů, včetně tohoto:

, , atd.

Pokud místo frekvencí použijeme frekvence, dostaneme podobně akumulované frekvence(Sw):

, , atd.

Absolutní hustota distribuce Je frekvence na jednotku délky intervalu, tj. A relativní hustota distribuce - frekvence na jednotku délky intervalu, tj. Distribuční hustota se používá v řádcích s nerovnými intervaly pro přivedení frekvencí a frekvencí do srovnatelné podoby.
Série variací, v závislosti na povaze variace, jsou rozděleny do oddělenýa interval.
Diskrétní variační řady jsou vytvořeny na základě diskrétních (nespojitých) funkcí. Diskrétní - jedná se o funkce, jejichž varianty mají pouze celočíselné hodnoty a jejich počet je malý. Řady variačních intervalů jsou založeny na souvislých vlastnostech (tj. Přijímání jakýchkoli hodnot, včetně zlomkových) nebo diskrétních, které se mění v širokém rozmezí.

Příklad konstrukce diskrétní distribuční řady... Pracovní zkušenosti v letech 10 pracovních týmů charakterizují následující údaje: 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.
Prvním krokem při objednání primární řady je v rozsahu, tj. uspořádání všech variant ve vzestupném nebo sestupném pořadí.
Řádkový řádek: 2, 3, 3, 4, 4, 4, 4, 5, 5, 5.

Tabulka 5 - Diskrétní variační řady rozdělení pracovníků podle délky služby

Zkušenosti práce (možnosti xi)	Počet pracovníků určité délky služby (frekvence fi)	Frekvence	Kumulované frekvence	Akumulované frekvence
2 3 4 5	1 2 4 3	(1:10)100=10 (2:10)100=20 40 30	1 1+2=3 3+4=7 7+3=10	10 30 70 100

Příklad sestavení intervalové řady... Existují údaje o průměrném měsíčním platu 30 zaměstnanců, který se pohybuje od 600 do 1200 UAH. Sestavte interval distribuce série.

Tabulka 6 - Intervalová variační řada rozdělení pracovníků podle velikosti průměrné měsíční mzdy

Skupiny pracovníků podle velikosti mezd (možnost intervalu xi)	Počet pracovníků (frekvence fi)	Frekvence	Kumulované frekvence	Akumulované frekvence
1) 600-700 2) 700-800 3) 800-900 4) 900-1000 5) 1000-1100 6) 1100-1200	3 6 8 9 3 1	26,7 30 10 3,3	3 3+6=9 9+8=17 26 29 30	10,0 30,0 56,7 86,7 96,7 100,0

Graficky lze distribuční řady reprezentovat ve formě histogramu, kumulace, polygonu.
Řada variačních intervalů je znázorněna jako histogramy... Chcete-li jej postavit v pravoúhlém souřadném systému, podél osy vodorovné osy jsou umístěny segmenty rovné délce intervalu. Poté se na těchto segmentech, stejně jako na základnách, vytvářejí obdélníky, jejichž výška je úměrná frekvenci nebo frekvenci. U intervalové řady s nerovnoměrnými intervaly je hustota distribuce vynesena podél ordinátu, protože v tomto případě poskytuje představu o vyplnění intervalu. Plocha celého histogramu se numericky rovná součtu frekvencí.
Příklad vytváření histogramu.

Pokud spojíme středy každého intervalu s přímými segmenty, dostaneme uzavřenou postavu v podobě mnohoúhelníku, který se nazývá polygon.
Mnohoúhelník se běžně používá pro diskrétní řady. Za tímto účelem jsou body se souřadnicemi (x1, f1), (x2, f2), ..., (xN, fN) vykresleny v pravoúhlém souřadném systému, poté jsou postupně spojeny segmenty a od prvního a posledního bodu jsou kolmice sníženy na osu x. Výsledný mnohoúhelník je mnohoúhelník diskrétní variační řady.

Cumulataje postaven podle akumulovaných frekvencí (nebo částí), které jsou vykresleny podél osy y a podél osy x - možnosti nebo horní hranice intervalů.

Otevřená knihovna je otevřená knihovna vzdělávacích informací. Srovnatelnost statistických seskupení

Podstata a typy statistických seskupení

Seskupení podle množství

Distribuční řady, jejich typy a grafické znázornění

Nedávné

Musíš vědět