Sekundární přeskupení pro jednoduchý příklad. Techniky sekundárního seskupování

  • Podstata a typy statistických seskupení.
  • Seskupení podle kvantitativních kritérií.
  • Distribuční řady, jejich typy a grafické znázornění.

Podstata a typy statistických seskupení

V důsledku první fáze statistického výzkumu (statistické pozorování) se získá jeden statistické informace, což je velké množství primárních, rozptýlených informací o jednotlivých jednotkách studovaného předmětu (například záznamy o každém občanu země v sčítání lidu: pohlaví, národnost, věk, vzdělání atd.).

Dalším úkolem statistiky je uvést tyto materiály v určitém pořadí, systematizovat a na tomto základě poskytnout souhrnný popis celého souboru faktů, aby bylo možné studovat charakteristické rysy a charakteristické rysy studovaného jevu a identifikovat vzorce jeho vývoje. Toho je dosaženo ve druhé fázi statistického výzkumu, jehož první fází je statistické shrnutí.

Statistické shrnutí Je vědecky organizované zpracování primárních dat za účelem získání zobecňujících charakteristik zkoumaného jevu pro řadu základních funkcí.

Pokud se pro studovanou sadu pozorovacích jednotek počítají pouze celkové součty, souhrn se nazývá jednoduchý. Například: Chcete-li zjistit celkový počet studentů vysokých škol Ukrajiny, stačí k určitému datu přidat počet studentů všech vysokých škol.
Statistické shrnutí obsahuje následující základní prvky:

  • výběr skupinových charakteristik (například po sčítání lze populaci rozdělit do skupin podle charakteristik: pohlaví, věk, národnost);
  • distribuce dat do částí (skupin a podskupin);
  • výpočet údajů o konečné skupině pomocí systému statistických ukazatelů.
  • systematizace výsledků získaných ve formě statistických tabulek.

Agregace jednotlivých jednotek statistické populace do skupin se provádí pomocí metody seskupování.

Statistické seskupení Je to proces vytváření homogenních skupin podle řady základních rysů. Seskupování se provádí buď rozdělením populace do samostatných částí, které se vyznačují vnitřní homogenitou a liší se v řadě charakteristik, nebo sloučením jednotlivých jednotek do skupin podle typických charakteristik (například seskupení průmyslových podniků podle vlastnictví, seskupení populace podle průměrného příjmu na hlavu, seskupení komerčních bank podle výše aktiv rozvahy atd.).

Známky, kterými jsou jednotky studované populace rozděleny do skupin, se nazývají seskupování znamenínebo základ seskupení... Pokud je seskupení získáno kvantitativně, nazývá se kvantitativní, kvalitativně - atribuční nebo kvalitativní.
Ve statistické analýze jsou skupině přiřazeny následující funkce:

  • identifikace sociálně-ekonomických typů jevů;
  • studium strukturních a strukturálních změn;
  • analýza vztahů mezi jevy.

V souladu s těmito funkcemi se rozlišují typologické, strukturální a analytické (faktorové) skupiny.
Typologické seskupení je distribuce kvality heterogenní agregovat do tříd, sociálně-ekonomické homogenní typy. Tento typ zahrnuje seskupení zemí podle sociopolitické struktury, podniky - podle formy vlastnictví, populace - podle místa pobytu (městské a venkovské).

Oddělení homogenní agregovat do skupin za účelem identifikace jeho vnitřní struktury se nazývá strukturální seskupení. Charakterizuje složení populace, objem (hmotnost) jednotlivých skupin.
Tabulka 1 - Seskupení spotřebitelů jogurtu podle věku

Analýza strukturních seskupení, která se berou v několika obdobích nebo bodech v čase, ukazuje změnu struktury zkoumaných jevů, tj. strukturální zlomy, což odráží vzorce jejich vývoje.

Analytické skupiny se používají ke zkoumání přítomnosti vztahu mezi studovanými jevy. Za tímto účelem by se údaje měly seskupovat podle jedné z charakteristik, vypočítat průměrnou hodnotu druhé charakteristiky v každé skupině a poté porovnat změny studovaných charakteristik. Pokud se zvýšením nebo snížením atributu seskupení zvýší hodnoty druhého atributu, pak mezi nimi existuje spojení (přímé nebo inverzní).
Tabulka 2 - Seskupení obchodů podle počtu zaměstnanců (podmíněné údaje)


Počet zaměstnanců, lidé

Počet obchodů

Průměrná skutečná délka pracovního týdne, h

100 a více

Údaje ukazují, že existuje korelace mezi velikostí podniku a zaměstnáním jeho zaměstnanců: čím více je počet zaměstnanců v obchodě, tím kratší je pracovní týden.

Pokud jsou skupiny vytvořené podle jednoho atributu rozděleny do skupin podle druhého atd. funkce, pak se takové seskupení nazývá kombinovaný... Například distribucí skupin spotřebitelů jogurtu podle pohlaví získáme kombinované seskupení.
Tabulka 3 - Seskupení spotřebitelů jogurtu podle věku a pohlaví

Skupiny spotřebitelů podle věku, let

Počet spotřebitelů, lidé

mužský

ženský

Méně než 20
20-30
30-40
40-50
50-60
Více než 60

10
40
30
10
6
4

4
17
12
6
3
1

6
23
18
4
3
3

Seskupení podle množství

Při sestavování strukturálních seskupení na základě kvantitativních charakteristik se stanoví počet skupin a intervaly seskupování.

Interval- kvantitativní hodnota, která definuje a odděluje jednu skupinu od druhé, tj. vymezuje kvantitativní hranice skupin.
Intervaly mohou být stejné nebo nerovnoměrné. Například: podle počtu zaměstnanců lze podniky rozdělit do skupin: až 100, 100–200, 200–500, 500–1 000, 1 000 a více. Důvodem je skutečnost, že změna znaménka o 50-100 lidí. je zásadní pro malé podniky, ale ne pro velké podniky.
Pro skupiny se stejnými intervaly je hodnota (délka, krok) intervalu určena vzorcem:

,
kde, - největší a nejmenší hodnota prvku;
k - počet skupin (intervalů), stanovený Sturgessovým vzorcem:

,

kde N je počet jednotek v populaci.
Nečísla získaná ve výpočtech se zaokrouhlí nahoru.
Například: je nutné seskupit ve stejných intervalech 20 pracovníků pracujících v dílnách podle jejich produktivity práce. Nejvyšší produktivita je 180 dílů na směnu, nejnižší 60.
Počet skupin:
Délka intervalu: děti
Dolní limit 1. skupiny je 60 dílů, horní limit 60 + 20 \u003d 80 dílů. Druhá skupina: dolní hranice 80, horní 80 + 20 \u003d 100 atd. Výsledkem je taková intervalová řada (nebo takové skupiny pracovníků), podrobnosti:

1. skupina: 60–80
2. skupina: 80-100
3. skupina: 100-120
4. skupina: 120-140
5 skupina: 140-160
Skupina 6: 160-180

V tomto rozdělení existuje nejistota, která skupina má přiřadit jednotku populace, jejíž hodnota se rovná mezní hodnotě intervalu (pracovníci s produktivitou 80, 100, 200 atd. Dětí / cm). Pro vyloučení nejistoty se používá princip uniformity: levá spodní hranice intervalu zahrnuje specifikovanou hodnotu a horní ne. To znamená, že pracovník produkující 100 dětí / cm je zařazen do skupiny 3.

Skupinové intervaly mohou být zavřeno- jsou - li stanoveny horní a dolní meze (jako v příkladu), a - otevřenokdyž je zadána pouze jedna z hranic. Například intervaly „méně než 60“ nebo „180 a vyšší“ jsou otevřené intervaly. Pro výpočet ukazatelů statistické populace musí být otevřené intervaly „uzavřené“. K tomu použijte hodnotu intervalu sousedícího s „otevřeným“. V příkladu dostaneme: 40-60 a 180-200.

Výše uvedené se týká seskupení, která jsou vytvářena na základě analýzy primárního statistického materiálu. Často se však musí používat již existující seskupení, která nesplňují požadavky analýzy. Například seskupení nemusí být srovnatelné kvůli odlišnému počtu skupin nebo nerovným mezím intervalu. Pro přiblížení seskupení do srovnatelné podoby se používá metoda sekundární seskupení, která spočívá ve vytvoření nových skupin na základě dříve provedeného seskupení. Toto přeskupení je možné dvěma způsoby: 1) kombinací původních intervalů (tj. Jejich zvětšením); 2) přeskupení sdílení.
Vezměme si příklad za podmíněný.

Tabulka 3 - Seskupení akcionářů podle výše dividend na akcii.


1. okres

Číslo skupiny

Počet akcionářů,%

Číslo skupiny

Skupiny akcionářů podle velikosti dividend, UAH

Počet akcionářů,%

1
2
3
4
5

1 – 4
4 – 8
8–12
12–16
16–20

18
12
40
25
5

1
2
3
4

1– 6
6–12
12–20
20–30

10
20
40
30

Prezentované údaje nám neumožňují porovnat rozdělení akcionářů ve dvou okresech z hlediska výše dividend kvůli různému počtu skupin (5 a 4) a rozdílné délce intervalu. Jako základ pro seskupení 2. okresu (jako větší) vytvoříme sekundární seskupení akcionářů 1. okresu.

Tabulka 4 - Sekundární seskupení akcionářů podle výše dividend na akcii


Číslo skupiny

Skupiny akcionářů podle výše dividend,%

Počet akcionářů,%

1
2
3
4

1 – 6
6–12
12–20
20–30

10
20
40
30

24
46
30

18+0,5*12=24
0,5*12+40=46
25+5=30

Analýza srovnatelných údajů ze sekundárního seskupení nám umožňuje dospět k závěru, že akcionáři druhého regionu mají vyšší dividendy: (12 UAH a vyšší obdrží 40 + 30 \u003d 70% akcionářů, a v prvním - pouze 30%).

Distribuční řady, jejich typy a grafické znázornění

Statistické distribuční řady - jedná se o uspořádané rozdělení jednotek studované populace do skupin podle určitého proměnlivého atributu (předchozí příklad je distribuční řada). To, jako druh strukturálního seskupení, charakterizuje složení (nebo strukturu) zkoumaného jevu, umožňuje posoudit homogenitu agregátu, distribuční vzorce a limity variace agregačních jednotek.

Řídí se distribuční řady založené na atributu atributivní (rozdělení populace podle pohlaví, zaměstnání, profese atd.).
Řádky postavené na kvantitativním základě - variační (rozdělení populace podle délky služby, mzdy, věku.).

Strukturálně je variační řada distribuce tabulka, v jejímž prvním sloupci jsou varianty nebo jejich intervaly, ve druhém - frekvence a (a) frekvence (třetí sloupec). Je přijímáno označovat možnosti, frekvence -, frekvence -.
Možnosti, tj. numerické hodnoty kvantitativní charakteristiky v variační řadě distribuce mohou být kladné nebo záporné. Při seskupování podniků podle výkonnosti jsou tedy možnosti kladné (zisk) nebo záporné (ztráty).

Frekvencejedná se o čísla, která ukazují, jak často se v dané populaci nacházejí určité možnosti. Vyvolá se součet všech frekvencí hlasitost populace a ukazuje počet jednotek obyvatelstva označený N.

Frekvencejedná se o frekvence, vyjádřené jako relativní hodnoty: zlomky jedné nebo jako procento, vypočtené jako poměr frekvence k objemu populace. Součet frekvencí se vždy rovná jedné nebo 100%. Nahrazení frekvencí frekvencemi umožňuje porovnat řadu variací s různým počtem pozorování.
Pro analýzu populace jsou variační řady doplněny o takové prvky, jako je akumulovaná frekvence, akumulovaná frekvence a distribuční hustota.

Kumulovaná frekvence(Sf) ukazuje počet jednotek obyvatel, pro které hodnota opcí není větší než daná, je určena sčítáním frekvencí všech předchozích intervalů, včetně tohoto:

, , atd.

Pokud místo frekvencí použijeme frekvence, dostaneme podobně akumulované frekvence(Sw):

, , atd.

Absolutní hustota distribuce Je frekvence na jednotku délky intervalu, tj. A relativní hustota distribuce Je frekvence na jednotku délky intervalu, tj. Distribuční hustota se používá v řádcích s nerovnými intervaly pro přivedení frekvencí a frekvencí do srovnatelné podoby.
Série variací, v závislosti na povaze variace, jsou rozděleny do oddělenýa interval.
Diskrétní variační řady jsou vytvořeny na základě diskrétních (nespojitých) funkcí. Diskrétní - jedná se o rysy, jejichž varianty mají pouze celočíselné hodnoty a jejich počet je malý. Řady variačních intervalů jsou založeny na spojitých vlastnostech (tj. Přijímání jakýchkoli hodnot, včetně zlomkových) nebo diskrétních, které se mění v širokém rozmezí.

Příklad konstrukce diskrétní distribuční řady... Pracovní zkušenosti v letech 10 pracovních týmů se vyznačují následujícími údaji: 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.
Prvním krokem při objednání primární řady je v rozsahu, tj. uspořádání všech variant ve vzestupném nebo sestupném pořadí.
Řádkový řádek: 2, 3, 3, 4, 4, 4, 4, 5, 5, 5.

Tabulka 5 - Diskrétní variační řady rozdělení pracovníků podle délky služby


Zkušenosti
práce (možnosti xi)

Počet pracovníků s určitou délkou služby (frekvence fi)

Frekvence

Kumulované frekvence

Akumulované frekvence

2
3
4
5

1
2
4
3

(1:10)*100=10
(2:10)*100=20
40
30

1
1+2=3
3+4=7
7+3=10

10
30
70
100

Příklad sestavení intervalové řady... Existují údaje o průměrném měsíčním platu 30 zaměstnanců, který se pohybuje od 600 do 1200 UAH. Sestavte interval distribuční řady.

Tabulka 6 - Intervalová variační řada rozdělení pracovníků podle velikosti průměrné měsíční mzdy

Skupiny pracovníků podle velikosti mezd (možnost intervalu xi)

Počet pracovníků (frekvence fi)

Frekvence

Kumulované frekvence

Akumulované frekvence

1) 600-700
2) 700-800
3) 800-900
4) 900-1000
5) 1000-1100
6) 1100-1200

3
6
8
9
3
1

26,7
30
10
3,3

3
3+6=9
9+8=17
26
29
30

10,0
30,0
56,7
86,7
96,7
100,0

Graficky lze distribuční řady znázornit ve formě histogramu, kumulace, polygonu.
Řada variačních intervalů je znázorněna jako histogramy... Chcete-li jej postavit v pravoúhlém souřadném systému, podél osy vodorovné osy jsou umístěny segmenty rovné délce intervalu. Poté se na těchto segmentech, stejně jako na základnách, vytvářejí obdélníky, jejichž výška je úměrná frekvenci nebo frekvenci. U intervalové řady s nerovnoměrnými intervaly je hustota distribuce vynesena podél ordinátu, protože v tomto případě dává představu o vyplnění intervalu. Plocha celého histogramu se numericky rovná součtu frekvencí.
Příklad vytváření histogramu.

Pokud spojíme středy každého intervalu s přímými úsečkami, dostaneme uzavřenou postavu ve tvaru mnohoúhelníku, který se nazývá polygon.
Mnohoúhelník se běžně používá pro diskrétní řady. Za tímto účelem jsou body se souřadnicemi (x1, f1), (x2, f2), ..., (xN, fN) postaveny v pravoúhlém souřadném systému, pak jsou postupně spojeny segmenty a kolmice jsou sníženy od prvního a posledního bodu k ose x. Výsledný mnohoúhelník je mnohoúhelník diskrétní variační řady.

Cumulataje postaven podle akumulovaných frekvencí (nebo částí), které jsou vykresleny podél osy y a podél osy x - možnosti nebo horní hranice intervalů.

Seskupení postavená pro stejné časové období, ale pro různé objekty nebo naopak pro jeden objekt, ale pro dvě různá časová období, se může ukázat jako nesrovnatelná kvůli různému počtu vybraných skupin nebo nerovným hranicím intervalů.

Sekundární seskupení nebo přeskupení seskupených údajů se používá k lepší charakterizaci zkoumaného jevu (v případě, kdy počáteční seskupení jasně neodhalí povahu rozdělení populačních jednotek), nebo k porovnání srovnatelného typu seskupení pro srovnávací analýzu.

Sekundární seskupeníje operace k vytvoření nových skupin na základě dříve provedeného seskupení.

Existují dva způsoby, jak vytvořit nové skupiny. První, nejjednodušší a nejběžnější způsob je změna (častěji zvětšení) počátečních intervalů. Druhá metoda byla pojmenována sdílení přeskupení. Spočívá ve vytváření nových skupin na základě přiřazení určité skupiny obyvatelstva každé skupině. Ukážeme si způsob sekundárního seskupení s příkladem (tabulka 3.14).

Tabulka 3.14. Rozdělení maloobchodních podniků v jednom z měst Moskevského kraje podle průměrného ročního počtu zaměstnanců v roce 2011 *

* Údaje jsou podmíněné.

Uspořádáme data a vytvoříme nové skupiny s intervaly až 5, 5-10, 10-20, 20-30, 30 nebo více lidí.

První nová skupina bude zahrnovat celou první skupinu maloobchodních podniků a část druhé skupiny. Chcete-li vytvořit skupinu až pěti lidí, je nutné vzít jednu osobu z intervalu druhé skupiny. Velikost intervalu této skupiny je šest lidí. Proto je nutné vzít 1/6 z toho. Podobná část v nově vytvořené první skupině by měla být převzata z počtu podniků, tj. 20 - \u003d 3 společnosti. 6

Pak bude v první skupině maloobchodních podniků 16 + 3 \u003d 19 jednotek.

Druhou novou skupinu tvoří maloobchodníci druhé skupiny mínus prodejci uvedení v první skupině, tj. 20 - 3 \u003d 17 podniků. Nově vytvořená třetí skupina bude zahrnovat všechny podniky třetí skupiny a část podniků čtvrté. Chcete-li určit tuto část z intervalu 18 30 (šířka intervalu je 12), musíte k předchozí předešlé přidat 2,0 (horní mez intervalu je 20 osob). Proto je nutné vzít část intervalu rovnou 2/12 \u003d 1/6. V této skupině je 74 podniků, takže musíte vzít 74 (1/6) \u003d 12 podniků. Nová třetí skupina bude zahrnovat 44 + 12 \u003d 56 podniků.

Nově vytvořená čtvrtá skupina bude zahrnovat 74 - 12 \u003d \u003d 62 podniků zbývajících z bývalé čtvrté skupiny. Pátou nově vytvořenou skupinu tvoří maloobchodní podniky páté a šesté předchozí skupiny: 37 + 9 \u003d 46 podniků.

Výsledkem je získání nových skupin (tabulka 3.15).

Tabulka 3.15. Rozdělení maloobchodních podniků v jednom z měst v Moskevském regionu podle průměrného ročního počtu zaměstnanců v roce 2011 po přeskupení údajů *

* Údaje jsou podmíněné.

Statistická tabulka: entita, prvky a klasifikace

Statistická tabulka je nejracionálnější, vizuální a nejkompaktnější forma prezentace statistického materiálu, včetně výsledků statistického seskupení. Ne každá tabulka je však statistická. Multiplikační tabulka, dotazník sociologického průzkumu, může být ve formě tabulky, ale zatím nejsou statistické tabulky.

Statistická tabulkaje tabulka, která obsahuje shrnutí numerických charakteristik studované populace jedním nebo více základními rysy propojenými logikou ekonomické analýzy.

Hlavní prvky statistické tabulky, které tvoří její rámec (základ), jsou uvedeny na obrázku 3.1.

Tabelárníse nazývá taková forma uspořádání číselných informací, ve které je číslo umístěno v průsečíku jasně formulovaného čísla podél svislého sloupce, graf, a jména na odpovídající vodorovné liště - čára. Takže navenek je tabulka průsečík grafů a řádků, které tvoří kostru tabulky.

Statistická tabulka obsahuje tři typy záhlaví: obecné, horní a boční. Obecný název odráží obsah celé tabulky (na jaké místo a čas patří), je umístěn nad rozvržením tabulky ve středu a je externí záhlaví. Horní záhlaví - charakterizovat obsah grafu (záhlaví predikátu) a - postranní (nadpisy předmětů) - řádky. Slouží jako vnitřní záhlaví.

Tělo stolu, plné záhlaví, tvoří rozvržení stolu; pokud píšete čísla na průsečíku grafu a řádků, získáte kompletní statistickou tabulku. Název tabulky (obecný název)

Schéma 3.1. Kostra (základ) statistické tabulky

Digitální materiál lze prezentovat jako absolutní (schválený kapitál, objem inovativních produktů atd.), Relativní (HDP na obyvatele, počet osobních počítačů na 100 zaměstnanců atd.) A průměr (průměrná cena akcie, průměrný výnos mléka na jedna kráva atd.) v množství.

Tabulky mohou být doplněny poznámkou, která se v případě potřeby vysvětluje, nadpisy, metodiku výpočtu některých ukazatelů, zdroje informací atd.

Podle svého logického obsahu je tabulka „statistickou větou“, jejíž hlavní prvky jsou předmět a predikát.

Předmětnazývá se objekt, který je charakterizován čísly. Může to být jeden nebo několik agregátů, samostatné jednotky agregátu v pořadí podle jejich seznamu nebo seskupené podle některých charakteristik, územních jednotek atd. Obvykle je předmět tabulky uveden vlevo ve jménu řádků.

Predikáttvoří systém indikátorů, které charakterizují předmět studie, tj. předmět tabulky. Predikát tvoří horní záhlaví a skládá obsah grafů s logickým sekvenčním uspořádáním indikátorů zleva doprava.

Umístění subjektu a predikátu může být v některých případech obráceno pro úplnější a lepší způsob čtení a analýzy počátečních informací o studované populaci.

Podle struktury předmětuv závislosti na seskupení jednotek v ní existují jednoduché a složité statistické tabulky.

Prostý nazývá statistická tabulka, v jejímž předmětu je uveden seznam objektů nebo územních jednotek. Jednoduché statistické tabulky jsou rozděleny na monografické tabulky a prohlížeče.

Monografické tabulky charakterizovat ne celou sadu jednotek studovaného objektu, ale pouze jednu jakoukoli jednotku nebo skupinu, rozlišenou podle určitého kritéria (tabulka 3) .16).

Tabulka 3.16. Uvedení sociálních a kulturních zařízení do subjektů Ruské federace v roce 2009

Hnědé stoly tzv. tabulky, jejichž předmět obsahuje seznam objektů nebo jednotek studovaného objektu (tabulka 3.17).

Složité statistické tabulky na rozdíl od jednoduchých umožňují identifikovat sociálně-ekonomické typy studovaných jevů, jejich strukturu, jakož i vztah a vzájemnou závislost mezi charakteristikami, které je charakterizují. Tyto úkoly lze lépe řešit pomocí skupinových a zejména kombinačních tabulek.

Skupina tzv. statistické tabulky, jejichž předmět obsahuje seskupení jednotek populace podle jedné kvantitativní nebo atributové charakteristiky.

Distribuční řady jsou nejjednodušším typem skupinových tabulek. Tabulka skupin může být složitější, pokud predikát navíc obsahuje řadu indikátorů charakterizujících skupiny subjektu. Tyto tabulky se často používají k porovnání agregovaných ukazatelů napříč skupinami (tabulka 3.18).

Tabulka 3.17. Příliv zahraničních investic do ekonomiky Ruské federace, ale hlavních investorských zemí v roce 2009

Populační skupina podle věku, let

Celkový

Počítaje v to

muži

ženy

Skupinové tabulky tedy umožňují identifikovat a charakterizovat sociálně-ekonomické typy jevů, jejich strukturu, v závislosti pouze na jednom prvku.

Kombinace se nazývají statistické tabulky, jejichž předmět obsahuje seskupení populačních jednotek současně podle dvou nebo více charakteristik: každá ze skupin, sestavená podle jedné charakteristiky, je dále rozdělena do podskupin podle některých dalších charakteristik atd. (Tabulka 3.19).

Tabulka 3.19. Seskupení dokončených bytů v obytné budově podle počtu pokojů a průměrné velikosti

Tabulka 3.18. Rozdělení počtu zaměstnaných v ruské ekonomice podle věkových skupin na konci listopadu 2009,% z celkového počtu

Předmětem v tabulce jsou skupiny bytů postavené podle počtu pokojů a jejich průměrné velikosti.

Kombinační tabulky umožňují charakterizovat typické skupiny, které se liší několika charakteristikami, a jejich vzájemným vztahem. Sekvence dělení jednotek populace do homogenních skupin podle charakteristik je určena buď důležitost jedné z nich v kombinaci, nebo podle pořadí, ve kterém jsou studovány.

V predikátu statistické tabulky, jak již bylo zmíněno, jsou uvedeny ukazatele, které jsou charakteristikou studovaného objektu.

Podle struktury predikátu se rozlišují jednoduché a složité statistické tabulky.

Když jednoduchý vývoj predikátů vlastnosti, které jsou v něm uvedeny, se neprotínají a celkové hodnoty se získají prostým sečtením hodnot pro každou charakteristiku zvlášť, nezávisle na sobě. Příkladem jednoduchého vývoje predikátu je tabulka. 3,20.

Když komplexní predikátový vývoj získá se úplnější a podrobnější popis objektu. V tomto případě oba atributy predikátu (podle pohlaví a věku) spolu úzce souvisejí. Nejprve můžete analyzovat složení Státní dumy z hlediska frakcí

Tabulka 3.20.

podle věkové skupiny a poté rozdělte každou věkovou skupinu do dvou podskupin podle pohlaví. Jinými slovy, s komplexním vývojem predikátu může být jev nebo předmět charakterizován odlišnou kombinací prvků, které je tvoří.

Ve všech případech by měl být výzkumník při sestavování statistických tabulek veden optimálním poměrem predikátových indikátorů.

Základní pravidla pro konstrukci a analýzu statistických tabulek

Statistické tabulky jako prostředek vizuální a kompaktní prezentace digitálních informací by měly být statisticky správné. Technika generování statistických tabulek určuje následující základní techniky.

  • 1. Digitální materiál musí být prezentován tak, aby při analýze tabulky byla podstata jevu odhalena čtením řádků zleva doprava a shora dolů.
  • 2. Nadpis tabulky a názvy sloupců a řádků by měly být jasné, stručné, představovat úplný celek, organicky zapadající do obsahu textu. Název tabulky by měl odrážet objekt, znaménko, čas a místo události.
  • 3. Informace umístěné ve sloupcích (sloupcích) tabulky končí souhrnným řádkem.
  • 4. Pokud se názvy jednotlivých sloupců mezi sebou opakují, obsahují opakované termíny nebo nesou jediné sémantické zatížení, je třeba jim přiřadit jednotící nadpis.
  • 5. Je užitečné číslovat sloupce a řádky. Sloupce vlevo, vyplněné názvem řádků, jsou obvykle označeny velkými písmeny abecedy (A), (B) atd. A všechny následující sloupce - čísly ve vzestupném pořadí.
  • 6. Je vhodné uspořádat vzájemně propojená data charakterizující jednu ze stran analyzovaného jevu v sousedních sloupcích.
  • 7. Sloupce a řádky by měly obsahovat měrné jednotky odpovídající jednotkám stanoveným v předmětových a predikátových indikátorech. V tomto případě se používají obecně přijímané zkratky měrných jednotek (rublů, kWh atd.).
  • 8. Je účelnější zaokrouhlit co nejvíce čísel. Zaokrouhlování čísel ve stejném sloupci nebo řádku by mělo být prováděno se stejnou mírou přesnosti.
  • 9. Pokud jsou požadovány další informace (vysvětlení tabulky), mohou být uvedeny poznámky.

Dodržování výše uvedených pravidel pro vytváření a formátování statistických tabulek z nich činí hlavní prostředky prezentace, zpracování a zobecňování statistických informací o stavu a vývoji analyzovaných sociálně-ekonomických jevů.

Analýza statistických tabulek se provádí ve dvou směrech: strukturální a věcná.

Strukturální analýza zahrnuje analýzu struktury tabulky a charakteristik:

  • souhrn a jednotky pozorování, které jej tvoří;
  • znaky a jejich kombinace, které tvoří předmět a predikát tabulky;
  • zobrazení tabulky;
  • úkoly, které mají být vyřešeny.
  • analýza jednotlivých skupin subjektu podle odpovídajících predikátů;
  • identifikace poměrů a proporcí mezi skupinami jevů pomocí znaků;
  • srovnávací analýza a formulace závěrů, stanovení pravidelnosti a stanovení rezerv pro vývoj sledovaného objektu.

Analýza jednotlivých znaků a skupin musí začít studiem absolutních hodnot, poté relativních hodnot s nimi spojených.

Pokud to výzkumné úkoly vyžadují, může být analýza tabulek doplněna o vypočtené relativní a průměrné hodnoty, grafy, diagramy atd.

Analýza těchto tabulek je prováděna pro každý prvek zvlášť a poté v logické a ekonomické kombinaci prvků.

Soulad s pravidly a sledem práce se statistickými tabulkami umožní výzkumníkovi provádět komplexní vědecky podloženou ekonomickou a statistickou analýzu sledovaných objektů a procesů.

Otázka 10. Sekundární seskupení, způsoby jeho implementace.

Seskupení - Jedná se o rozdělení studované statistické populace na části podle jedné nebo více skupinových charakteristik. Správně provedené seskupení do značné míry zajišťuje spolehlivost celé statistické studie.

Primární seskupení se provádí na základě třídění primárních zdrojových dat.

Seskupení postavená pro stejné časové období, ale pro různé regiony nebo naopak pro stejný region, ale pro dvě různá časová období, se může ukázat jako nesrovnatelná kvůli různému počtu vybraných skupin nebo rozdílu v hranicích intervalů. V takovém případě musíte přeskupit data pomocí sekundárního seskupení.

Sekundární seskupení - operace k vytvoření nových skupin na základě dříve provedeného seskupení.

Existují dva způsoby, jak vytvořit nové skupiny.

1. nejjednodušší a nejběžnější způsob je změnit (často zvětšit) počáteční intervaly.

2. Dole přesmyk- metoda spočívá ve vytvoření nových skupin na základě přiřazení určité skupiny jednotek obyvatelstvu každé skupině.

Příklad. Je nutné přeskupit data a vytvořit nové skupiny s intervaly až 500, 500 - 1000, 1000 - 2000, 2000 - 3000, přes 3000 rublů. podle údajů o rozdělení zakázek stavební firmy podle zisku.

Stůl. Rozdělení zakázek stavební společnosti podle zisku¹

První nová skupina bude zahrnovat celou 1. skupinu smluv a část druhé skupiny. Chcete-li vytvořit skupinu až 500 tisíc rublů, je nutné vzít 100 tisíc rublů z intervalu druhé skupiny. Velikost intervalu pro tuto skupinu bude 600 tisíc rublů. Proto je nutné z toho vzít 1/6 (100: 600), podobnou roli v nově vytvořené nové skupině by měl vzít i počet smluv, tj. 20 1/6 - 3 smluv. Poté bude v 1. skupině uzavřeno 16 + 3 \u003d 19 smluv. Druhou novou skupinu tvoří smlouvy druhé skupiny mínus smlouvy uvedené v 1., tj. 20 - 3 \u003d 17 jednotek. Nově vytvořená třetí skupina bude zahrnovat všechny smlouvy třetí skupiny a část smluv 4. skupiny. Chcete-li určit tuto část z intervalu 1800 - 3 000 (šířka intervalu je 1200 tisíc rublů), musíte k předchozímu přidat 200 tisíc rublů. (takže horní mez intervalu byla 2000 rublů). Je proto nezbytné vzít část intervalu rovnou 200: 1200, tj. 1/6. V této skupině je 74 smluv, což znamená, že musíte vzít 74 ¦ (1: 6) \u003d 12 jednotek. Třetí nová skupina bude zahrnovat: 44 smluv N-12 - 56. Nově vytvořená čtvrtá skupina bude zahrnovat: 74 - 12 \u003d 62 smluv zbývajících z předchozí čtvrté skupiny. Pátou nově vytvořenou skupinu tvoří smlouvy 5. a 6. předchozí skupiny: 37 + 9 \u003d 46 smluv. Technika přeskupování je uvedena v tabulce.

Seskupení postavená pro stejné časové období, ale pro různé objekty nebo naopak pro jeden objekt, ale pro dvě různá časová období, se může ukázat jako nesrovnatelná kvůli různému počtu vybraných skupin nebo rozdílu v hranicích intervalů.

Sekundární seskupení nebo přeskupování seskupených údajů se používá k lepší charakterizaci zkoumaného jevu (v případě, kdy počáteční seskupení jasně neodhalí povahu rozdělení populačních jednotek), nebo k přiblížení skupin ke srovnatelnému typu za účelem srovnávací analýzy.

Sekundární seskupení- operace k vytvoření nových skupin na základě dříve provedeného seskupení.

Existují dva způsoby, jak vytvořit nové skupiny. Prvním, nejjednodušším a nejběžnějším způsobem je změna (častěji rozšíření) počátečních intervalů. Druhá metoda se nazývá sdílení seskupení a spočívá ve vytvoření nových skupin na základě přiřazení určité skupiny jednotek populace každé skupině. Ukážeme si techniku \u200b\u200bsekundárního seskupení s následujícím příkladem.

Rozdělení zaměstnanců podniku podle úrovně příjmů

Uspořádáme data a vytvoříme nové skupiny s intervaly až 5, 5-10, 10-20, 20-30, přes 30 tisíc rublů.

První nová skupina bude zahrnovat celou první skupinu zaměstnanců a část druhé skupiny. Chcete-li vytvořit skupinu až 5 tisíc rublů, je nutné vzít z intervalu druhé skupiny 1,0 tisíc rublů. Velikost intervalu pro tuto skupinu je 6,0 tisíc rublů. Proto je nutné vzít 1/6 (1.0: 6.0) jeho část. Podobnou část v nově vytvořené první skupině je třeba vzít z počtu zaměstnanců, tj. 20 x 1/6 \u003d 3 osoby. První skupina bude mít dělníky: 16 + 3 \u003d 19 lidí.

Druhou novou skupinu tvoří dělníci druhé skupiny bez těch, kteří byli přiřazeni k první, tj. 20-3 \u003d 17 lidem. Nově vytvořená třetí skupina bude zahrnovat všechny zaměstnance třetí skupiny a část čtvrté. K určení této části z intervalu 18-30 (šířka intervalu je 12) je nutné přidat k předcházejícímu 2,0 (takže horní mez intervalu se rovná 2,0 tisíc rublů). Proto je nutné vzít část intervalu rovnou. V této skupině je 74 lidí, takže musíte vzít 74x (1: 6) \u003d 12 lidí. Nová třetí skupina bude zahrnovat 44 + 12 \u003d 56 lidí. Nově vytvořená čtvrtá skupina bude zahrnovat 74–12 \u003d 62 osob zbývajících z bývalé čtvrté skupiny. Pátou nově vytvořenou skupinu budou tvořit pracovníci páté a šesté předchozí skupiny: 37 + 9 \u003d 46 osob.

Složitá seskupení.Nazývají se seskupení na základě jednoho atributu jednoduchý . Aby bylo možné komplexněji a hlouběji studovat komplexní sociální jev, je třeba data seskupit podle dvou nebo více kritérií. Takové skupiny se nazývají komplex .

Nejběžnějším typem komplexních seskupení jsou kombinovaná seskupení , jsou-li skupiny vytvořené podle jednoho atributu rozděleny do podskupin podle druhé atd. představoval. Obvykle se na základnu seskupení umístí 2 až 4 znaky.

Současné použití několika skupinových charakteristik vám umožní identifikovat a porovnat takové rozdíly a vztahy mezi studovanými charakteristikami, které nelze zjistit na základě izolovaného seskupení pro řadu skupinových charakteristik.

Při zkoumání vlivu velkého počtu znaků se použití kombinovaných seskupení stává nemožným, protože nadměrná roztříštěnost informací zakrývá projev vzorců, a proto neumožňuje odhalit současný vliv celého komplexu faktorových znaků na sledovaný indikátor.

Sekundární seskupení.Zvláštní druh seskupení ve statistikách je sekundární seskupení , což znamená vytvoření nových skupin na základě dříve identifikovaných (hlavní) seskupení.

Obvykle se nové skupiny získají zvětšením původních intervalů. Druhým způsobem vytváření nových skupin je frakční přeskupení jednotek agregátů.

Využívá se sekundární seskupení, aby vyřešilo řadu problémů, zejména pro: 1) vytváření větších skupin, v nichž je jasně viditelná povaha distribuce; 2) vytváření kvalitativně homogenních skupin (typů); 3) přivedení dvou (nebo více) seskupení v různých intervalech do jediné formy za účelem srovnatelnosti.

Podnik 1 Enterprise 2
skupiny pracovníků podle platu, nájmu podíl pracovníků podle skupin,% z celkem
12000–14000
14000–16000 13000–16000
16000–18000 16000–19000
18000–20000 19000–22000
20000–22000 22000–25000
22000–24000 25000–28000
24000–26000 28000–31000
26000–28000
Celkový Celkový

Protože rozdělení pracovníků v těchto dvou podnicích má různé intervaly, není možné je přímo porovnávat. Pomocí sekundárního seskupení je však můžete přivést do srovnatelné podoby. Vezměme například interval 4 000 tenge:

Rozdělení pracovníků podle velikosti měsíční mzdy

(seskupení spojené)

Skupiny pracovníků podle platu, nájmu Podíl pracovníků podle skupin,% z celkem
podnik 1 podnik 2
12000–16000 17 (5+12)
16000–20000 44 (18+26) 37 (30 + 1/3 × 21)
20000–24000 32 (25+7) 24 (2/3 × 21 + 2/3 × 15)
24000–28000 7 (4+3) 21 (1/3 × 15 + 16)
28000–32000
Celkový

Distribuční série.

Stanovení distribučních řad. Na základě shrnutí statistických materiálů se vytvoří řada statistických údajů, které odhalí buď změnu objemů populací v dynamice (budou probrány v samostatné kapitole), nebo rozdělení populací podle jedné nebo druhé charakteristiky ve statice.

Rozdělení může být podle charakteristik, které nemají kvantitativní měřítko (atributivní), a podle charakteristik, ve kterých se jejich kvantitativní měřítko mění (variační řady).

Distribuční série. Příkladem takového rozdělení je rozdělení populace na městské a venkovské, mužské a ženské, obrat potravin a nepotravinářských výrobků, zaměstnaná populace podle odvětví a profesí a dospělá populace podle úrovně vzdělání.

Variační řada. Například takové řady zahrnují rozdělení pracovníků podle velikosti průměrné měsíční mzdy a podniky podle objemu výroby nebo počtu zaměstnanců.

V variační řadě se rozlišují dva prvky: varianty a frekvence. Možnostijedná se o jednotlivé hodnoty atributu seskupení, který bere v variační řadě. Frekvence volací čísla ukazující, jak často jsou některé možnosti nalezeny.

Součet všech kmitočtů tvoří objem distribuční řady nebo její číslo... Frekvence, vyjádřené ve formě relativních hodnot (zlomky, jednotky, procenta), se nazývají časté.

Variační řady metodou konstrukce jsou intervalové a diskrétní. Intervalová řada variací- série, ve které jsou hodnoty varianty uváděny ve formě intervalů (například populace podle věkových skupin). Diskrétní variační série - řada, ve které mají hodnoty varianty hodnoty celých nebo pevných čísel (například celkový počet rodin podle počtu lidí).

Povaha variační řady (intervalu nebo diskrétnosti) je určena povahou variace. Variace může být spojitá (intervalová řada) a diskontinuální (diskrétní série).

Příklady nepřetržitá variace slouží výnosu zemědělských plodin, mezd, objemu produkce.

NA diskrétní variace může zahrnovat počet rodinných příslušníků, mzdovou hladinu pracovníka, počet pokojů v bytě, počet pracovníků v podniku.

Pokud se diskrétní varianta projeví v širokých mezích (například počet pracovníků v podniku), pak se sestaví intervalové variační řady.

Příklady distribučních řad vykreslování a grafůKatedra sociálních studií a speciální pedagogiky Kučerová, Hana Tarifní kategorie a pracovní zkušenosti zámečnických pracovníků. Postavme počáteční diskrétní řadu rozdělení pracovníků podle mzdových kategorií. Charakter variace prvku je zde definován šesti skupinami - podle počtu kategorií. Je snadné vypočítat počet pracovníků v každé kategorii přímo z primárních údajů. Výsledkem je tabulka.