Pojem řady statistických distribucí a jejich typy.

Distribuční série ve statistikách se jedná o nejjednodušší seskupení, což je uspořádané rozdělení jednotek populace do skupin podle studované proměnné charakteristiky.

Podle povahy studovaného znaku se série dělí na atributivní (když je proměnná vlastnost kvalitativní, tj. nemá kvantitativní vyjádření) a variační (pokud je studovaný znak měřen kvantitativně).

V každé řadě distribuce se rozlišují dva hlavní prvky:

Varianty - specifické hodnoty charakteristiky;

Frekvence jsou čísla, která označují, jak často se daná variace vyskytuje.

Pokud jsou varianty reprezentovány celočíselnými hodnotami charakteristiky, pak se takové variační distribuční řady nazývají oddělený, a pokud jsou možnosti reprezentovány číselnými intervaly, pak se takové řady nazývají interval.

Distribuční řady jsou doplněny frekvencemi a akumulovanými (kumulativními) frekvencemi.

Frekvence - relativní četnost určená poměrem počtu skupinových jednotek k celkovému objemu populace.

Akumulované frekvence ukázat, kolik jednotek populace má charakteristickou hodnotu nejvýše danou hodnotu. Je určena postupným přidáváním k frekvenci v prvním intervalu následujících frekvencí řady.

Hodnota seskupovacího intervalu intervalových variačních řad je určena vzorcem

kde je maximální hodnota prvku, je minimální hodnota prvku, je počet vybraných skupin.

Při rozhodování o tom, kolik skupin by mělo být vytvořeno, je třeba vzít v úvahu variační rozsah a počet jednotek studované populace. Čím větší je variační rozsah znaku, který je základem seskupení, tím více skupin lze zpravidla vytvořit.

Vztah mezi počtem skupin a počtem jednotek v populaci n lze vyjádřit vzorcem amerického vědce Sturgesse:

Tato závislost může sloužit jako orientace při určování počtu skupin v případě, kdy se distribuce jednotek populace pro dané kritérium blíží normálu.

Pokud je například požadováno seskupovat ve stejných intervalech podle údajů o hodnotě stálých aktiv podniků, jejichž maximální hodnota je 7 milionů rublů, minimální hodnota je 1 milion rublů. a v tomto případě je nutné vybrat 4 skupiny, pak se hodnota intervalu určí následovně

V našem příkladu bude seskupování ve stejných intervalech vypadat takto

U takové položky nezapomeňte na pravidlo, že levá číslice zahrnuje uvedenou hodnotu a pravá ne. V důsledku toho podniky s fixním majetkem 2,5 milionu rublů. by měl být zařazen do druhé skupiny.

Pojďme si ilustrovat konstrukci distribuční řady pomocí podmíněného příkladu.

Příklad 2.1... K dispozici jsou následující údaje o produkčních zkušenostech zaměstnanců malého podniku, roky.

9, 3, 7, 2, 5, 3, 11, 6, 5, 4, 7

Je nutné vybudovat řadu rozdělení zaměstnanců podle seniority, zpracování 3 skupin ve stejných intervalech.

Velikost intervalu pro seskupování zaměstnanců podle seniority je určena vzorcem

Intervaly budou následující:

2 - 5, 5 - 8, 8 - 11

Pojďme vypočítat frekvence a výsledky prezentovat v tabulce, kterou doplníme o frekvence a kumulativní frekvence

Tabulka 2.1. Řada rozdělení pracovníků podle pracovní zkušenosti

Distribuční řady pro přehlednost a pohodlí analýzy lze zobrazit graficky. Hlavní typy grafů distribučních řad: frekvenční polygon (obr. 1), histogram (obr. 2), kumulativní (obr. 3).

Chcete-li zobrazit sestavenou intervalovou řadu pracovníků podle jejich pracovních zkušeností ve formě frekvenčního polygonu, je třeba ji změnit na diskrétní řadu. Chcete-li to provést, určete středy (středy) intervalů -

(3, 5; 6,5; 9,5). Z těchto středů obnovte kolmice rovnající se frekvencím a spojte jejich vrcholy se segmenty.

Při konstrukci histogramu řady rozdělení pracovníků podle pracovní zkušenosti se intervaly řady vykreslují na ose úsečky, jejíž výška se rovná frekvencím vyneseným podél osy souřadnic. Nad osou úsečky jsou konstruovány obdélníky, jejichž plocha odpovídá jejich frekvencím hodnotám součinů intervalů.

Postava: 2.

Při grafickém zobrazování kumulů se nashromážděné frekvence aplikují na pole grafu ve formě kolmic k ose vodorovné osy v horních mezích intervalů, konkrétně 5, 8, 11. Kolmice jsou pak spojeny segmenty, v důsledku čehož je získána přerušovaná čára, která začíná od nuly po celou dobu a zvyšuje se na dokud nedosáhne výšky rovnající se celkovému součtu frekvencí.


Postava: 3.

Analýza sérií a grafů ukazuje, že rozdělení zaměstnanců podle délky služby není jednotné, čím více se délka služby zaměstnanců liší od průměrné doby služby, tím méně často se s takovými zaměstnanci setkáváme.

Zobecnění primárních dat ve formě distribuční řady vám umožňuje sledovat variace a složení populace podle studovaného atributu, porovnávat skupiny navzájem, studovat jejich dynamiku a určit povahu distribuce jednotek podle jednoho nebo druhého atributu.

Distribuční řady však neposkytují komplexní charakterizaci vybraných skupin. Aby bylo možné vyřešit řadu konkrétních úkolů, identifikovat rysy vývoje jevů, detekovat trendy, stanovit závislosti, je nutné seskupit statistické údaje.

V další otázce zvážíme, jak se provádí konkrétní seskupení.

Téma 9. Distribuční série

Statistické řady rozdělení Je primární charakteristikou hmoty statistická populace, nařídil rozklad jednotek studované populace do skupin podle kritérií seskupení. Libovolná řada statistických distribucí se skládá ze dvou prvků:

1) jednotlivé hodnoty atributu proměnné ( možnosti );

2) množství, která ukazují, kolikrát se daná možnost opakuje ( frekvence ).

Poznámka... Frekvence, vyjádřené ve zlomcích jednotky nebo jako procento z celkového počtu, se nazývají časté ; toto je počet vyjádření distribucí součet frekvencí.

Pokud se jako základ pro seskupení vezme kvalitativní rys, pak se taková distribuční řada nazývá atributivní (rozdělení podle druhu práce, pohlaví, profese, náboženství, národnosti atd.). Pokud je distribuční řada postavena na kvantitativním základě, pak se taková řada nazývá variační... Sestavit řadu variací znamená uspořádat kvantitativní rozdělení populačních jednotek podle hodnot atributu a poté vypočítat počet populačních jednotek s těmito hodnotami (sestavit tabulku skupin).

Přidělit tři formy variační řady:

1) hodnocená série - jedná se o rozdělení jednotlivých jednotek populace ve vzestupném nebo sestupném pořadí studovaného znaku; hodnocení umožňuje snadno rozdělit kvantitativní data do skupin, okamžitě najít nejmenší a největší hodnoty prvku, zvýraznit hodnoty, které se nejčastěji opakují; jiné formy variační řady - skupinové tabulky, zkompilovaný povahou změny hodnot studovaného znaku;

2) diskrétní řada - toto je taková variační řada, jejíž konstrukce je založena na vlastnostech s diskontinuálními změnami, mezi nimiž neexistují žádné mezilehlé hodnoty (diskrétní prvky - tarifní kategorie, počet dětí v rodině, počet zaměstnanců v podniku atd.); tato znaménka mohou nabrat jen konečný počet určitých hodnot;

Diskrétní řada představuje skupinový stůl, který se skládá ze dvou sloupců: první sloupec označuje konkrétní hodnotu atributu a ve druhém - počet jednotek populace s určitou hodnotou atributu;

3) má-li atribut průběžnou změnu (výše příjmu, pracovní zkušenosti, náklady na dlouhodobý majetek podniku atd., Které v určitých mezích mohou nabývat jakýchkoli hodnot), pak je pro tento atribut nutné stavět intervalové řady (ve stejných nebo nerovných intervalech).

Skupinový stůl zde má také dva grafy. První označuje hodnotu atributu v intervalu „od - do“ (možnosti), druhý - počet jednotek zahrnutých do intervalu (frekvence). Tabulka je velmi často doplněna sloupcem, ve kterém se počítají akumulované frekvence S, které ukazují, kolik jednotek populace má hodnotu ne větší než danou hodnotu... Frekvence řady f lze nahradit údaji wvyjádřeno v relativních číslech (zlomcích nebo procentech). Představují poměr frekvencí každého intervalu k jejich celkovému součtu (9,1):



(9.1)

Při konstrukci variační řady s hodnotami intervalu je nejprve nutné stanovit hodnotu intervalu i, která je definována jako poměr variačního rozsahu R k počtu skupin n (9.2):

kde R \u003d x max - x min; n \u003d 1 + 3,322 lgN ( sturgessův vzorec); N je celkový počet jednotek v populaci.

Pro prvky s diskrétními variacemi lze vytvořit řadu intervalových variací. Ve statistické studii je často nepraktické označovat samostatnou hodnotu diskrétního prvku, protože to obvykle ztěžuje zvážení variace rysu. Proto jsou možné diskrétní hodnoty atributu rozděleny do skupin a jsou vypočítány odpovídající frekvence (údaje). Při konstrukci intervalové řady založené na diskrétním prvku se hranice sousedních intervalů navzájem neopakují: další interval začíná od dalšího v pořadí (po horní hodnotě předchozího intervalu) diskrétní hodnoty prvku.

Při porovnávání frekvencí řady s nestejnými intervaly se vypočítá hustota distribuce, která charakterizuje jejich plnost. Průměrná hustota v intervalu - toto je podíl dělení frekvence a zejména hodnoty intervalu. V prvním případě je hustota absolutní, ve druhém relativní. Průměrná hustota ukazuje, kolik jednotek nebo jejich procenta na měrnou jednotku možností. Frekvence, zvláštnost, hustota a akumulovaná frekvence jsou různé funkce možností velikosti.

V průběhu analýza statistických údajů, představované distribuční řadou, lze kromě znalostí o povaze distribuce (nebo struktuře populace) vypočítat různé statistické ukazatele (numerické charakteristiky), které v zobecněné podobě odrážejí zvláštnosti distribuce studovaných charakteristik. Tyto charakteristiky (ukazatele) lze rozdělit do 3 hlavních skupin

1) charakteristika distribučního centra (průměr, móda, medián);

2) charakteristiky stupně variace (variační rozsah, střední lineární odchylka, odchylka, směrodatná odchylka, variační koeficient);

3) charakteristiky tvaru (typu) distribuce (ukazatele špičatosti a asymetrie, hodnostní charakteristiky, distribuční křivky).

Nejspolehlivější způsob identifikace distribučních vzorů je následující:
1) zvýšit počet pozorovaných případů (v souladu se zákonem velkého počtu se v takových sériích náhodné odchylky od obecného vzoru v jednotlivých hodnotách vzájemně zruší);

2) zpočátku rozdělit populaci na maximální možný počet skupin, poté postupným snižováním počtu skupin optimalizovat seskupení z hlediska identifikace distribučních vzorců.

Při implementaci tohoto přístupu se charakteristika pravidelnosti tohoto rozdělení bude objevovat stále zřetelněji a přerušovaná čára představující mnohoúhelník se přiblíží k určité hladké linii a v limitu by se měla proměnit v křivku.

Číslem ve statistice jsou digitální data ukazující změnu jevu v čase a prostoru a umožňující statisticky srovnávat jevy v procesu jejich vývoje v čase i v různé formy a typy procesů.

Výsledky souhrnu a seskupení statistických pozorovacích materiálů jsou zpracovány ve formě distribučních statistik a tabulek. Distribuční řady jsou série numerických indikátorů charakterizujících distribuci jednotek studované populace v závislosti na atributu seskupení. Charakterizují složení (strukturu) studovaného jevu, umožňují posoudit homogenitu agregátu, limity jeho změny, vzorce vývoje pozorovaného objektu.

V závislosti na atributu seskupení může být distribuční řada: 1) atributivní, jsou-li utvářeny podle kvalitativního atributu (specialita, národnost, pohlaví atd.); 2) variace, jsou-li formovány na kvantitativní bázi (trest odnětí svobody, výše pokuty, výše nároku atd.).

Variační řady se dělí na dva typy: diskrétní a intervalové. V diskrétních řadách je distribuce prvku uvedena pouze ve formě celých čísel. Například počet obviněných na trestní případ. V intervalových řadách je variace studovaného znaku dána ve formě neustále se měnící hodnoty, tj. hodnotu atributu lze vyjádřit jakýmkoli zlomkovým číslem. Například tresty odnětí svobody se pohybují do jednoho roku (6 měsíců, 9 měsíců atd.). Pro intervalové variační řady je charakteristické, že jsou vytvářeny na základě kvantitativního znaku vyjádřeného ve formě intervalu „od ... do“.

Proces vývoje, pohyb sociálních jevů v čase ve statu se obvykle nazývá dynamika. Pro zobrazení dynamiky jsou vytvořeny řady dynamiky (chronologické, časové), kočka je řada hodnot indikátoru statu, které se mění v čase, seřazené v chronologickém pořadí. Jejich složení jsou prvky yavl digitálních hodnot daného indikátoru nebo bodů v čase, ke kterým se vztahují. Různé typy údajů: 1. řada absolutních a odvozených ukazatelů; 2. moment a interval.

Při provádění statistické analýzy je metodou paralelních řad srovnání 2 nebo několika sérií, které jsou ve vzájemném spojení, v důsledku čehož se mezi nimi objevil vztah. Série \\\\ umožňují nejen porovnávat změnu jevu jako celku, ale také zachytit a vyjádřit v číslech směr, tendenci takové změny u několika druhů tohoto jevu najednou.

6. Transformace časových řad (zvětšení intervalů, vyhlazení, uzavření časové řady).

Transformace časových řad se provádí za účelem identifikace obecné tendence řady, a tedy obecné tendence, vzorců vývoje studovaného jevu.

Faktem je, že ne každá časová řada nám okamžitě umožňuje detekovat tu či onu tendenci, protože se časová řada často ukazuje jako kolísavá, „skákající“, ve které ukazatele buď rostou, nebo klesají.

K odhalení skrytých vzorů a trendů se používají různé metody transformace časových řad. Mezi různými metodami transformace časových řad se nejčastěji používají vyhlazování, zvětšení období a uzavírání dynamických řad.

Vyhlazení (metoda klouzavého průměru) časové řady znamená, že konkrétní ukazatele řady jsou nahrazeny vyhlazenými (klouzavé průměry), v důsledku čehož je detekován jeden nebo jiný trend řady.

Zvětšení období dynamické řady spočívá v součtu indikátorů řady pro delší časová období. Pokud je například dynamika kriminality podle okresů, měst nebo krajů prezentována podle měsíců, lze měsíční ukazatele seskupit (zvětšit) na čtvrtletní a získat novou transformovanou časovou řadu, ve které se neutralizují náhodné „poklesy“ měsíčních ukazatelů a odhalí se jeden či druhý trend řádek. Stejným způsobem lze čtvrtletní ukazatele konsolidovat (seskupit) do ročních ukazatelů a roční ukazatele do ukazatelů na 3 roky, 5 let atd.

Závěrečná časová řada. Tato metoda se používá, když existuje nesrovnatelnost indikátorů řady kvůli územním nebo jiným organizačním změnám.

Podstata této metody je následující. Během období (intervalu), během kterého proběhla reorganizace, jsou hladiny studovaného indikátoru určovány před i po reorganizaci (v našem příkladu 60 a 35), které jsou brány jako srovnávací základna (obvykle 100%). Na základě toho jsou vypočteny relativní hodnoty dynamiky před reorganizací okresu (indikátor 60, vzat jako základ 100%) a po jeho reorganizaci (indikátor 35, vzat jako základ 100%).

Indikátory uzavřené časové řady nám umožňují učinit závěr o dynamice rozvodu za celé období 1991-1997:

vzestupný trend rozvodovosti pokračoval, i když v absolutním vyjádření se počet rozvodů před reorganizací výrazně liší od rozvodů po její reorganizaci.

Jednodušší způsob řešení tohoto druhu problémů navrhuje Yu.F. Kardopolov, který se právem domnívá, že pokud jsou ukazatele časové řady kvůli územním změnám neporovnatelné, je třeba přejít od absolutních ukazatelů k relativním hodnotám intenzity, které se počítají pro stejný „objem“ populace (na 10 tisíc lidí nebo na 100 tisíc lidí).

CELORUSKÁ KORESPONDENCE

FINANČNÍ A EKONOMICKÝ ÚSTAV

KURZ PRÁCE

DISCIPLÍNOU

"STATISTIKA"

TÉMA: „STATISTICKÁ ŘADA DISTRIBUCE, JEJICH VÝZNAM A APLIKACE VE STATISTICE“

Dokončeno : student

skupiny 01FFB

Vorobjev V.A.

2003 rok .

Úvod. 3

1. Pojem řady statistických distribucí, jejich typy. Pět

1.1. Distribuční série. 6

1.2. Variační distribuční řady. 7

1.3. Výpočet středních hodnot 9

1.4. Režim a výpočet mediánu 10

1.5. Statistiky vykreslování 12

1.6. Výpočet variačních ukazatelů 16

2. Vypočítaná část 18

3. Analytická část 24

Závěr. 28

Reference 29

ÚVOD

Série statistických distribucí jsou jednou z nejvíce důležité prvky statistika. Jsou nedílnou součástí metody statistických shrnutí a seskupení, ale ve skutečnosti nelze provést žádnou ze statistických studií, aniž by byly poskytnuty informace původně získané v důsledku statistického pozorování ve formě statistických distribučních řad.

Primární data jsou zpracována za účelem získání obecných charakteristik studovaného jevu podle druhu podstatných rysů pro další analýzu a předpovědi; provádí se shrnutí a seskupení; statistické údaje jsou sestavovány pomocí distribučních řad v tabulkách, v důsledku čehož jsou informace prezentovány v jasné, racionální formě, vhodné pro použití a další výzkum; ve výstavbě různé druhy grafika pro co nejlepší vizuální vnímání a analýzu informací. Na základě statistických distribučních řad se počítají hlavní hodnoty statistických studií: indexy, koeficienty; absolutní, relativní, průměrné hodnoty atd., pomocí nichž lze provádět prognózy, jako konečný výsledek statistických studií.

Relevantnost tohoto tématu je dána skutečností, že řady statistických distribucí jsou základní metoda pro jakoukoli statistickou analýzu. Pro provádění statistického výzkumu je nutné porozumět této metodě a dovednosti ji používat.

V teoretické části práce v kurzu jsou zohledněny následující aspekty:

1) Koncept statistických distribučních řad, jejich typy;

2) Atributivní a variační distribuční řady;

3) Výpočet průměrných hodnot, režimu a mediánu;

4) Grafické znázornění distribučních řad;

Výpočtová část kurzu zahrnuje řešení úlohy na téma z varianty výpočetního úkolu:

1. Práce s tabulkou „Vybrané údaje o průměrných ročních nákladech na dlouhodobý majetek“

Analytická část práce zahrnuje výpočet průměrných hodnot, módů a mediánů na základě údajů uvedených v tabulce „Výsledky výběrového šetření rozpočtu obyvatelstva Ruské federace“, která odráží rozdělení populace Ruské federace podle průměrného příjmu na obyvatele. Zdrojem statistických údajů byla ruská statistická ročenka. Statistický sběr 2001 “.

Při práci s tabulkovými daty byl použit osobní počítač s konfigurací: procesor Intel Pentium Seleron 848 MHz, 128 MB RAM, Microsoft Windows XP Professional verze 2000, tabulkový procesor Excel Microsoft Office 2000.

Při psaní seminární práce byla použita učebnice základního kurzu, doplňková literatura a internetové zdroje.

1. KONCEPCE STATISTICKÉ DISTRIBUČNÍ SÉRIE A JEJICH DRUHY.

Výsledky shrnutí a seskupení statistických pozorovacích materiálů jsou zpracovány ve formě statistických distribučních řad. Statistické distribuční řady představují uspořádané rozdělení jednotek studované populace do skupin podle atributu seskupení (různé). Charakterizují složení (strukturu) studovaného jevu, umožňují posoudit homogenitu agregátu, limity jeho změny, vzorce vývoje pozorovaného objektu. V závislosti na atributu se statistické distribuční řady dělí na:

Atributivní (kvalita);

Variační (kvantitativní)

a) diskrétní;

b) interval.

1.1. Distribuční série

Řádky atributů jsou tvořeny podle kvalitativních charakteristik, kterými mohou být pozice zastoupené pracovníky v oboru, povoláním, pohlavím, vzděláním atd.

Stůl 1.

Rozdělení zaměstnanců podniku podle vzdělání .

V tomto příkladu je seskupovacím znakem vzdělávání zaměstnanců podniku (vyšší, střední). Tyto distribuční řady jsou přívlastkové, protože proměnnou vlastnost nepředstavují kvantitativní, ale kvalitativní ukazatele. Největší počet jsou pracovníci se středoškolským vzděláním (asi 40%); zbytek pracovníků je podle tohoto kritéria kvality rozdělen do skupin: se středním odborným vzděláním - 25%; s neúplným vysokoškolským vzděláním - 20%; s vyšším - 15%.

1.2. Variační distribuční řady

Variační řady jsou postaveny na základě atributu kvantitativního seskupení. Variační řady se skládají ze dvou prvků: varianty a frekvencí.

Varianta je samostatná hodnota proměnné charakteristiky, kterou bere v distribuční řadě. Mohou být pozitivní a negativní, absolutní a relativní. Frekvence je počet jednotlivých variant nebo každé skupiny variačních řad. Frekvence vyjádřené ve zlomcích jedné nebo jako procento z celkového počtu se nazývají frekvence. Součet frekvencí se nazývá objem populace a určuje počet prvků v celé populaci.

Frekvence jsou frekvence vyjádřené jako relativní hodnoty (zlomky jednotek nebo procenta). Součet frekvencí se rovná jedné nebo 100%. Nahrazení frekvencí frekvencemi umožňuje porovnat řadu variací s různá čísla pozorování.

Variační řady se podle povahy variace dělí na diskrétní (diskontinuální) a intervalové (spojité). Diskrétní distribuční řady jsou založeny na diskrétních (nespojitých) prvcích, které mají pouze celočíselné hodnoty (například mzdová kategorie pracovníků, počet dětí v rodině).

Intervalové distribuční řady jsou založeny na neustále se měnící hodnotě funkce, která přijímá jakékoli (včetně zlomkových) kvantitativních výrazů, tj. hodnota prvků takové řady je nastavena jako interval.

Za přítomnosti dostatečně velkého počtu možností pro hodnoty atributu je primární řada obtížně viditelná a její přímé zvážení neposkytuje představu o distribuci jednotek podle hodnoty atributu v agregátu. Prvním krokem v pořadí primárního řádku je tedy jeho pořadí - uspořádání všech možností ve vzestupném (sestupném) pořadí.

Pro konstrukci diskrétní řady s malým počtem možností jsou zapsány všechny vyskytující se možnosti pro hodnoty atributů

, a poté se vypočítá míra opakování varianty. Řada distribucí je obvykle sestavena ve formě tabulky skládající se ze dvou sloupců (nebo řádků), z nichž jeden obsahuje varianty a druhý - frekvence.

Pro konstrukci řady distribucí kontinuálně se měnících atributů, nebo diskrétních, prezentovaných ve formě intervalů, je nutné stanovit optimální počet skupin (intervalů), do kterých by měly být rozděleny všechny jednotky studované populace.

1.3. Výpočet průměrných hodnot.

Průměrné hodnoty se zpravidla počítají tak, aby se získaly zobecněné kvantitativní charakteristiky úrovně proměnného atributu na základě souboru jednotek konkrétního jevu nebo procesu, které jsou v základních vlastnostech homogenní. Ve statistikách jsou všechny prostředky označovány jako `X. Existuje několik typů průměrů.

Hlavní průměrný je mocnina. Vypadá to takto:

kde `X je průměrná hodnota;

X - měnící se hodnota možností atributu;

n je počet funkcí nebo možností;

m je exponent průměru.

V závislosti na hodnotě exponentu průměru má následující podoby:

a). Nevážený aritmetický průměr, kde m \u003d 1. Má formu.

Výsledky shrnutí a seskupení, statistické pozorovací materiály jsou zpracovány ve formě distribučních řad a statistických tabulek.

Statistická distribuční řada je uspořádané uspořádání jednotek studované populace do skupin podle charakteristik seskupení. Charakterizují kompozici, umožňují posoudit homogenitu agregátu, hranice jeho změny, zákonitosti vývoje pozorovaného objektu.

V závislosti na prvku, který je základem distribuční řady, se rozlišují řady atributů a variace.

Varianty jsou jednotlivé hodnoty prvku, který má v řadě variací, tj. konkrétní význam atributu proměnná.

Frekvence - nazývá se počet jednotlivých variant nebo každé skupiny variačních řad, tj. toto je číslo, které ukazuje, jak často se v distribuční sérii vyskytují určité varianty.

Součet všech frekvencí určuje velikost celé populace nebo její objem. Variační řady se skládají ze dvou prvků: variant a frekvencí. Frekvence jsou vyjádřeny ve zlomcích jedné nebo jako procento z celkového počtu (tzv. Frekvence). Součet frekvencí je tedy 1 nebo 100%.

V závislosti na povaze variace znaku se rozlišují diskrétní a intervalové řady.

Diskrétní řady charakterizují rozdělení populačních jednotek podle diskrétního atributu, který bere pouze pevnou hodnotu, nejčastěji celek.

Intervační variační řady jsou série, ve kterých jsou hodnoty variant uvedeny jako intervaly.

Diskrétní řady jsou graficky znázorněny jako distribuční polygon. Intervalové řady - ve formě distribučního histogramu.

Statistické tabulky

Výsledky shrnutí a seskupení pozorovacích materiálů jsou zpravidla prezentovány ve formě statistických tabulek. Toto je nejúčinnější způsob, jak prezentovat souhrnné výsledky. Hodnota statistických tabulek spočívá v tom, že umožňují pokrýt materiál statistického shrnutí jako celek.

Podle vzhled statistické tabulky jsou řadou protínajících se svislých a vodorovných čar. Svisle - řádky, vodorovně - sloupy.

Zkompilovaná, ale nedokončená tabulka se nazývá rozložení tabulky. Statistická tabulka se skládá ze dvou prvků: subjektu a predikátu. Předmět - předmět studia - jednotky populace, které jsou charakterizovány číselnými ukazateli. Predikováno - seznam numerických indikátorů, které charakterizují předmět studia, tj. předmět tabulky.

Název jednotek nebo skupin, které tvoří předmět, je uveden na levé straně tabulky v záhlaví řádků a název indikátorů, které charakterizují, tj. predikát v horní části tabulky v záhlaví sloupců.

V závislosti na konstrukci je předmět statistické tabulky rozdělen do tří typů:

1. Jednoduché

2. Skupina

3. Kombinace

1) Jednoduché - v předmětu nejsou žádná seskupení. Podle povahy předkládaného materiálu jsou jednoduché tabulky:

· Hnědá;

· Územní;

· Chronologické.

2) Skupina - ve které je studovaný objekt rozdělen v předmětu do skupin podle jedné nebo druhé charakteristiky.

3) Kombinované - tabulky, v jejichž předmětu je uvedeno seskupení jednotek populace podle dvou nebo více charakteristik, kombinovaných.

Když predikát obsahuje více metrik, může být vývoj predikátu jednoduchý a složitý. Jednoduchý vývoj predikátu umožňuje paralelní uspořádání indikátorů a komplexně kombinovaný.

Statistické grafy

Statistický materiál získaný v důsledku vývoje, který je umístěn v tabulkách, často vyžaduje vizuální znázornění pomocí konstrukce statistických grafů.

Statistický graf je vizuální reprezentace statistických dat pomocí geometrických čar a tvarů nebo schémat geografických map (kartogram).

V každém grafu se rozlišují následující prvky:

1. Grafický obraz - základ grafu - geometrické znaky, množina bodů, linií, obrazců, pomocí kterých jsou zobrazovány statistické informace.

2. Polygrafie - místo, kde se nachází grafický obrázek.

3. Prostorové orientační body - sestaveny pomocí souřadnicového systému.

4. Měřítko referenčních bodů - závisí na měřítku a měřítku grafu.

5. Využití grafu je název a odpovídající pole jeho jednotlivých částí.

V závislosti na použití geometrických znaků se grafy rozlišují na bodové, lineární, pásové, čtvercové a kruhové. Grafy jsou ve formě negeometrických tvarů, nazývají se kudrnaté.

Statistické grafy jsou rozděleny podle způsobu konstrukce a úkolů:

1. Schémata:

a) srovnání;

b) reproduktory;

c) strukturální.

2. Statistické mapy:

a) kartogramy;

b) kartodiagramy.

Diagram je nejběžnějším způsobem grafických obrázků, slouží k vizuálnímu porovnání hodnot, které se navzájem liší.

Graf je graf kvantitativních vztahů.

Statistické mapy jsou grafy kvantitativního rozdělení po povrchu. Svým hlavním účelem se blíží diagramům, ale liší se tím, že představují konvenční obrazy statistických dat na vrstevnicové geografické mapě.

Statistické mapy ukazují prostorové rozložení nebo prostorovou prevalenci statistik.

1. Statistické mapy zahrnují kartogramy - jedná se o schematickou mapu nebo plán oblasti, na které jsou jednotlivé oblasti v závislosti na hodnotě zobrazeného indikátoru označeny pomocí grafických symbolů.

2. Kartogramy - kombinace kartogramů s diagramem.

Ve zvláštních případech, kdy je nutné zobrazit jakýkoli statistický ukazatel, který se získá vynásobením dalších dvou veličin, a musí být zobrazeny v grafu, se používají speciální grafické značky, které se nazývají Varzalovy značky.


Podobné informace.