Statistický agregát, jeho typy. Populační jednotky a klasifikace jejich vlastností

abstraktní

Průměrné hodnoty a variační ukazatele

1. Podstata průměrů ve statistice

2. Druhy průměrů a metody jejich výpočtu

3. Hlavní variační ukazatele a jejich význam ve statistice

1. Podstata středního vepřevleky ve statistikách

V procesu studia masových socioekonomických jevů je nutné je identifikovat obecné vlastnosti, typické velikosti a vlastnosti. Potřeba zobecňujícího průměru vyvstává, když se vlastnosti charakterizující jednotky studované populace kvantitativně liší. Například závisí na denní produkci tkalců v textilní továrně všeobecné podmínky výroba, tkalci používají stejné suroviny, pracují na stejných krosnách atd. Současně kolísá hodinový výkon jednotlivých tkalců, tj. se liší, protože to závisí na individuálních charakteristikách každého tkalce (jeho kvalifikace, profesionální zkušenosti atd.). Pro charakterizaci denního výkonu všech tkalců v podniku je nutné vypočítat průměrný denní produkce, protože pouze v tomto ukazateli se projeví obecné výrobní podmínky pro tkalce.

Výpočet průměrných zobecněných indikátorů tedy znamená rozptýlení (abstrakci) od znaků odrážejících se v hodnotě atributu v jednotlivých jednotkách a identifikaci společných typických znaků a vlastností pro danou množinu.

Průměrná hodnota ve statistice je tedy zobecněnou kvantitativní charakteristikou atributu a statistické populace. Vyjadřuje charakteristickou, typickou hodnotu znaku v jednotkách agregátu vytvořeného za daných podmínek místa a času pod vlivem celého souboru faktorů. Působení různých faktorů vede k fluktuaci, variaci průměrované vlastnosti. Průměrná hodnota je společným měřítkem jejich působení, výsledkem všech těchto faktorů. Průměrná hodnota charakterizuje populaci podle atributu average, ale odkazuje na jednotku populace. Například průměrný výstup na pracovníka tento podnik představuje poměr celé produkce (za jakékoli časové období) k celkovému (průměrnému za stejné období) počtu jejích pracovníků. Charakterizuje produktivitu práce dané populace, ale týká se jednoho pracovníka. V průměrné hodnotě hromadného jevu se ruší jednotlivé rozdíly jednotek statistického souboru v hodnotách průměrovaného prvku z důvodu náhodných okolností. Výsledkem tohoto vzájemného rušení v průměru se objevuje společná přirozená vlastnost daného statistického agregátu jevů. Mezi průměrem a jednotlivými významy zprůměrovaného znaku existuje dialektická souvislost mezi obecným a jednotlivcem. Průměr je nejdůležitější kategorií statistické vědy a nejdůležitější formou zobecňujících ukazatelů. Mnoho jevů společenského života je jasných, definitivních, pouze když jsou zobecněny, ve formě průměrných hodnot. Jedná se například o výše zmíněnou produktivitu práce, souhrn pracovníků, výnos zemědělských plodin atd. Průměr je nejdůležitější metodou vědeckého zobecnění ve statistice. V tomto smyslu hovoří o metodě průměrů, která je v ekonomické vědě široce používána. Mnoho kategorií ekonomie je definováno pomocí konceptu průměru.

Hlavní podmínka správná aplikace průměrná hodnota je homogenita statistické populace pro průměrný atribut. Homogenní statistická populace je populace, ve které je základní prvky (jednotky) jsou si navzájem podobné v charakteristikách nezbytných pro tuto studii a odkazují na stejný typ jevů. Homogenní populace, která je v některých charakteristikách homogenní, může být v jiných heterogenní. Pouze v průměrech pro takové agregáty se projevují specifické rysy, vzorce vývoje analyzovaného jevu. Průměr vypočítaný pro heterogenní statistickou populaci, tj. takové, ve kterých jsou kombinovány kvalitativně odlišné jevy, ztrácí svůj vědecký význam. Takové průměry jsou fiktivní, nejen že neposkytují žádnou představu o realitě, ale také ji zkreslují. Pro tvorbu homogenních statistických agregátů se provádí vhodné seskupení. Pomocí seskupení a v kvalitativně homogenní populaci lze rozlišit kvantitativně charakteristické skupiny. Pro každý z nich lze vypočítat jeho vlastní průměr, který se nazývá skupinový průměr (soukromý), na rozdíl od obecného průměru (pro populaci jako celek).

2. Druhy průměrných hodnot

V metodice průměrů mají velký význam otázky výběru tvaru průměru, tj. vzorec, podle kterého můžete správně vypočítat průměrnou hodnotu, a výběr průměrných vah. Nejčastěji se používá ve statistikách agregovaný průměr, aritmetický průměr, harmonický průměr, průměrgeometrický, odmocnina, mód a medián. Použití tohoto nebo toho vzorce závisí na obsahu zprůměrovaného prvku a konkrétních datech, pro která musí být vypočítán. Chcete-li vybrat tvar průměru, můžete použít takzvaný průměrný počáteční poměr.

2.1 Aritmetický průměr

Aritmetický průměr je jednou z nejběžnějších forem průměru. Aritmetický průměr se vypočítá jako podíl dělení součtu jednotlivých hodnot (opcí) proměnné značky na jejich počtu. Aritmetický průměr se používá v případech, kdy je objem proměnného atributu jevů homogenní statistické populace tvořen součtem hodnot atributu všech jednotek jevů statistické populace. Rozlišují se následující aritmetické střední hodnoty:

1) Jednoduchý aritmetický průměr, který je určen jednoduchým součtem kvantitativních hodnot proměnného atributu a rozdělením tohoto součtu na jejich varianty a vypočítán pomocí následujícího vzorce:

X je průměrná hodnota statistické populace,

x i - součet jednotlivých proměnných variant jevů statistické populace,

n i - počet různých variant jevů statistické populace.

2) Aritmetický průměr vážený - průměrná hodnota atributu jevu, vypočítaná s přihlédnutím k vahám. Váhy průměrných hodnot jsou frekvence, se kterými se při výpočtu průměrné hodnoty berou v úvahu jednotlivé hodnoty průměrovaného atributu. Volba vah průměrné hodnoty závisí na podstatě průměrovaného atributu a povaze dat, která jsou k dispozici pro výpočet průměrných hodnot. Váhy průměrných hodnot mohou být indikátory počtu jednotek nebo velikostí částí statistické populace (ve formě absolutních nebo relativních hodnot) s danou variantou (hodnotou) zprůměrovaného atributu jevu statistické populace, stejně jako hodnota indikátoru spojená s průměrovaným atributem. Aritmetický vážený průměr se vypočítá pomocí následujícího vzorce:

X - vážený aritmetický průměr,

x - hodnota jednotlivých proměnných variant jevů statistické populace,

Účelem jednoduchého a váženého aritmetického průměru je určit průměrnou hodnotu atributu proměnné. Pokud se ve studované statistické populaci varianty hodnot atributu vyskytují jednou nebo mají stejnou váhu, použije se jednoduchý aritmetický průměr, pokud se varianty hodnot tohoto atributu vyskytují ve studované populaci několikrát nebo mají různé váhy, použije se k určení průměrné hodnoty proměnného atributu aritmetický průměr. vážený.

2.2 Průměrná harmonická

Harmonický průměr se používá k výpočtu průměrné hodnoty, pokud neexistují žádné přímé údaje o vahách, ale jsou známy varianty průměrovaného prvku (x) a součin hodnot variant podle počtu jednotek s touto hodnotou w (w \u003d xf).

Tento průměr se vypočítá pomocí následujících vzorců:

1.) Průměrná harmonická jednoduchá:

X - průměrná harmonická jednoduchá,

n je počet různých variant jevů statistické populace.

2) Průměrná vážená harmonická:

X - průměrná vážená harmonická,

x - součet jednotlivých proměnných variant jevů statistické populace,

Při použití harmonického vážení se odhalí váhy a získá se tak stejný výsledek, který by poskytl výpočet pomocí aritmetického váženého průměru, pokud by byly známy všechny potřebné údaje.

2.3 Průměrný agregát

Agregovaný průměr se vypočítá podle vzorce:

X - průměrný agregát,

x - součet jednotlivých proměnných variant jevů statistické populace,

Agregovaný průměr se vypočítá v případech, kdy jsou známé hodnoty čitatele a hodnoty jmenovatele počátečního průměrného poměru (k dispozici).

2.4 Geometrický průměr

Geometrický průměr je jednou z forem průměru a počítá se jako kořen n stupňů od součinu jednotlivých hodnot - variant atributu (x) a je dán následujícím vzorcem:

Geometrický průměr se používá hlavně při výpočtu průměrných rychlostí růstu.

2.5 Móda a medián

Spolu s výše uvažovanými průměry tzv strukturální prostředky - režim a medián.

Režim (Mo) je nejběžnější hodnota znaku v populačních jednotkách... U diskrétních řad má tato možnost nejvyšší frekvenci.

V intervalových variačních řadách je možné určit především interval, ve kterém je režim umístěn, tj. tzv. modální řádkování. V variačních řadách se stejnými intervaly je modální interval určen nejvyšší frekvencí, v sériích s nerovnými intervaly nejvyšší distribuční hustotou.

Chcete-li určit režim v řádcích se stejnými intervaly, použijte následující vzorec:

Хн - spodní hranice modálního intervalu,

h - velikost intervalu,

f 1, f 2, f 3 - frekvence (respektive podrobnosti) pre-modálních, modálních a postmodálních intervalů.

V intervalové řadě lze mód najít graficky. Za tímto účelem jsou v nejvyšším sloupci histogramu nakresleny dvě čáry z hranic dvou sousedních sloupců. Potom z bodu jejich průsečíku je kolmá osa spuštěna na osu úsečky. Hodnota prvku na ose úsečky, která odpovídá kolmici, bude režim.

V mnoha případech je při charakterizaci populace upřednostňována móda před aritmetickým průměrem jako zobecněným indikátorem.

Při studiu cen na trhu to tedy není pevné a studuje se to v dynamice. průměrná cena u některých produktů, ale modální; Při studiu poptávky populace po určité velikosti bot nebo oděvů je zajímavé určit modální velikost boty a průměrná velikost jako taková zde vůbec nezáleží. Móda je nejen nezávislým zájmem, ale také hraje roli pomocného ukazatele pro průměr, který charakterizuje jeho typičnost. Pokud má aritmetický průměr hodnotu blízkou módě, pak je to typické.

Medián (Me) je hodnota prvku ve střední jednotce hodnocené série. (Zařazená řada je řada, jejíž charakteristické hodnoty jsou zapsány vzestupně nebo sestupně.)

Chcete-li najít medián, je nejprve určeno jeho sériové číslo. K tomu je při lichém počtu jednotek jedna přidána k součtu všech frekvencí a vše je vyděleno dvěma. Při sudém počtu jednotek v řadě budou dvě střední jednotky a podle všech pravidel by měl být medián určen jako průměr z hodnot těchto dvou jednotek. V tomto případě, s téměř sudým počtem jednotek, je medián nalezen jako hodnota atributu pro jednotku, jejíž sériové číslo je určeno celkovým součtem frekvencí děleno dvěma. Známe-li pořadové číslo mediánu, je snadné najít jeho hodnotu z akumulovaných frekvencí.

V intervalové řadě se po určení pořadového čísla mediánu kumulativními frekvencemi (údaji) najde střední interval a poté se pomocí nejjednodušší interpolační techniky určí hodnota samotného mediánu. Tento výpočet je vyjádřen následujícím vzorcem:

X n - spodní hranice středního intervalu,

h je hodnota středního intervalu,

Pořadové číslo mediánu,

S Me - 1 frekvence (frekvence) akumulovaná až do středního intervalu,

F Me - frekvence (zejména) středního intervalu.

Podle psaného vzorce se k dolní hranici mediánu intervalu přidá taková část hodnoty intervalu, která spadá na zlomek jednotek této skupiny, které chybí k pořadovému číslu mediánu. Jinými slovy, výpočet mediánu je založen na předpokladu, že k růstu rysu mezi jednotkami každé skupiny dochází rovnoměrně. Na základě toho, co bylo řečeno, lze medián vypočítat jiným způsobem. Po určení mediánu intervalu je možné odečíst od horní hranice mediánu intervalu (Xv) tu část intervalu, která spadá na zlomek jednotek přesahující pořadové číslo mediánu, tj. podle následujícího vzorce:

Medián lze také určit graficky. K tomu je sestrojena kumulativa a přímka je nakreslena z bodu na stupnici akumulovaných frekvencí (údajů) odpovídajících pořadovému číslu mediánu, paralelní osa x před překročením kumulativní hodnoty. Potom z průsečíku zadané přímky s kumulativou je kolmá osa spuštěna na osu úsečky. Hodnota prvku na ose vodorovné osy odpovídající nakreslené souřadnici (kolmé) bude medián.

Ze stejného principu je snadné najít hodnotu prvku pro jakoukoli jednotku zařazené série.

K výpočtu průměrné hodnoty variační řady lze tedy použít celou sadu indikátorů.

3. Hlavní ukazatele vara jejich význam ve statistice

Při studiu proměnlivé vlastnosti v populačních jednotkách nelze omezit pouze na výpočet průměrné hodnoty z jednotlivých možností, protože stejný průměr nemusí platit pro populace se stejným složením. To lze ilustrovat na následujícím podmíněném příkladu, který odráží údaje o počtu domácností v zemědělských podnicích dvou regionů:

Průměrný počet domácností v zemědělských podnicích obou okresů je stejný - 160. Navíc složení těchto zemědělských podniků ve dvou okresech není ani zdaleka stejné. Proto je nutné měřit odchylku charakteristiky v agregátu.

Za tímto účelem se ve statistikách počítá řada charakteristik, tj. ukazatele. Nejzákladnějším ukazatelem variace funkce je rozsah variací R, což je rozdíl mezi maximální a minimální hodnotou prvku v dané variační řadě, tj. R \u003d Xmax - Xmin. V našem příkladu v první oblasti R \u003d 300 - 80 - 220 a ve druhé oblasti R \u003d 180 - 145 \u003d 35.

Indikátor variačního rozsahu není vždy použitelný, protože bere v úvahu pouze extrémní hodnoty znaku, které se mohou velmi lišit od všech ostatních jednotek. Někdy je nalezen poměr variačního rozsahu k aritmetickému průměru a je použita tato hodnota, která jej nazývá indikátorem oscilace.

Přesněji můžete určit odchylku v řadě pomocí indikátorů, které zohledňují odchylky všech možností od aritmetického průměru. Ve statistice existují dva takové ukazatele - průměrná lineární a směrodatná odchylka.

Průměrná lineární odchylka představuje aritmetický průměr absolutních hodnot odchylek možností od střední hodnoty. V tomto případě jsou příznaky odchylek ignorovány, jinak bude součet všech odchylek roven nule. Tento ukazatel se počítá podle vzorce:

b) pro variační řadu:

Je třeba mít na paměti, že průměrná lineární odchylka bude minimální, pokud se odchylky počítají z mediánu, tj. podle vzorce:

Standardní odchylka () se vypočítá následovně - každá odchylka od průměru se na druhou, všechny čtverce se sečtou (s přihlédnutím k vahám), poté se součet čtverců vydělí počtem členů řady a druhá odmocnina se extrahuje z kvocientu.

Všechny tyto akce jsou vyjádřeny následujícími vzorci:

a) pro neagregované údaje:

b) pro variační řadu:

f, tj. Směrodatná odchylka je druhá odmocnina aritmetického průměru čtverců odchylek průměru. Výraz pod kořenem se nazývá variance. Variance má ve statistice nezávislé vyjádření a je jedním z nejdůležitějších indikátorů variace.

Koncept řady variací. Prvním krokem v systematizaci statistických pozorovacích materiálů je spočítat počet jednotek, které mají tuto nebo tu vlastnost. Uspořádáním jednotek ve vzestupném nebo sestupném pořadí podle jejich kvantitativní charakteristiky a počítáním počtu jednotek se specifickou hodnotou charakteristiky získáme řadu variací. Variační řada charakterizuje distribuci jednotek určité statistické populace jakýmkoli kvantitativním kritériem.

Variační řada se skládá ze dvou sloupců, levý sloupec zobrazuje hodnoty měnícího se prvku, který se nazývá varianty a je označen (x), a pravý sloupec obsahuje absolutní čísla udávající, kolikrát se jednotlivé varianty vyskytují. Odečty v tomto sloupci se nazývají frekvence a jsou označeny (f).

Variační řadu lze schematicky znázornit ve formě tabulky 5.1:

Tabulka 5.1

Typ variační řady

Možnosti (x)

Frekvence (f)

V pravém sloupci lze také použít relativní ukazatele, které charakterizují podíl frekvence jednotlivých variant na celkovém součtu frekvencí. Tyto relativní indikátory se nazývají frekvence a jsou konvenčně označovány prostřednictvím, tj. ... Součet všech částí se rovná jedné. Frekvence lze také vyjádřit v procentech a jejich součet se pak bude rovnat 100%.

Různá znamení mohou mít jinou povahu. Varianty některých funkcí jsou vyjádřeny v celých číslech, například počet pokojů v bytě, počet vydaných knih atd. Tyto příznaky se nazývají diskontinuální nebo diskrétní. Varianty dalších charakteristik mohou nabývat jakýchkoli hodnot v určitých mezích, jako je například provádění plánovaných úkolů, mzda a další. Tato znamení se nazývají spojitá.

Diskrétní variační řady. Pokud jsou varianty variační řady vyjádřeny ve formě diskrétních veličin, pak se taková variační řada nazývá diskrétní, vzhled uvedené v tabulce. 5.2:

Tabulka 5.2

Rozdělení studentů podle známek získaných na zkoušce

Známky (x)

Počet studentů (f)

Celkem v% ()

Povaha distribuce v diskrétních řadách je graficky znázorněna ve formě distribučního polygonu, obr. 5.1.

Postava: 5.1. Rozdělení studentů podle známek získaných na zkoušce.

Intervalové variační řady. Pro spojité prvky jsou variační řady konstruovány jako intervalové, tj. hodnoty atributu v nich jsou vyjádřeny jako intervaly „od a do“. V tomto případě se minimální hodnota prvku v takovém intervalu nazývá dolní hranice intervalu a maximum se nazývá horní hranice intervalu.

Intervační variační řady jsou vytvořeny jak pro diskontinuální (diskrétní) funkce, tak pro ty, které se mění ve velkém rozsahu. Intervalové řádky mohou být ve stejných nebo nerovných intervalech. V ekonomické praxi se z velké části používají nerovné intervaly, které se postupně zvyšují nebo snižují. Taková potřeba vyvstává zejména v případech, kdy je variabilita prvku prováděna nerovnoměrně a v širokých mezích.

Zvažte typ intervalové řady se stejnými intervaly, tabulka. 5,3:

Tabulka 5.3

Rozdělení pracovníků podle výroby

Generace, tr. (X)

Počet pracovníků (f)

Kumulativní frekvence (f´)

Série distribučních intervalů je graficky znázorněna ve formě histogramu, obrázek 5.2.

Obrázek 5.2. Rozdělení pracovníků podle výroby

Akumulovaná (kumulativní) frekvence. V praxi je potřeba transformovat distribuční řady na kumulativní série,na základě akumulovaných frekvencí. Mohou být použity k určení strukturálních prostředků, které usnadňují analýzu dat distribuční řady.

Akumulované frekvence jsou určovány postupným přidáváním k frekvencím (nebo částem) první skupiny těchto indikátorů následujících skupin distribuční řady. Kumulace a ogivy se používají k ilustraci distribuční řady. Pro jejich vykreslení jsou hodnoty diskrétního prvku (nebo konce intervalů) vyznačeny na ose úsečky a rostoucí součty frekvencí (kumulativní) jsou označeny na ose souřadnic, obrázek 5.3.

Postava: 5.3. Kumulativní rozdělení pracovníků podle výroby

Pokud jsou stupnice frekvencí a variant obrácené, tj. odrážejí akumulované frekvence na ose úsečky a hodnoty možností na ose souřadnic, pak se křivka charakterizující změnu frekvencí ze skupiny na skupinu bude nazývat distribuční ogives, obr. 5.4.

Postava: 5.4. Rozsah distribuce pracovníků do výroby

Stejně rozmístěné variační řady poskytují jeden z nejdůležitějších požadavků na statistická řada distribuce, zajišťující jejich srovnatelnost v čase a prostoru.

Hustota distribuce. Frekvence jednotlivých nerovných intervalů v těchto řadách však nejsou přímo srovnatelné. V takových případech se pro zajištění potřebné srovnatelnosti vypočítá distribuční hustota, tj. určit, kolik jednotek v každé skupině je na jednotku intervalu.

Při konstrukci grafu distribuce variační řady s nerovnými intervaly se výška obdélníků určuje v poměru nikoli k frekvencím, ale k indikátorům hustoty distribuce hodnot studovaného atributu v příslušných intervalech.

Sestavení variační řady a její grafické znázornění je prvním krokem při zpracování počátečních dat a první fází analýzy studované populace. Dalším krokem v analýze variačních řad je určení hlavních zobecňujících indikátorů, které se nazývají charakteristiky řady. Tyto charakteristiky by měly poskytnout představu o průměrné hodnotě znaku v populačních jednotkách.

průměrná hodnota... Průměrná hodnota je zobecněná charakteristika studovaného znaku ve studované populaci, odrážející jeho typickou úroveň na jednotku populace ve specifických podmínkách místa a času.

Průměr je vždy pojmenován, má stejnou dimenzi jako atribut pro jednotlivé jednotky populace.

Před výpočtem průměrných hodnot je nutné seskupit jednotky studované populace se zvýrazněním kvalitativně homogenních skupin.

Průměr vypočítaný pro populaci jako celek se nazývá celkový průměr a pro každou skupinu průměr skupiny.

Existují dva typy středních hodnot: moc (aritmetický průměr, harmonický průměr, geometrický průměr, střední čtverec); strukturální (móda, medián, kvartily, decily).

Volba průměru pro výpočet závisí na účelu.

Druhy výkonových průměrů a metody jejich výpočtu.V praxi statistického zpracování shromážděného materiálu vznikají různé problémy, jejichž řešení vyžaduje různé průměry.

Matematická statistika odvozuje různé prostředky ze vzorců střední moci:

kde je průměrná hodnota; x - jednotlivé varianty (charakteristické hodnoty); z - exponent (pro z \u003d 1 - aritmetický průměr, z \u003d 0 geometrický průměr, z \u003d - 1 - harmonický průměr, z \u003d 2 - střední čtverec).

Otázka, jaký typ průměru je třeba použít v každém jednotlivém případě, je však vyřešena specifickou analýzou studované populace.

Nejběžnějším typem průměru ve statistikách je aritmetický průměr... Vypočítává se v případech, kdy je objem zprůměrovaného prvku vytvořen jako součet jeho hodnot pro jednotlivé jednotky studované statistické populace.

V závislosti na povaze počátečních dat se aritmetický průměr určuje různými způsoby:

Pokud data nejsou seskupena, provede se výpočet podle vzorce jednoduché průměrné hodnoty

Výpočet aritmetického průměru v diskrétní řadědochází podle vzorce 3.4.

Výpočet aritmetického průměru v intervalové řadě. V variačních řadách intervalů, kde se střed intervalu obvykle bere jako hodnota prvku v každé skupině, se aritmetický průměr může lišit od průměru vypočítaného z neseskupených dat. Čím větší je hodnota intervalu ve skupinách, tím větší jsou možné odchylky průměru vypočítaného ze seskupených dat od průměru vypočteného ze seskupených dat.

Při výpočtu průměru za variační řadu intervalů se provedou nezbytné výpočty, intervaly se přenesou do jejich středů. A pak se průměrná hodnota vypočítá pomocí vzorce aritmetického váženého průměru.

Vlastnosti aritmetického průměru.Aritmetický průměr má některé vlastnosti, které vám umožňují zjednodušit výpočty, zvažte je.

1. Aritmetický průměr konstantních čísel se rovná tomuto konstantnímu počtu.

Pokud x \u003d a. Pak .

2. Pokud se proporcionálně změní hmotnosti všech variant, tj. zvýšit nebo snížit o stejný počet opakování, pak se aritmetický průměr nové řady od toho nezmění.

Pokud jsou všechny váhy f sníženy o faktor k, pak .

3. Součet kladných a záporných odchylek jednotlivých opcí od průměru, vynásobený váhami, se rovná nule;

Pokud ano. Odtud.

Pokud jsou všechny možnosti sníženy nebo zvýšeny o libovolné číslo, pak se aritmetický průměr nové řady sníží nebo zvýší o stejnou částku.

Snižte všechny možnosti x na a, tj. x´ = xa.

Pak

Aritmetický průměr původní řady lze získat přidáním sníženého průměru k počtu dříve odečtenému od možností a, tj. ...

5. Pokud jsou všechny možnosti sníženy nebo zvýšeny o k krát, pak se aritmetický průměr nové řady sníží nebo zvýší o stejnou částku, tj. v k čas.

Pojďme tedy .

Proto tedy k získání průměru počáteční řady je třeba aritmetický průměr nové řady (se sníženými možnostmi) zvýšit o kčas.

Průměrná harmonická.Harmonický průměr je převrácená hodnota aritmetického průměru. Používá se, když statistické informace neobsahuje frekvence pro jednotlivé varianty populace, ale je prezentován jako jejich součin (M \u003d xf). Harmonický průměr se vypočítá podle vzorce 3.5

Praktické použití harmonického průměru - pro výpočet některých indexů, zejména cenového indexu.

Geometrický průměr.Při použití geometrického průměru jsou jednotlivé hodnoty charakteristiky zpravidla relativní hodnoty dynamika, postavená ve formě řetězových veličin, jako vztah k předchozí úrovni každé úrovně v sérii dynamiky. Průměr tedy charakterizuje průměrnou míru růstu.

Geometrický průměr se také používá k určení ekvidistantní hodnoty z maximální a minimální hodnoty prvku. Například pojišťovna uzavírá smlouvy o poskytování služeb pojištění automobilů. V závislosti na konkrétní pojistné události se výplata pojištění může pohybovat od 10 000 do 100 000 USD ročně. Průměrná výplata pojištění bude USD.

Geometrický průměr je hodnota použitá jako průměr poměrů nebo v distribučních řadách prezentovaných ve formě geometrické progrese, když z \u003d 0. Tento průměr je vhodné použít, pokud není věnována pozornost absolutním rozdílům, ale poměrům dvou čísel.

Vzorce pro výpočet jsou následující

kde jsou varianty průměrovaného prvku; - výroba opcí; f- četnost možností.

Geometrický průměr se používá při výpočtu průměrné roční míry růstu.

Střední čtverec.Vzorec odmocniny-střední kvadrát se používá k měření stupně variability jednotlivých hodnot prvku kolem aritmetického průměru v distribuční řadě. Při výpočtu variačních indikátorů se tedy průměr počítá ze čtverců odchylek jednotlivých hodnot atributu od aritmetického průměru.

Kořenová mocnina se vypočítá podle vzorce

V ekonomickém výzkumu se při výpočtu indikátorů variace znaku, jako je rozptyl, směrodatná odchylka, široce používá odmocnina v modifikované formě.

Vláda většiny. Mezi průměrem síly je následující vztah - čím větší je exponent, tím větší je hodnota průměru, tabulka 5.4:

Tabulka 5.4

Poměr mezi průměry

Hodnota Z.

Poměr mezi průměry

Tento poměr se nazývá pravidlo majorant.

Strukturální průměry.Pro charakterizaci struktury populace se používají speciální ukazatele, které lze nazvat strukturální průměry. Mezi tyto ukazatele patří móda, medián, kvartily a decily.

Móda. Režim (Mo) je nejběžnější hodnota prvku v jednotkách populace. Móda je hodnota prvku, která odpovídá maximálnímu bodu teoretické distribuční křivky.

Móda je široce používána v komerční praxi při studiu spotřebitelské poptávky (při určování velikosti oděvů a obuvi, která je velmi žádaná), registrace cen. V agregaci může být několik módů.

Výpočet režimu v samostatném řádku. V diskrétní sérii je režim variantou s nejvyšší frekvencí. Zvažte nalezení režimu v diskrétní řadě.

Výpočet režimu v intervalové řadě. V intervalových variačních řadách je režim přibližně považován za centrální verzi modálního intervalu, tj. interval, který má nejvyšší frekvenci (frekvenci). V intervalu je nutné najít hodnotu prvku, kterým je režim. U intervalové řady bude režim určen vzorcem

kde je spodní hranice modálního intervalu; - hodnota modálního intervalu; - frekvence odpovídající modálnímu intervalu; - frekvence předcházející modálnímu intervalu; Je frekvence intervalu následující po modální.

Medián.Medián () je hodnota prvku ve střední jednotce hodnocené řady. Řazená řada je řada, ve které jsou charakteristické hodnoty zapsány vzestupně nebo sestupně. Nebo medián je hodnota, která rozděluje počet uspořádaných variačních řad na dvě stejné části: jedna část má hodnotu proměnného atributu menší než průměrná varianta a druhá - velká.

Pro nalezení mediánu je nejprve určeno jeho pořadové číslo. K tomu je při lichém počtu jednotek jedna přidána k součtu všech frekvencí a vše je vyděleno dvěma. Když je počet jednotek sudý, je medián nalezen jako hodnota atributu jednotky, pořadové číslo, které je určeno celkovým součtem frekvencí děleno dvěma. Známe-li pořadové číslo mediánu, je snadné najít jeho hodnotu z akumulovaných frekvencí.

Výpočet mediánu v diskrétní řadě.Podle výběrového šetření byly získány údaje o rozdělení rodin podle počtu dětí, tab. 5.5. Abychom určili medián, nejprve určíme jeho pořadové číslo

V těchto rodinách je počet dětí 2, tedy \u003d 2. U 50% rodin tedy počet dětí nepřesahuje 2.

–Akumulovaná frekvence předcházející střednímu intervalu;

Na jedné straně je to velmi pozitivní vlastnost, protože v tomto případě je bráno v úvahu působení všech příčin ovlivňujících všechny jednotky studované populace. Na druhou stranu, dokonce i jedno pozorování, které spadalo do počátečních dat náhodou, může významně narušit představu o úrovni vývoje studovaného znaku v uvažované populaci (zejména v krátkých sériích).

Kvartily a decily.Analogicky s nalezením mediánu ve variační sérii můžete najít hodnotu prvku pro jakoukoli jednotku v hodnocené sérii. Konkrétně tedy můžete najít hodnotu prvku v jednotkách dělících sérii na 4 stejné části, na 10 atd.

Kvartily. Varianty, které rozdělují seřazenou sérii na čtyři stejné části, se nazývají kvartily.

Současně rozlišují: dolní (nebo první) kvartil (Q1) - hodnota atributu v jednotce hodnocené řady dělící populaci v poměru ¼ k ¾ a horní (nebo třetí) kvartil (Q3) - hodnota atributu v jednotce hodnocené řady, dělící populaci v poměru ¾ až ¼.

- frekvence kvartilových intervalů (dolní a horní)

Intervaly, které obsahují Q1 a Q3, jsou určeny z akumulovaných frekvencí (nebo jejich částí).

Deciles. Kromě kvartilů se počítají i decily - možnosti dělení hodnocené řady na 10 stejných částí.

Jsou označeny D, první decil D1 rozděluje řádek v poměru 1/10 a 9/10, druhý D2 - 2/10 a 8/10 atd. Počítají se podle stejného schématu jako medián a kvartily.

Medián, kvartily i decily patří do tzv. Ordinálních statistik, které jsou chápány jako varianta, která zaujímá určité místo v pořadí.

Na poslední lekci, která si uvědomila, že toho ví hodně, mohou ti, kteří nerozuměli, zapomněli nebo prošli kolem, použít odkaz a obnovit své znalosti)). V teorii statistiky však existuje další velmi zajímavé rčení. Na světě existují tři typy lží - lži, do očí bijící lži a ... STATISTIKA !!!

Zcela protichůdné tvrzení je jiné - statistiky vědí všechno... Ale částečně na tom je něco pravdy. Je to všechno o datech, která byla shromážděna ke zpracování.

Ale o tom si povíme později ...

Zpět ke statistickým kategoriím. Kategorie nebo základní statistické pojmy jsou důležitou součástí vědy. Jde o to, že tyto pojmy se pravidelně používají v procesu zpracování a analýzy dat. To je místo, kde jsou pro statistickou vědu tak důležité.

Statistická populace - Jedná se o skupinu sociálně-ekonomických objektů nebo fenoménů společenského života, spojených společným spojením, lišících se však v jednotlivých rysech. Toto je nejběžnější definice populace. Zahrnuje jeho funkce a, což je velmi důležité, také další statistické kategorie. Pokusme se příkladem zjednodušit nebo pochopit, co je množina.
Agregát je nějaká kombinace prvků nebo jevů nebo lidí atd. Nejen, že v agregátu je obvykle mnoho částí nebo prvků (vždy více než jedna), ale všechny jsou si trochu podobné. Tato podobnost je tedy znamením, kterým byly tyto prvky spojeny. Prvky mají jednu společnou věc a řada dalších charakteristik se liší.



Zde je malý příklad. Obrázek ukazuje lidi podmíněně. Toto je sbírka lidí - na tomto základě byly sloučeny do sbírky. Všichni jsme však odlišní a máme mnoho charakteristik, které nás navzájem odlišují - pohlaví, věk, vzdělání, rodinný stav, úroveň příjmu, místo bydliště atd.
Obecně lze v souhrnu kombinovat různé prvky, pokud by bylo jen co studovat:
- celkový počet žáků - všeobecné studium ve škole a rozdíly jsou pohlaví, věk, třída, místo studia a mnoho dalšího;
- sada stromů v lese - běžná věc jsou stromy, rozdíly ve věku, druhu stromu, výšce atd .;
- soubor podniků - společný podnik, rozdíly, odvětví, počet zaměstnanců, výkon, zisk atd.
A takových příkladů je obrovské množství.

Úkol. Předpokládejme, že na obrázku je sbírka studentů. Popište to, proč je to agregát, co mají studenti. Jsou na obrázku nějaké další prvky, které do této sady nepatří?

A poslední velmi důležitý termín je variace!
Variace - jedná se o fluktuace atributu statistické populace. Ve statistikách říkají - znaménko kolísá nebo RŮZNÉ.
Variace vlastností je základem statistické vědy. Nebyla by žádná variace, neexistovaly by žádné statistiky. Právě proto, že se znamení mění a je o nich studie. Pokud by nedošlo k žádným změnám a rozdílům a všechno by bylo stejné, pak by nebylo co studovat a neexistovaly by žádné statistiky.

A pak přejdeme k. Ale nejprve domácí úkoly.

Kontrolní úkol. Uveďte příklady dvou nebo tří agregací, vyberte agregační jednotky v nich a charakterizujte je pomocí funkcí. Uveďte příklad statistik a variací zvláštnosti.

Zpráva - Subjekty státní statistiky v Ruské federaci - funkce, úkoly, struktura. - Federální státní statistická služba - http://www.gks.ru/

Vaše dobrá práce ve znalostní bázi je jednoduchá. Použijte formulář níže

Studenti, postgraduální studenti, mladí vědci využívající znalostní základnu při studiu a práci vám budou velmi vděční.

Vloženo na http://www.allbest.ru/

Problém 1

V určitém regionu bylo v letošním roce spácháno 12 390 trestných činů a v předchozím roce bylo spácháno 11 800 trestných činů. Vypočítejte (v%) tempo růstu a tempo růstu počtu trestných činů registrovaných v aktuálním roce ve vztahu k předchozímu. Vypočítejte také míru kriminality pro každý rok, pokud počet obyvatel regionu na konci předchozího roku byl 1 475 000 a na konci aktuálního roku - 1 770 000 lidí. Vyvodit závěry o dynamice kriminality v regionu.

Rozhodnutí: Pro získání přesného obrazu kriminality je velmi důležitý takový ukazatel kriminality, jako je dynamika, tj. Změna v čase. Dynamika kriminality je charakterizována pojmy absolutního růstu (nebo poklesu) a rychlosti růstu a nárůstu kriminality, aby bylo možné určit, které z těchto charakteristik se počítají podle určitých vzorců.

Míry růstu kriminality se počítají na základě základních indikátorů dynamiky, což zahrnuje srovnání dat za řadu let (a někdy i desetiletí, je-li zapotřebí široké pokrytí materiálu) se stálým základem, kterým se rozumí míra kriminality v počátečním období pro analýzu. Tento výpočet umožňuje kriminalistům významně zaručit srovnatelnost relativních ukazatelů počítaných jako procenta, která ukazují, jak souvisí kriminalita následujících období s předchozím.

Při výpočtu se data původního roku berou jako 100%; ukazatele získané v následujících letech odrážejí pouze procento růstu, což činí výpočet přesným a obraz je objektivnější; při práci s relativními údaji je možné vyloučit vliv na snížení nebo zvýšení kriminality zvýšení nebo snížení počtu obyvatel, kteří dosáhli věku trestní odpovědnosti.

Míra kriminality se počítá v procentech. Míra růstu kriminality ukazuje, o kolik se následná kriminalita zvýšila nebo snížila ve srovnání s předchozím obdobím. Je použita konvenční notace pro vektor rychlosti růstu: pokud se procento zvýší, umístí se znaménko plus, pokud se sníží, umístí se znaménko minus.

Ve vztahu k podmínkám našeho problému bychom měli použít příslušné vzorce a vypočítat růst a nárůst kriminality.

1) Míra růstu kriminality se vypočítá podle vzorce ^

Tr \u003d U / U2 * 100%,

kde U je ukazatelem úrovně kriminality a U2 je ukazatelem úrovně kriminality z předchozího období. Míra růstu kriminality za podmínek problému tedy bude - 12390/11800 * 100% \u003d 1,05%.

2) Míra nárůstu kriminality se počítá podle následujícího vzorce:

Tpr \u003d Tr - 100%.

Tempo růstu za podmínek problému bude tedy 1,05% - 100% \u003d 98,95%.

Míra kriminality je konkrétním zobecněným ukazatelem celkového počtu zaznamenaných trestných činů v korelaci s populací. Znamená počet trestných činů na 100 tisíc, 10 tisíc nebo 1 tisíc lidí a je objektivním měřítkem kriminality, což vám umožňuje porovnat její úrovně v různých regionech a v různých letech.

Míra kriminality pomáhá adekvátněji posoudit dynamiku kriminality, počítané na obyvatele.

Míra kriminality se počítá podle vzorce:

KP \u003d (P x 100000): N,

kde P je absolutní počet zaznamenaných trestných činů; a H \u200b\u200bje absolutní velikost celé populace.

Oba ukazatele se berou ve stejném územním a časovém objemu. Počet trestných činů se obvykle počítá na 100 tisíc lidí. Ale s malým počtem trestných činů a počtem obyvatel (ve městě, okrese, v podniku) lze míru kriminality vypočítat na 10 tisíc nebo na 1 000 obyvatel. v každém případě tato čísla znamenají rozměr uvažovaného koeficientu, který musí být uveden: počet trestných činů na 100 tisíc nebo 10 tisíc obyvatel.

Vypočítáme míru kriminality ve vztahu k podmínkám našeho problému:

1) CP \u003d (12390 * 100000): 1 770 000 lidí. \u003d 700 (v běžném roce).

2) KP \u003d (11800 * 100000): 1 475 000 \u003d 800 (v předchozím roce).

Kriminalita v regionu klesá, protože při analýze kriminality lze konstatovat, že s nárůstem počtu obyvatel v regionu (o 16,6%) a mírným nárůstem počtu trestných činů o 1,05%, obecně klesá kriminalita (-98,95 %).

Problém 2

Věk 11 mladých specialistů instituce přijatých do služby v tomto roce byl 19,25,21,23,23,23,25,20,18,20,21 let. Shrňte a seskupte data do statistické tabulky frekvencí. Pro přehlednost vytvořte polygon frekvence a najděte také modální, střední a průměrný věk najatých zaměstnanců.

Rozhodnutí: Seskupení - Jedná se o rozdělení populace do skupin, které jsou nějakým způsobem homogenní. Z pohledu jednotlivých jednotek populace je seskupení spojením jednotlivých jednotek populace do skupin, které jsou nějakým způsobem homogenní.

Metoda seskupování je založena na následujících kategoriích - atribut seskupení, interval seskupení a počet skupin.

Atribut seskupení - Toto je znamení, kterým se jednotlivé jednotky populace spojují do homogenních skupin.

Interval vymezuje kvantitativní hranice skupin. Zpravidla představuje interval mezi maximální a minimální hodnotou charakteristiky ve skupině.

Určení počtu skupin.

Počet skupin je přibližně určen Sturgessovým vzorcem:

n \u003d 1 + 3,2log n \u003d 1 + 3,2log (11) \u003d 4.

Šířka intervalu bude:

Xmax - maximální hodnota seskupovacího atributu v agregaci. Xmin je minimální hodnota atributu seskupení. Pojďme definovat hranice skupiny.

Číslo skupiny

Sečteno a podtrženo

Horní hranice

Stejná hodnota prvku slouží jako horní a dolní hranice dvě sousední (předchozí a další) skupiny.

Pro každou hodnotu řady vypočítáme, kolikrát spadá do jednoho nebo jiného intervalu. Za tímto účelem řadíme řádek ve vzestupném pořadí.

Počet obyvatel

Frekvence Fi

Frekvenční polygon je graf hustoty a pravděpodobnosti náhodné proměnné; je to přerušovaná čára spojující body odpovídající středním hodnotám skupinových intervalů a frekvencím těchto intervalů.

Znamenat:

Módalněná hodnota. Móda je nejběžnějším významem prvku v jednotkách dané populace.

kde x 0 - začátek modálního intervalu; h je velikost intervalu; f 2 - frekvence odpovídající modálnímu intervalu; f 1 - premodální frekvence; f 3 - postmodální frekvence.

Jako začátek intervalu zvolíme 19,75, protože tento interval obsahuje největší číslo.

Nejběžnější hodnota řádku je 20,92.

Medián... Medián rozděluje vzorek na dvě části: polovina možnosti je menší než medián, polovina je více.

V intervalové řadě rozdělení můžete okamžitě určit pouze interval, ve kterém bude režim nebo medián umístěn. Medián odpovídá variantě uprostřed seřazeného řádku. Medián intervalu je od 19,75 do 21,5 v tomto intervalu je akumulovaná frekvence S větší než střední číslo (medián je první interval, jehož akumulovaná frekvence S přesahuje polovinu celkového součtu frekvence).

50% populačních jednotek tedy bude méně než 21,28.

Problém 3

Určete požadovanou velikost vzorku pro studium průměrného věku certifikovaných zaměstnanců Federální vězeňské služby Ruska za předpokladu, že standardní odchylka je 10 let a maximální přípustná chyba ve výběru by neměla překročit 5%.

Hledáme řešení podle vzorce pro určení velikosti vzorku pro opakovaný výběr.

Ф (t) \u003d g / 2 \u003d 0,95 / 2 \u003d 0,475 a tato hodnota podle Laplaceovy tabulky odpovídá t \u003d 1,96.

Odhad směrodatné odchylky s \u003d 10; chyba vzorkování e \u003d 5.

Problém 4

Následující tabulka poskytuje oficiální resortní statistiky o distribuci odsouzených podle trestu odnětí svobody (trestu) za období 2002–2011, zveřejněné na oficiálních stránkách Federální vězeňské služby Ruska: www.fsin.su. Najděte rozsah a variační koeficient počtu odsouzených pro každý kalendářní rok a vyvodte závěry o homogenitě struktury tohoto statistického prvku.

Hlavním ukazatelem homogenity dat je variační koeficient. Ve statistikách se obecně uznává, že pokud je hodnota koeficientu menší než 33%, pak je soubor dat homogenní, pokud je vyšší než 33%, pak je heterogenní.

Variační koeficient

Od v? 30%, pak je populace homogenní a rozdíly jsou slabé. Získaným výsledkům lze důvěřovat.

Termín trestu

1-3 roky staré

3-5 let

5 až 10 let

10 až 15 let

Více než 15 let

Maximální hodnota (funkce MAX)

Minimální hodnota (funkce MIN)

Varianta přejetím prstem

Průměrná hodnota (funkce PRŮMĚR)

Směrodatná odchylka (funkce STANDARD LONA)

Variační koeficient

Jednoduchý průměr:

Módahodnota

Medián

Našli jsme střed seřazené řady: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Toto číslo odpovídá hodnotě řady 70580. Proto je medián Me \u003d 70580.

Variační indikátory. .

R \u003d X max - X min.

R \u003d 295916-2250 \u003d 293666.

Průměrná lineární odchylka

Každá hodnota řady se liší od ostatních v průměru o 90895,71.

Rozptyl

(průměrná chyba vzorkování).

Každá hodnota řady se liší od průměrné hodnoty 103008 v průměru o 107169,83.

Variační koeficient - míra relativního rozpětí hodnot populace: ukazuje, kolik z průměru této hodnoty je její průměrné rozpětí.

Protože v\u003e

nebo

Oscilační koeficient

Jednoduchý průměr:

Móda

Neexistuje žádná móda (všechny hodnoty série jsou individuální).

Medián... Medián je hodnota prvku, který rozděluje jednotky hodnocené série na dvě části. Medián odpovídá variantě uprostřed seřazeného řádku.

Našli jsme střed seřazené řady: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Toto číslo odpovídá hodnotě řady 76186. Proto je medián Me \u003d 76186.

Variační indikátory. Absolutní ukazatele variace.

Variační rozsah je rozdíl mezi maximální a minimální hodnotou funkce primární řady.

R \u003d X max - X min

R \u003d 291112-3101 \u003d 288011.

Průměrná lineární odchylka - vypočteno za účelem zohlednění rozdílů všech jednotek studované populace.

Každá hodnota řady se liší od ostatních v průměru o 83422,69.

Rozptyl - charakterizuje míru disperze kolem jejího průměru (míra disperze, tj. odchylka od průměru).

Standardní odchylka (střední chyba vzorkování).

Každá hodnota řady se liší od průměrné hodnoty 97334,29 v průměru o 100 750,25.

Relativní variační rychlosti... Mezi relativní variační ukazatele patří: oscilační koeficient, lineární koeficient variace, relativní lineární odchylka.

Variační koeficient - míra relativního rozpětí hodnot populace: ukazuje, kolik z průměru této hodnoty je její průměrné rozpětí.

Vzhledem k tomu, že v\u003e 70% se populace blíží hranici nehomogenity, a její rozdíly jsou silné.

V tomto případě vedou v praktickém výzkumu různé statistické metody souhrn k homogenní formě.

Lineární variační koeficient nebo Relativní lineární odchylka - charakterizuje podíl průměrné hodnoty znaménka absolutních odchylek od průměrné hodnoty.

Oscilační koeficient - odráží relativní variabilitu extrémních hodnot prvku kolem průměru.

Jednoduchý průměr:

Módalněná hodnota. Móda je nejběžnějším významem prvku v jednotkách dané populace.

Neexistuje žádná móda (všechny hodnoty série jsou individuální).

Medián... Medián je hodnota prvku, který rozděluje jednotky hodnocené série na dvě části. Medián odpovídá variantě uprostřed seřazeného řádku.

Našli jsme střed seřazené řady: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Toto číslo odpovídá hodnotě řady 71093. Proto je medián Me \u003d 71093.

Variační indikátory. Absolutní ukazatele variace.

Variační rozsah je rozdíl mezi maximální a minimální hodnotou funkce primární řady.

R \u003d X max - X min

R \u003d 243852-3856 \u003d 239996.

Průměrná lineární odchylka - vypočteno za účelem zohlednění rozdílů všech jednotek studované populace.

Každá hodnota řady se liší od ostatních v průměru o 68998,08.

Rozptyl - charakterizuje míru disperze kolem jejího průměru (míra disperze, tj. odchylka od průměru).

Standardní odchylka (střední chyba vzorkování).

Každá hodnota řady se liší od průměrné hodnoty 85765,57 v průměru o 82541,55.

Relativní variační rychlosti... Relativní variační ukazatele zahrnují: koeficient oscilace, lineární variační koeficient, relativní lineární odchylku.

Variační koeficient - míra relativního rozpětí hodnot populace: ukazuje, kolik z průměru této hodnoty je její průměrné rozpětí.

Vzhledem k tomu, že v\u003e 70% se populace blíží hranici nehomogenity, a její rozdíly jsou silné.

Variační koeficient je výrazně vyšší než 33%. V důsledku toho je uvažovaná množina heterogenní a průměr pro ni není dostatečně typický. V tomto případě vedou v praktickém výzkumu různé statistické metody souhrn k homogenní formě.

Lineární variační koeficient nebo Relativní lineární odchylka - charakterizuje podíl průměrné hodnoty znaménka absolutních odchylek od průměrné hodnoty.

Oscilační koeficient - odráží relativní variabilitu extrémních hodnot prvku kolem průměru.

:

Móda... Móda je nejběžnějším významem prvku v jednotkách dané populace.

Neexistuje žádná móda (všechny hodnoty série jsou individuální).

Medián... Medián je hodnota prvku, který rozděluje jednotky hodnocené série na dvě části. Medián odpovídá variantě uprostřed seřazeného řádku.

Našli jsme střed seřazené řady: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Toto číslo odpovídá hodnotě řady 74588. Medián Me \u003d 74588.

Variační indikátory. Absolutní ukazatele variace.

Variační rozsah je rozdíl mezi maximální a minimální hodnotou funkce primární řady.

R \u003d X max - X min,

R \u003d 242984-5304 \u003d 237680.

Průměrná lineární odchylka - vypočteno za účelem zohlednění rozdílů všech jednotek studované populace.

Každá hodnota řady se liší od ostatních v průměru o 73148,73.

Rozptyl - charakterizuje míru disperze kolem jejího průměru (míra disperze, tj. odchylka od průměru).

Standardní odchylka (střední chyba vzorkování).

Každá hodnota řady se liší od průměrné hodnoty 92104,14 v průměru o 82873,1.

Relativní variační rychlosti... Relativní variační ukazatele zahrnují: koeficient oscilace, lineární variační koeficient, relativní lineární odchylku.

Variační koeficient - míra relativního rozpětí hodnot populace: ukazuje, kolik z průměru této hodnoty je její průměrné rozpětí.

Vzhledem k tomu, že v\u003e 70% se populace blíží hranici nehomogenity, a její rozdíly jsou silné.

Variační koeficient je výrazně vyšší než 33%. V důsledku toho je uvažovaná množina heterogenní a průměr pro ni není dostatečně typický. V tomto případě vedou v praktickém výzkumu různé statistické metody souhrn k homogenní formě.

Lineární variační koeficient nebo Relativní lineární odchylka - charakterizuje podíl průměrné hodnoty znaménka absolutních odchylek od průměrné hodnoty.

Oscilační koeficient - odráží relativní variabilitu extrémních hodnot prvku kolem průměru.

Jednoduchý aritmetický průměr:

Móda... Móda je nejběžnějším významem prvku v jednotkách dané populace.

Neexistuje žádná móda (všechny hodnoty série jsou individuální).

Medián... Medián je hodnota prvku, který rozděluje jednotky hodnocené série na dvě části. Medián odpovídá variantě uprostřed seřazeného řádku.

Našli jsme střed seřazené řady: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Toto číslo odpovídá hodnotě řady 76678. Medián Me \u003d 76678

Variační indikátory. Absolutní ukazatele variace.

Variační rozsah je rozdíl mezi maximální a minimální hodnotou funkce primární řady.

R \u003d X max - X min.

R \u003d 249346-6536 \u003d 242810.

Průměrná lineární odchylka - vypočteno za účelem zohlednění rozdílů všech jednotek studované populace.

Každá hodnota řady se liší od ostatních v průměru o 79680,53.

Rozptyl - charakterizuje míru disperze kolem jejího průměru (míra disperze, tj. odchylka od průměru).

Standardní odchylka (střední chyba vzorkování).

Každá hodnota řady se liší od průměrné hodnoty 99551,71 v průměru o 87389,04.

Relativní variační rychlosti... Relativní variační ukazatele zahrnují: koeficient oscilace, lineární variační koeficient, relativní lineární odchylku.

Variační koeficient - míra relativního rozpětí hodnot populace: ukazuje, kolik z průměru této hodnoty je její průměrné rozpětí.

Vzhledem k tomu, že v\u003e 70% se populace blíží hranici nehomogenity, a její rozdíly jsou silné.

Variační koeficient je výrazně vyšší než 33%. V důsledku toho je uvažovaná množina heterogenní a průměr pro ni není dostatečně typický. V tomto případě vedou v praktickém výzkumu různé statistické metody souhrn k homogenní formě.

Lineární variační koeficient nebo Relativní lineární odchylka - charakterizuje podíl průměrné hodnoty znaménka absolutních odchylek od průměrné hodnoty.

Oscilační koeficient - odráží relativní variabilitu extrémních hodnot prvku kolem průměru.

Jednoduchý aritmetický průměr:

Móda... Móda je nejběžnějším významem prvku v jednotkách dané populace.

Neexistuje žádná móda (všechny hodnoty série jsou individuální).

Medián... Medián je hodnota prvku, který rozděluje jednotky hodnocené série na dvě části. Medián odpovídá variantě uprostřed seřazeného řádku.

Našli jsme střed seřazené řady: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Toto číslo odpovídá hodnotě řady 76461. Proto je medián Me \u003d 76461.

Variační indikátory. Absolutní ukazatele variace.

Variační rozsah je rozdíl mezi maximální a minimální hodnotou funkce primární řady.

R \u003d X max - X min.

R \u003d 254722-6704 \u003d 248018.

Průměrná lineární odchylka - vypočteno za účelem zohlednění rozdílů všech jednotek studované populace.

Každá hodnota řady se liší od ostatních v průměru o 82 302,82.

Rozptyl - charakterizuje míru disperze kolem jejího průměru (míra disperze, tj. odchylka od průměru).

Standardní odchylka (střední chyba vzorkování).

Každá hodnota řady se liší od průměrné hodnoty 102346,71 v průměru o 89787,88.

Relativní variační rychlosti... Relativní variační ukazatele zahrnují: koeficient oscilace, lineární variační koeficient, relativní lineární odchylku.

Variační koeficient - míra relativního rozpětí hodnot populace: ukazuje, kolik z průměru této hodnoty je její průměrné rozpětí.

Vzhledem k tomu, že v\u003e 70% se populace blíží hranici nehomogenity, a její rozdíly jsou silné.

Variační koeficient je výrazně vyšší než 33%. V důsledku toho je uvažovaná množina heterogenní a průměr pro ni není dostatečně typický. V tomto případě vedou v praktickém výzkumu různé statistické metody souhrn k homogenní formě.

Lineární variační koeficient nebo Relativní lineární odchylka - charakterizuje podíl průměrné hodnoty znaménka absolutních odchylek od průměrné hodnoty.

Oscilační koeficient - odráží relativní variabilitu extrémních hodnot prvku kolem průměru.

Jednoduchý aritmetický průměr:

Móda... Móda je nejběžnějším významem prvku v jednotkách dané populace.

Neexistuje žádná móda (všechny hodnoty série jsou individuální).

Medián... Medián je hodnota prvku, který rozděluje jednotky hodnocené série na dvě části. Medián odpovídá variantě uprostřed seřazeného řádku.

Našli jsme střed seřazené řady: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Toto číslo odpovídá hodnotě řady 78959. Proto je medián Me \u003d 78959.

Variační indikátory. Absolutní ukazatele variace.

Variační rozsah je rozdíl mezi maximální a minimální hodnotou funkce primární řady.

R \u003d X max - X min.

R \u003d 261334-7635 \u003d 253699.

Průměrná lineární odchylka - vypočteno za účelem zohlednění rozdílů všech jednotek studované populace.

Každá hodnota řady se liší od ostatních v průměru o 83791,55.

Rozptyl - charakterizuje míru disperze kolem jejího průměru (míra disperze, tj. odchylka od průměru).

Standardní odchylka (střední chyba vzorkování).

Každá hodnota řady se liší od průměrných 104898,86 v průměru o 91616,15.

Relativní variační rychlosti... Relativní variační ukazatele zahrnují: koeficient oscilace, lineární variační koeficient, relativní lineární odchylku.

Variační koeficient - míra relativního rozpětí hodnot populace: ukazuje, kolik z průměru této hodnoty je její průměrné rozpětí.

Vzhledem k tomu, že v\u003e 70% se populace blíží hranici nehomogenity, a její rozdíly jsou silné.

Variační koeficient je výrazně vyšší než 33%. V důsledku toho je uvažovaná množina heterogenní a průměr pro ni není dostatečně typický. V tomto případě vedou v praktickém výzkumu různé statistické metody souhrn k homogenní formě.

Lineární variační koeficient nebo Relativní lineární odchylka - charakterizuje podíl průměrné hodnoty znaménka absolutních odchylek od průměrné hodnoty.

Oscilační koeficient - odráží relativní variabilitu extrémních hodnot prvku kolem průměru.

Jednoduchý aritmetický průměr:

Móda... Móda je nejběžnějším významem prvku v jednotkách dané populace.

Neexistuje žádná móda (všechny hodnoty série jsou individuální).

Medián... Medián je hodnota prvku, který rozděluje jednotky hodnocené série na dvě části. Medián odpovídá variantě uprostřed seřazeného řádku.

Našli jsme střed seřazené řady: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Toto číslo odpovídá hodnotě řady 75916. Proto je medián Me \u003d 75916.

Variační indikátory. Absolutní ukazatele variace.

Variační rozsah je rozdíl mezi maximální a minimální hodnotou funkce primární řady.

R \u003d X max - X min.

R \u003d 263863-8145 \u003d 255718.

Průměrná lineární odchylka - vypočteno za účelem zohlednění rozdílů všech jednotek studované populace.

Každá hodnota řady se liší od ostatních v průměru o 82767,96.

Rozptyl - charakterizuje míru disperze kolem jejího průměru (míra disperze, tj. odchylka od průměru).

Standardní odchylka (střední chyba vzorkování).

Každá hodnota řady se liší od průměrné hodnoty 103440,71 v průměru o 91207,92.

Relativní variační rychlosti... Relativní variační ukazatele zahrnují: koeficient oscilace, lineární variační koeficient, relativní lineární odchylku.

Variační koeficient - míra relativního rozpětí hodnot populace: ukazuje, kolik z průměru této hodnoty je její průměrné rozpětí.

Vzhledem k tomu, že v\u003e 70% se populace blíží hranici nehomogenity, a její rozdíly jsou silné.

Variační koeficient je výrazně vyšší než 33%. V důsledku toho je uvažovaná množina heterogenní a průměr pro ni není dostatečně typický. V tomto případě vedou v praktickém výzkumu různé statistické metody souhrn k homogenní formě.

Lineární variační koeficient nebo Relativní lineární odchylka - charakterizuje podíl průměrné hodnoty znaménka absolutních odchylek od průměrné hodnoty.

Oscilační koeficient - odráží relativní variabilitu extrémních hodnot prvku kolem průměru.

Jednoduchý aritmetický průměr:

Móda... Móda je nejběžnějším významem prvku v jednotkách dané populace.

Neexistuje žádná móda (všechny hodnoty série jsou individuální).

Medián... Medián je hodnota prvku, který rozděluje jednotky hodnocené série na dvě části. Medián odpovídá variantě uprostřed seřazeného řádku.

Našli jsme střed seřazené řady: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Toto číslo odpovídá hodnotě řady 78019. Proto je medián Me \u003d 78019.

Variační indikátory. Absolutní ukazatele variace.

Variační rozsah je rozdíl mezi maximální a minimální hodnotou funkce primární řady.

R \u003d X max - X min

R \u003d 260094-7798 \u003d 252296.

Průměrná lineární odchylka - vypočteno za účelem zohlednění rozdílů všech jednotek studované populace.

Každá hodnota řady se liší od ostatních v průměru o 77827,76.

Rozptyl - charakterizuje míru disperze kolem jejího průměru (míra disperze, tj. odchylka od průměru).

Standardní odchylka (střední chyba vzorkování).

Každá hodnota řady se liší od průměrné hodnoty 99212,29 v průměru o 88081,39.

Relativní variační rychlosti... Relativní variační ukazatele zahrnují: koeficient oscilace, lineární variační koeficient, relativní lineární odchylku.

Variační koeficient - míra relativního rozpětí hodnot populace: ukazuje, kolik z průměru této hodnoty je její průměrné rozpětí.

Vzhledem k tomu, že v\u003e 70% se populace blíží hranici nehomogenity, a její rozdíly jsou silné.

Variační koeficient je výrazně vyšší než 33%. V důsledku toho je uvažovaná množina heterogenní a průměr pro ni není dostatečně typický. V tomto případě vedou v praktickém výzkumu různé statistické metody souhrn k homogenní formě.

Lineární variační koeficient nebo Relativní lineární odchylka - charakterizuje podíl průměrné hodnoty znaménka absolutních odchylek od průměrné hodnoty.

Oscilační koeficient - odráží relativní variabilitu extrémních hodnot prvku kolem průměru.

Jednoduchý aritmetický průměr:

Móda... Móda je nejběžnějším významem prvku v jednotkách dané populace.

Neexistuje žádná móda (všechny hodnoty série jsou individuální).

Medián... Medián je hodnota prvku, který rozděluje jednotky hodnocené série na dvě části. Medián odpovídá variantě uprostřed seřazeného řádku.

Našli jsme střed seřazené řady: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Toto číslo odpovídá hodnotě řady 72248. Medián Me \u003d 72248.

Variační indikátory. Absolutní ukazatele variace.

Variační rozsah je rozdíl mezi maximální a minimální hodnotou funkce primární řady.

R \u003d X max - X min.

R \u003d 242137-7173 \u003d 234964.

Průměrná lineární odchylka - vypočteno za účelem zohlednění rozdílů všech jednotek studované populace.

Každá hodnota řady se liší od ostatních v průměru o 70459,02.

Rozptyl - charakterizuje míru disperze kolem jejího průměru (míra disperze, tj. odchylka od průměru).

Standardní odchylka (střední chyba vzorkování).

Každá hodnota řady se liší od průměrné hodnoty 91375,14 v průměru o 80674,43.

Relativní variační rychlosti... Relativní variační ukazatele zahrnují: koeficient oscilace, lineární variační koeficient, relativní lineární odchylku.

Variační koeficient - míra relativního rozpětí hodnot populace: ukazuje, kolik z průměru této hodnoty je její průměrné rozpětí.

Vzhledem k tomu, že v\u003e 70% se populace blíží hranici nehomogenity, a její rozdíly jsou silné.

Variační koeficient je výrazně vyšší než 33%. V důsledku toho je uvažovaná množina heterogenní a průměr pro ni není dostatečně typický. V tomto případě vedou v praktickém výzkumu různé statistické metody souhrn k homogenní formě.

Lineární variační koeficient nebo Relativní lineární odchylka - charakterizuje podíl průměrné hodnoty znaménka absolutních odchylek od průměrné hodnoty.

Oscilační koeficient - odráží relativní variabilitu extrémních hodnot prvku kolem průměru.

Problém 5

Za podmínek předchozího úkolu proveďte přeskupení stanovených intervalů podmínek trestu, aby se zlepšily relativní ukazatele variace znaku v roce 2010. Sestavte histogramy rozdělení odsouzených podle trestů odnětí svobody (trest) pro rok 2010 před a po seskupení údajů a vyvodte závěry o homogenitě struktury studovaného statistického prvku.

Rozhodnutí:

Protože v\u003e 30%, ale v<70 %, то вариация умеренная.

Variační koeficient je výrazně vyšší než 33%. V důsledku toho je uvažovaná množina heterogenní a průměr pro ni není dostatečně typický.

Uspořádejte data následujícím způsobem:

Skupina 1) zahrnuje skupiny: až rok, rok, od 1-3 let, respektive 156978.

Skupina 2) vstupuje ze skupiny na 3 až 5 let úplně a 1/5 ze skupiny na 5 až 10 let dostáváme 1/5 * 260094 + 168651 \u003d 220669,8.

Skupina 3) zahrnuje 3 \\ 5 skupin od 5 do 10, tj. 3 \\ 5 * 260094 \u003d 156056,4.

Skupina 4) (1/5 * 260094) + (1/5 * 78019) \u003d 67622,6.

Skupina 5) 3 \\ 5 * 78019 \u003d 46811,4.

Skupina 6 30744+ (1 \\ 5 * 78019) \u003d 46347,8.

Sloupcový graf. Pro získání závěru o homogenitě vyšetřovaného statistického znaku vypočítáme variační koeficient:

Protože v\u003e 30%, ale v<70 %, то вариация умеренная.

Variační koeficient je výrazně vyšší než 33%. V důsledku toho je uvažovaná množina heterogenní a průměr pro ni není dostatečně typický.

Problém 6

Stručně představit (diplomová práce, na 1–2 stranách) obsah a výsledky nedávné oficiální statistické studie v sociální a právní sféře (jsou požadována témata - dle vašeho výběru, odkazy na internetové zdroje), vyvodit závěry a předložit vhodné krátkodobé statistické hypotézy perspektivní.

Studie o nedoplatcích mezd k 1. prosinci 2015 byla brána jako oficiální statistická studie.

K 1. prosinci 2015 podle organizací (nesouvisejících s malými podniky) celkový dluh z hlediska mezd v rozsahu sledovaných druhů ekonomické činnosti činil 3900 milion rublůa ve srovnání s 1. listopadem 2015 vzrostl o 395 milionů rublů (11,3%).

Nedoplatky mezd po splatnosti z důvodu nedostatku vlastních zdrojů organizací od 1. prosince 2015 vymyšlený 3818 milion rublů, nebo 97,9% z celkové výše dluhu po splatnosti. Oproti 1. listopadu 2015 zvýšil se o 389 milionů rublů (11,3%). Dluh z důvodu pozdního příjmu finančních prostředků z rozpočtů všech úrovní vymyšlený 82 milion rublů a vzrostl ve srovnání s 1. listopadem 2015. 6 milionů rublů (7,7%), včetně dluhu z federální rozpočetčinil 62 milionů rublů a ve srovnání s 1. listopadem 2015 se snížil. o 6 milionů rublů (o 8,6%), rozpočty jednotlivých subjektů Ruské federacečinil 1,1 mil. rublů (nárůst o 0,2 mil. rublů nebo 20,7%), místní rozpočty - 19 milionů rublů (nárůst o 12 milionů rublů, tedy 2,5krát).

V hornictví, zpracovatelském průmyslu, zdravotnictví a sociálních službách, rybářství a chovu ryb je 100% nedoplatků mezd po splatnosti způsobeno nedostatkem finančních prostředků od organizací.

Z celkového objemu nedoplatků mezd po splatnosti 37% připadá na zpracovatelský průmysl, 29% - na stavebnictví, 9% - na výrobu a rozvod elektřiny, plynu a vody, 7% - na dopravu, 6% - na těžbu, 5% - zemědělství, lov a poskytování služeb v těchto oblastech, těžba dřeva.

Objem nedoplatků na mzdě k 1. 12. 2015 činil méně než 1% z měsíčního mzdového fondu zaměstnanců sledovaných druhů ekonomické činnosti

Nedoplatky mezd za poslední měsíc, u nichž došlo k časovému rozlišení, činil celkový objem dluhu po splatnosti v průměru 29%: výroba a rozvod elektřiny, plynu a vody - 75%, činnosti v oblasti vzdělávání - 37%, zdravotnictví a sociální služby - 35%, výzkum a vývoj - 32%, stavebnictví - 29%, doprava - 23%, zpracovatelský sektor - 22%.

Z celkové výše nevyplacených mezd představovaly dluhy vytvořené v roce 2014 457 milionů rublů (11,7%). a dříve - 657 milionů rublů (16,8%).

Obecně lze při sledování obrazu mzdových nedoplatků v dynamice (http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image 5258.gif) dojít k závěru, že v lednu dojde k výraznému poklesu , Únor 2016.

Hlavní procento zadluženosti klesá ve zpracovatelském průmyslu - 37%, 29% - ve stavebnictví, pravděpodobně je to způsobeno poklesem spotřebitelské poptávky po výrobcích, respektive poklesem zisku.

Předložme hypotézu. Od ledna 2016 se procento nedoplatků sníží v důsledku rozdělení ročního rozpočtu na příští rok s přihlédnutím k částečnému splacení nedoplatků na mzdě a bude činit 2 700 milionů.

Chcete-li otestovat hypotézu (tuto tabulku bereme jako základ http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image5258.gif).

Vytvořme diskrétní variační řadu. Za tímto účelem seřaďte řádek ve vzestupném pořadí a spočítejte počet opakování pro každý prvek řádku.

Vypočítáme průměr:

Pojďme vypočítat rozptyl. Disperze - charakterizuje míru disperze kolem jejího průměru (míra disperze, tj. Odchylka od průměru).

Pomocí jednostranného testu s b \u003d 0,05 otestujte tuto hypotézu, pokud ve vzorku n \u003d 24 měsíců byl průměr 2741,25 a odchylka je známá a rovná se y \u003d 193469,27

Rozhodnutí... Standardní odchylka:

Předkládá se nulová hypotéza H 0, že hodnota matematického očekávání obecné populace se rovná číslu m 0: \u003d 2700.

Alternativní hypotéza:

H 1: m? 2700 je kritická oblast dvoustranná.

K otestování nulové hypotézy se používá náhodná proměnná:

kde x je průměr vzorku; S je směrodatná odchylka obecné populace.

Pokud je nulová hypotéza pravdivá, pak má náhodná proměnná T standardní normální rozdělení. Kritická hodnota statistiky T je určena na základě typu alternativní hypotézy:

P (| T |

Najděte experimentální hodnotu statistiky T:

Protože velikost vzorku je dostatečně velká (n\u003e 30), můžete místo skutečné hodnoty směrodatné odchylky použít její odhad S \u003d 439,851.

Ф (t cr) \u003d (1-b) / 2 \u003d (1-0,05) / 2 \u003d 0,475.

Pomocí tabulky Laplaceovy funkce zjistíme, při které t kp je hodnota Ф (t kp) \u003d 0,475.

Experimentální hodnota kritéria T nespadala do kritické oblasti T? t kp, proto by měla být přijata nulová hypotéza. Hodnotu matematického očekávání obecné populace lze rovnat 2700

Bibliografie

1. Kazantsev S.Ya. Právní statistiky: Textbook / Ed. S.Ya. Kazantsev, S. Ya. Lebedeva - M.: UNITY-DANA: Law and Law, 2009

2. Kurys? V K.N. Základy právní statistiky: učebnice. příspěvek / K.N. Kurys? V; VYUI FSIN Ruska. - Vladimir, 2005 .-- 44 s.

3. Makarova N.V. Statistiky v Excelu: učebnice. příspěvek / N.V. Makarova, V. Ya. Trofimety. - M.: Finance a statistiky.

4. Kondratyuk L. V., Ovchinsky V. S. Kriminologická dimenze / vyd. K.K. Goryainova. - M.: Norma, 2008.

5. Jakovlev VB Statistika. Výpočty v aplikaci Microsoft Excel: učebnice. Manuál pro univerzity / V.B. Jakovlev. - M.: Koloss, 2005 .-- 352 s.

Zveřejněno na Allbest.ru

...

Podobné dokumenty

    Studium kriminality mladistvých z hlediska předmětu kriminologického výzkumu. Vztah adolescentního alkoholismu, zneužívání návykových látek, drogové závislosti a kriminality. Příčiny a podmínky a způsoby prevence kriminality mladistvých.

    semestrální práce přidaná 4. 8. 2011

    Metodika konkrétního kriminologického výzkumu. Kriminologická charakteristika násilné trestné činnosti a její prevence. Veřejné nebezpečí a závažnost následků násilných trestných činů. Statistiky kriminality.

    test, přidáno 01/15/2011

    Vzorec pro výpočet kriminality. Výpočet průměrné roční zátěže na soudce, průměrné délky vyšetřování trestních věcí, průměrné roční kriminality. Výpočet indikátorů režimu, medián, variace a směrodatná odchylka.

    test, přidáno 20/20/2011

    Studium základů sobeckého zločinu: pojem, prvky, předměty a subjektivní aspekty. Popis prevence sociální a speciálně kriminologické kriminality z žoldáckých motivů. Vypracování souboru opatření k předcházení trestné činnosti.

    práce, přidáno 11/09/2012

    Pojem a předmět kriminologické prognózy. Stanovení možných změn stavu, úrovně, struktury a dynamiky kriminality v budoucnosti. Hodnocení vývoje kriminality v budoucnosti. Plánování boje proti kriminalitě, její prevence.

    semestrální práce, přidáno 29. 5. 2015

    Studium typů kriminologických prognóz a návrhů v oblasti kriminality. Vlastnosti predikce kriminality mladistvých v Kazašské republice. Rozvoj programů boje proti trestné činnosti na národní úrovni.

    diplomová práce, přidáno 25. 10. 2015

    Kriminalita mladistvých jako předmět kriminologického výzkumu. Základní kriminologické charakteristiky kriminality mladistvých. Stav zločinu. Vlastnosti osobních charakteristik nezletilých.

    abstrakt, přidáno 4. 1. 2003

    Trendy v kriminálním chování moderních žen: růst a stálý podíl závažných a opakujících se trestných činů, omlazení zločinců a nárůst počtu starších žen mezi odsouzenými. Obecná opatření pro předcházení trestné činnosti žen.

    abstrakt, přidáno 03/01/2014

    Výpočet relativních ukazatelů struktury a koordinace kategorií odsouzených podle závažnosti spáchaných trestných činů. Koeficienty trestné činnosti a odsouzení podle federálních okresů a v Rusku jako celku. Výpočet indikátorů dynamiky pomocí MS Excel.

    test, přidáno 31. 7. 2011

    Pojem, typy, významy, determinanty latentní kriminality, příčiny jejího vzniku, prevence a metody redukce. Stanovení úrovně a analýza struktury kriminality. Systematický přístup ke studiu latentní kriminality jako sociálního jevu.


1. Průměrné hodnoty: podstata, hodnota, typy

Důležitým příspěvkem k zdůvodnění a rozvoji teorie průměrných hodnot byl významný vědec 19. století Adolphe Quetelet (1796-1874), člen Belgické akademie věd, odpovídající člen Petrohradské akademie věd.

průměrná hodnota - zobecňující charakteristiky studovaného znaku ve studované populaci. Určuje jeho typickou hladinu na jednotku populace ve specifických podmínkách místa a času.

průměrná hodnota vždy pojmenovaný, má stejnou dimenzi (jednotku měření) jako atribut pro jednotlivé jednotky populace.

Hlavní podmínka pro vědecké použití průměru je kvalitativní homogenita populace, pro kterou se průměr počítá.

    mocninový zákon (aritmetický průměr, harmonický průměr, geometrický průměr, střední čtverec, kubický průměr);

    strukturální (móda, medián).

Průměrný výkon - kořen stupně k z průměru všech použitých možností k-Tý stupeň má následující podobu:

kde je funkce, podle které je průměr nalezen, se nazývá průměrovaná funkce,

x i nebo ( x 1 , x 2 ... X n) Je hodnota zprůměrovaného prvku pro každou jednotku populace,

f i - opakovatelnost individuální hodnoty atributu.

Podle stupně k získávají se různé typy výkonových průměrů, jejichž výpočetní vzorce jsou uvedeny níže v tabulce 1.

Tabulka 1 - Typy průměrů energie

Hodnota k

Průměrné jméno

Průměrné vzorce

vážený

Průměrná harmonická

, w i \u003d x i F i

Geometrický průměr

Aritmetický průměr

=

=

Střední kvadratická

=

=

f i frekvence opakování jednotlivé hodnoty prvku (jeho váha)

Frekvence může být také váha, tj. poměr rychlosti opakování hodnoty jednotlivého atributu k součtu frekvencí:

Výběr typu průměru:

Jednoduchý aritmetický průměr používá se, pokud se jednotlivá hodnota znaku v jednotkách populace neopakuje nebo se vyskytuje jednou nebo stejným počtem opakování, tj. když se průměr počítá z neagregovaných údajů.

Pokud se v jednotkách studované populace vyskytne několikrát samostatná hodnota sledovaného znaku, pak je ve vypočtených vzorcích výkonových průměrů přítomna frekvence opakování jednotlivých hodnot znaku (hmotnosti). V tomto případě se jim říká vzorce vážené průměry.

Pokud je podle stavu problému nutné zůstat nezměněn při průměrování součtu vzájemných hodnot jednotlivých hodnot atributu, pak je průměrná hodnota harmonický průměr.

Pokud je při nahrazování jednotlivých hodnot prvku průměrnou hodnotou nutné ponechat součin jednotlivých hodnot beze změny, pak geometrický průměr... Geometrický průměr se používá k výpočtu průměrných rychlostí růstu v analýze časových řad.

Pokud je při nahrazování jednotlivých hodnot prvku průměrnou hodnotou nutné ponechat součet čtverců původních hodnot beze změny, bude průměr kvadratický průměr... Kořenová mocnina se používá k výpočtu směrodatné odchylky při analýze variace prvku v distribuční řadě.

Mocenské prostředky různých typů, počítané pro stejnou populaci, mají různé kvantitativní a tím větší je exponent k, čím větší je hodnota odpovídajícího průměru, jsou-li všechny počáteční hodnoty prvku stejné, pak se všechny průměry rovnají této konstantě:

Garm. ≤ geom. ≤ aritmus. ≤ čtv. ≤ kubický

to mocnina-střední vlastnost se zvyšuje s nárůstem exponentu určující funkce majoranti.

Strukturální průměry se používají, když je výpočet prostředků zákonu moci nemožný nebo nepraktický.

Strukturální průměry zahrnují: móda a medián.

Móda - toto je nejběžnější hodnota znaku v jednotkách dané populace. Za přítomnosti variant a frekvencí v distribuční řadě odpovídá hodnota režimu hodnotě prvku v největším počtu jednotek (nejvyšší frekvence), tj. pro diskrétní variační řadu je režim nalezen podle definice.

Medián - hodnota atributu pro jednotku populace uprostřed seřazené distribuční řady, kdy jsou všechny jednotlivé hodnoty atributu studovaných jednotek uspořádány v pořadí jejich zvyšování nebo snižování.

V případě lichého počtu pozorování se medián najde podle definice, tj. volba (Kde n - počet pozorování). Při sudém počtu pozorování je medián určen vzorcem:

Pro intervalové řady distribucí se velikost módu a medián vypočítají pomocí následujících vzorců:
;
,

kde: - spodní hranice modálního nebo středního intervalu;

- velikost intervalu;

a
- frekvence předcházející a následující po modálním intervalu;

- četnost modálního nebo středního intervalu;

- součet akumulovaných frekvencí v intervalech předcházejících mediánu.

Výpočet mediánu z neseskupených dat je následující:

1. Jednotlivé hodnoty charakteristiky jsou seřazeny vzestupně. 2. Stanoví se pořadové číslo mediánu Ne. Já \u003d (n+1) / 2

    Ukazatele variace, podstaty, hodnoty, typů. Zákony variace

K měření variace prvku se používají různé absolutní a relativní ukazatele.

Absolutní ukazatele (míra) variace zahrnují: rozsah fluktuací, průměrnou absolutní odchylku, rozptyl, směrodatnou odchylku.

Varianta přejetím prstem Je rozdíl mezi maximální a minimální hodnotou charakteristiky:
.

Rozsah variací ukazuje, do jaké míry se liší velikost znaku, který tvoří distribuční řadu.

Střední absolutní odchylka (SAO) - průměr absolutních hodnot odchylek jednotlivých variant od průměru.

(jednoduchý),
(vážené)

Disperze- průměr čtverců odchylek možností hodnot atributu od jejich průměrné hodnoty:

(jednoduchý),
(vážené)

Rozptyl lze rozložit na jeho základní prvky, které umožňují posoudit vliv různých faktorů, které určují variabilitu znaku.

ty. rozptyl se rovná rozdílu mezi středním čtvercem hodnot atributu a čtvercem průměru.

Disperzní vlastnosti, což umožňuje zjednodušit způsob jeho výpočtu:

    Rozptyl konstanty je 0.

    Pokud jsou všechny varianty charakteristických hodnot redukovány stejným počtem opakování, pak se rozptyl nesníží.

    Pokud jsou všechny varianty charakteristických hodnot redukovány stejným počtem opakování ( k krát), pak se rozptyl sníží o k 2 čas.

Standardní odchylka (RMS) je druhá odmocnina rozptylu, ukazuje, jak moc hodnota znaku v průměru kolísá v jednotkách studované populace: =

RMS je měřítkem spolehlivosti. Čím menší je směrodatná odchylka, tím lépe aritmetický průměr odráží celou představovanou populaci.

Variační rozsah, CAO, RMS jsou pojmenované veličiny, tj. mají stejné měrné jednotky jako jednotlivé charakteristické hodnoty.

Existují 4 typy disperze: obecná, meziskupinová, vnitroskupinová, skupinová.

Varianta vypočítaná pro celou populaci jako celek se nazývá celková odchylka. Měří variabilitu závislého prvku (výslednice) způsobenou působením všech faktorů bez výjimky.

Celková odchylka se rovná součtu průměru odchylek uvnitř skupiny a mezi skupinami:

Pokud je populace rozdělena do skupin, pak pro každou skupinu lze určit její vlastní rozptyl, který charakterizuje odchylku v rámci skupiny. Skupinová odchylka - standardní odchylky od střední skupiny, tj. z průměrné hodnoty znaku v této skupině.

kdej - sériové číslo x a f ve skupině.

Skupinová odchylka charakterizuje variaci vlastnosti ve skupině v důsledku všech ostatních faktorů, s výjimkou jednoho v základu seskupení.

A měření odchylek nad populací jako celkem se počítá jako průměr rozptylu uvnitř skupiny:

kde jsou skupinové odchylky,

n j - počet jednotek ve skupinách.

Skupinové průměry se liší navzájem i od celkového průměru, tj. lišit se. Jejich variace se nazývá interskupinová variace. Abychom to charakterizovali, vypočítáme střední čtverec odchylek skupinových průměrů z celkového průměru:

kde j skupinové průměry, - obecný průměr, n j - počet jednotek ve skupině.

Rozptyl mezi skupinami (rozptyl skupinových prostředků) měří variaci výsledného atributu v důsledku faktoriálního atributu, který je základem seskupení.

Při porovnávání variability různých charakteristik ve stejné populaci nebo při porovnávání variability stejného atributu v několika agregátech s různými hodnotami aritmetického průměru se používají relativní variační indikátory.

Tyto indikátory se počítají jako poměr absolutních variačních indikátorů k aritmetickému průměru (nebo mediánu)

Variační koeficient

Relativní lineární odchylka

Oscilační koeficient

Nejčastěji používaným měřítkem relativní volatility je variační koeficient, což ukazuje průměrnou odchylku od průměrné hodnoty charakteristiky v procentech.

Používá se pro: srovnávací hodnocení variací; charakteristiky homogenity populace. Populace je považována za homogenní, pokud variační koeficient nepřesahuje 33%, tj. méně než 33%.

Z variace.

Zákon variace jednotlivých hodnot prvku nebo „pravidlo tří sigma“. Belgický statistik A. Quetelet zjistil, že variace některých hromadných jevů se řídí zákonem distribuce chyb objevených K. Gaussem a P. Laplaceem téměř současně. Křivka představující toto rozdělení vypadá jako zvon (obr. 2).

Podle normální zákon (termín navrhl anglický statistik K. Pearson) rozdělení variabilita jednotlivých hodnot atributu je uvnitř
(pravidlo tří sigma).

Přirozené vlastnosti člověka (výška, hmotnost, fyzická síla), vlastnosti průmyslových výrobků (velikost, hmotnost, elektrický odpor, pružnost atd.) Se řídí zákonem o normálním rozdělení. V oblasti rychle se měnících společenských jevů je účinek tohoto zákona relativně vzácný. V některých případech však pomocí tři pravidla sigmaprakticky možné.

Zákon variace středních hodnot. Rozdíl v průměrných hodnotách je menší než rozdíl v jednotlivých hodnotách znaku. Průměrné hodnoty charakteristiky se liší v rámci:
kde n - počet jednotek.