Populația statistică, tipurile acesteia. Unități de populație și clasificarea caracteristicilor acestora

abstract

Valori medii și indicatori de variație

1. Esența mediilor în statistici

2. Tipuri de medii și metode de calcul al acestora

3. Principalii indicatori de variație și semnificația lor în statistici

1. Esența mijlocului vedeghizări în statistici

În procesul studierii fenomenelor socio-economice de masă, devine necesară identificarea lor proprietăți generale, dimensiuni și caracteristici tipice. Necesitatea unei medii generalizatoare apare atunci când caracteristicile care caracterizează unitățile populației studiate variază cantitativ. De exemplu, producția zilnică a țesătorilor într-o fabrică de textile depinde de conditii generale producție, țesătorii folosesc aceleași materii prime, lucrează pe aceleași țesături etc. În același timp, producția orară a țesătorilor individuali fluctuează, adică variază, deoarece depinde de caracteristicile individuale ale fiecărui țesător (calificările sale, experiența profesională etc.). Pentru a caracteriza producția zilnică a tuturor țesătorilor întreprinderii, este necesar să se calculeze in medie producția zilnică, deoarece, numai, acest indicator va reflecta condițiile generale de producție pentru țesători.

Astfel, calculul indicatorilor medii generalizați înseamnă o distragere (abstractizare) față de caracteristicile reflectate în valoarea atributului în unități individuale și identificarea caracteristicilor și proprietăților tipice comune pentru un set dat.

Astfel, valoarea medie din statistici este o caracteristică generalizată, cantitativă a unui atribut și a unei populații statistice. Exprimă valoarea caracteristică, tipică a unei trăsături în unități ale agregatului format în condiții date de loc și timp sub influența întregului set de factori. Acțiunea diferiților factori dă naștere la fluctuații, variații ale caracteristicii medii. Valoarea medie este o măsură comună a acțiunii lor, rezultanta tuturor acestor factori. Valoarea medie caracterizează populația în funcție de atributul mediu, dar se referă la o unitate a populației. De exemplu, producția medie pe lucrător această întreprindere reprezintă raportul între întreaga producție (pentru orice perioadă de timp) și numărul total (mediu pentru aceeași perioadă) a lucrătorilor săi. Caracterizează productivitatea muncii unei populații date, dar se referă la un singur lucrător. În valoarea medie a fenomenului de masă, diferențele individuale ale unităților populației statistice în valorile atributului mediu sunt anulate, din cauza circumstanțelor aleatorii. Ca urmare a acestei anulări reciproce în medie, apare o proprietate comună, naturală a agregatului statistic de fenomene dat. Între semnificațiile medii și individuale ale trăsăturii medii, există o legătură dialectică între general și individ. Media este cea mai importantă categorie de științe statistice și cea mai importantă formă de indicatori generalizatori. Multe fenomene ale vieții sociale devin clare, definite, numai atunci când sunt generalizate, sub forma valorilor medii. Acestea sunt, de exemplu, productivitatea muncii menționată mai sus, totalitatea lucrătorilor, randamentul culturilor agricole etc. Media este cea mai importantă metodă de generalizare științifică în statistici. În acest sens, ei vorbesc despre metoda mediilor, care este utilizată pe scară largă în știința economică. Multe categorii de economie sunt definite folosind conceptul de medie.

Condiția principală aplicarea corectă valoarea medie este omogenitatea populației statistice pentru atributul mediu. O populație statistică omogenă este o populație în care elemente constitutive (unitățile) sunt similare între ele în caracteristicile esențiale pentru acest studiu și se referă la același tip de fenomene. O populație omogenă, fiind omogenă în unele caracteristici, poate fi eterogenă în altele. Numai în medii pentru astfel de agregate se manifestă trăsături specifice, modele de dezvoltare a fenomenului analizat. Media calculată pentru o populație statistică eterogenă, adică astfel în care se combină fenomene calitativ diferite, își pierde semnificația științifică. Astfel de medii sunt fictive, nu numai că nu dau nicio idee despre realitate, ci și o denaturează. Pentru formarea agregatelor statistice omogene se realizează o grupare adecvată. Cu ajutorul grupărilor și într-o populație omogenă calitativ, se pot distinge grupuri caracteristice cantitativ. Pentru fiecare dintre ele, se poate calcula propria medie, numită medie de grup (privată), spre deosebire de media generală (pentru populație în ansamblu).

2. Tipuri de valori medii

O mare importanță în metodologia valorilor medii sunt problemele alegerii formei mediei, adică formula prin care puteți calcula corect valoarea medie și alegerea ponderilor medii. Cel mai des folosit în statistici medie agregată, medie aritmetică, medie armonică, mediegeometric, rădăcină-medie-pătrat, mod și mediană. Aplicarea acestei sau acelei formule depinde de conținutul caracteristicii medii și de datele specifice pentru care trebuie calculată. Pentru a selecta forma mediei, puteți utiliza așa-numitul raport inițial mediu.

2.1 Media aritmetică

Media aritmetică este una dintre cele mai frecvente forme ale mediei. Media aritmetică este calculată ca coeficient de împărțire a sumei valorilor individuale (opțiuni) a variabilelor semne pe numărul lor. Media aritmetică este utilizată în cazurile în care volumul unui atribut variabil al fenomenelor unei populații statistice omogene se formează prin însumarea valorilor atributului tuturor unităților fenomenelor unei populații statistice. Se disting următoarele mijloace aritmetice:

1) Media aritmetică simplă, care se determină prin simpla însumare a valorilor cantitative ale atributelor variabile și împărțirea acestei sume în variantele lor și calculată folosind următoarea formulă:

X este valoarea medie a populației statistice,

x i - suma diferitelor variante individuale ale fenomenelor populației statistice,

n i - numărul de variante variabile ale fenomenelor populației statistice.

2) Media aritmetică ponderată - valoarea medie a atributului fenomenului, calculată luând în considerare ponderile. Ponderile valorilor medii sunt frecvențele cu care se iau în considerare valorile individuale ale atributului mediu la calcularea valorii medii a acestuia. Alegerea ponderilor pentru valoarea medie depinde de natura atributului mediu și de natura datelor disponibile pentru calcularea valorilor medii. Ponderile valorilor medii pot fi indicatori ai numărului de unități sau mărimilor părților unei populații statistice (sub formă de valori absolute sau relative) cu o variantă dată (valoare) a atributului mediu al fenomenului unei populații statistice, precum și valoarea indicatorului asociat cu atributul mediu. Media ponderată aritmetică este calculată utilizând următoarea formulă:

X - media aritmetică ponderată,

x - valoarea diferitelor variante individuale ale fenomenelor populației statistice,

Scopul unei medii aritmetice simple și ponderate este de a determina valoarea medie a unui atribut variabil. Dacă în populația statistică studiată variantele valorilor atributului apar o dată sau au aceeași pondere, atunci se utilizează o medie aritmetică simplă, dacă variantele valorilor acestui atribut apar de mai multe ori în populația studiată sau au greutăți diferite, media aritmetică este utilizată pentru a determina valoarea medie a atributului variabil. ponderat.

2.2 Armonica medie

Media armonică este utilizată pentru a calcula valoarea medie atunci când nu există date directe despre greutăți, dar sunt cunoscute variantele caracteristicii medii (x) și produsul valorilor variantelor după numărul de unități cu această valoare w (w \u003d xf).

Această medie se calculează utilizând următoarele formule:

1.) Armonică medie simplă:

X - armonic mediu simplu,

n este numărul de variante variabile ale fenomenelor populației statistice.

2) Armonica medie ponderată:

X - armonic mediu ponderat,

x - suma diferitelor variante individuale ale fenomenelor populației statistice,

Atunci când se utilizează ponderate armonice, greutățile sunt dezvăluite și astfel se obține același rezultat care ar da un calcul folosind media ponderată aritmetică, dacă ar fi cunoscute toate datele necesare pentru aceasta.

2.3 Agregat mediu

Media agregată este calculată prin formula:

X - agregat mediu,

x - suma diferitelor variante individuale ale fenomenelor populației statistice,

Media agregată este calculată în cazurile în care valorile numărătorilor și valorile numitorului raportului mediu original sunt cunoscute (disponibile).

2.4 Media geometrică

Media geometrică este una dintre formele mediei și se calculează ca rădăcină n grade de la produsul valorilor individuale - variante ale atributului (x) și este determinat de următoarea formulă:

Media geometrică este utilizată în principal în calcularea ratelor medii de creștere.

2.5 Modă și mediană

Alături de mediile considerate mai sus, așa-numitele mijloace structurale - mod și median.

Modul (Mo) este cea mai comună valoare a unei trăsături în unitățile de populație... Pentru seriile discrete, această opțiune are cea mai mare frecvență.

În seria de variație a intervalului, este posibil să se determine, în primul rând, intervalul în care este situat modul, adică așa-numita spațiere modală. Într-o serie de variații cu intervale egale, intervalul modal este determinat de cea mai mare frecvență, în serie cu intervale inegale, de cea mai mare densitate de distribuție.

Pentru a determina modul în rânduri cu intervale egale, utilizați următoarea formulă:

Хн - marginea inferioară a intervalului modal,

h - valoarea intervalului,

f 1, f 2, f 3 - frecvențe (sau detalii), respectiv, ale intervalelor pre-modale, modale și post-modale.

În seria de intervale, moda poate fi găsită grafic. Pentru a face acest lucru, trageți două linii în cea mai înaltă coloană a histogramei din limitele a două coloane adiacente. Apoi, din punctul de intersecție a acestora, o perpendiculară este coborâtă pe axa absciselor. Valoarea caracteristicii de pe axa abscisei, corespunzătoare perpendicularei, va fi modul.

În multe cazuri, atunci când se caracterizează populația, moda este preferată în locul mediei aritmetice ca indicator generalizat.

Deci, atunci când studiați prețurile pe piață, nu este fix și studiat în dinamică. prețul mediu pentru anumite produse, dar modal; Când se studiază cererea populației pentru o anumită dimensiune de încălțăminte sau haine, este de interes să se determine dimensiunea modală a încălțămintei, iar dimensiunea medie ca atare nu contează deloc aici. Moda nu este doar de interes independent, ci joacă și rolul unui indicator auxiliar pentru medie, caracterizându-i tipicitatea. Dacă media aritmetică are o valoare apropiată de moda, atunci este tipică.

Mediana (Me) este valoarea caracteristicii din unitatea de mijloc a seriei clasate. (O serie clasificată este o serie ale cărei valori caracteristice sunt scrise în ordine crescătoare sau descendentă.)

Pentru a găsi mediana, se determină mai întâi numărul său de serie. Pentru a face acest lucru, cu un număr impar de unități, se adaugă una la suma tuturor frecvențelor și totul este împărțit la două. Cu un număr par de unități, vor exista două unități medii în rând și, conform tuturor regulilor, mediana ar trebui determinată ca medie a valorilor acestor două unități. În acest caz, cu aproape un număr par de unități, mediana se găsește ca valoare a atributului pentru o unitate, al cărei număr de serie este determinat de suma totală a frecvențelor împărțită la două. Cunoscând numărul ordinal al medianei, este ușor să-i găsești valoarea din frecvențele acumulate.

În seria de intervale, după determinarea numărului ordinal al medianei prin frecvențe cumulative (detalii), se găsește intervalul medial și apoi, utilizând cea mai simplă tehnică de interpolare, se determină valoarea medianei în sine. Acest calcul este exprimat prin următoarea formulă:

X n - marginea inferioară a intervalului median,

h este valoarea intervalului median,

Numărul ordinal al medianei,

S Me - 1 frecvență (frecvență) acumulată până la intervalul mediu,

F Me - frecvența (particulară) a intervalului median.

Conform formulei scrise, la marginea inferioară a intervalului median se adaugă o astfel de parte a valorii intervalului, care cade pe fracțiunea unităților din acest grup care lipsesc la numărul ordinal al medianei. Cu alte cuvinte, calculul medianei se bazează pe presupunerea că creșterea caracteristicii între unitățile fiecărui grup are loc în mod egal. Pe baza celor spuse, mediana poate fi calculată în alt mod. După determinarea intervalului median, este posibil să se scadă din marginea superioară a intervalului median (Xv) acea parte a intervalului care cade pe fracțiunea de unități care depășește numărul ordinal al medianei, adică după următoarea formulă:

Mediana poate fi, de asemenea, determinată grafic. Pentru aceasta, se construiește cumulativul și se trasează o linie dreaptă dintr-un punct de pe scala frecvențelor acumulate (detalii) corespunzătoare numărului ordinal al medianei, ax paralel x înainte de a traversa cumulativul. Apoi, din punctul de intersecție al liniei drepte specificate cu cumulativ, o perpendiculară este coborâtă pe axa abscisei. Valoarea caracteristicii de pe axa absciselor corespunzătoare ordonatei trasate (perpendiculare) va fi mediana.

Prin același principiu, este ușor să găsiți valoarea unei caracteristici pentru orice unitate dintr-o serie clasată.

Astfel, un întreg set de indicatori poate fi folosit pentru a calcula valoarea medie a seriei de variații.

3. Principalii indicatori ai varși semnificația lor în statistici

Când se studiază o caracteristică variabilă în unitățile de populație, nu se poate limita doar la calcularea valorii medii din opțiuni individuale, deoarece aceeași medie nu se poate aplica populațiilor cu aceeași compoziție. Acest lucru poate fi ilustrat de următorul exemplu condiționat, care reflectă date privind numărul gospodăriilor din exploatațiile agricole din două regiuni:

Numărul mediu de gospodării din întreprinderile agricole din cele două raioane este același - 160. Mai mult, compoziția acestor întreprinderi agricole din cele două raioane este departe de a fi aceeași. Prin urmare, devine necesar să se măsoare variația caracteristicii în agregat.

În acest scop, o serie de caracteristici sunt calculate în statistici, adică indicatori. Cel mai elementar indicator al unei variații de caracteristici este gama de variație R, care este diferența dintre valorile maxime și minime ale unei caracteristici dintr-o serie de variații date, adică R \u003d Xmax - Xmin. În exemplul nostru, în prima zonă R \u003d 300 - 80 - 220, iar în a doua zonă R \u003d 180 - 145 \u003d 35.

Indicatorul intervalului de variație nu este întotdeauna aplicabil, deoarece ia în considerare doar valorile extreme ale trăsăturii, care pot fi foarte diferite de toate celelalte unități. Uneori găsesc raportul dintre variația variației și media aritmetică și folosesc această valoare, numind-o indicator oscilații.

Mai precis, puteți determina variația dintr-o serie folosind indicatori care iau în considerare abaterile tuturor opțiunilor de la media aritmetică. Există doi astfel de indicatori în statistici - media liniară și deviația standard.

Abaterea liniară medie reprezintă media aritmetică a valorilor absolute ale abaterilor opțiunilor de la medie. În acest caz, semnele abaterilor sunt ignorate, altfel suma tuturor abaterilor va fi egală cu zero. Acest indicator este calculat folosind formula:

b) pentru seria de variații:

Trebuie avut în vedere că deviația liniară medie va fi minimă dacă deviațiile sunt calculate de la mediană, adică conform formulei:

Deviație standard () se calculează după cum urmează - fiecare deviere de la medie este pătrată, toate pătratele sunt însumate (ținând cont de greutăți), după care suma pătratelor este împărțită la numărul de membri ai seriei și rădăcina pătrată este extrasă din coeficient.

Toate aceste acțiuni sunt exprimate prin următoarele formule:

a) pentru date neagregate:

b) pentru seria de variații:

f, adică Abaterea standard este rădăcina pătrată a mediei aritmetice a pătratelor abaterilor mediei. Expresia de sub rădăcină se numește varianță. Varianța are o expresie independentă în statistici și este unul dintre cei mai importanți indicatori de variație.

Conceptul unei serii de variații. Primul pas în sistematizarea materialelor statistice de observare este de a număra numărul de unități care au această caracteristică sau alta. Aranjând unitățile în ordine crescătoare sau descendentă a caracteristicii lor cantitative și numărând numărul de unități cu o valoare specifică a caracteristicii, obținem o serie de variații. Seria de variații caracterizează distribuția unităților unei anumite populații statistice prin orice criteriu cantitativ.

Seria de variații este formată din două coloane, coloana din stânga prezintă valorile caracteristicii variabile, numite variante și notate cu (x), iar coloana din dreapta conține numere absolute care arată de câte ori apare fiecare variantă. Citirile din această coloană se numesc frecvențe și sunt notate cu (f).

Seria de variații poate fi prezentată schematic sub forma Tabelului 5.1:

Tabelul 5.1

Tipul de serie de variații

Opțiuni (x)

Frecvențe (f)

În coloana din dreapta, pot fi utilizați și indicatori relativi care caracterizează ponderea frecvenței variantelor individuale în suma totală a frecvențelor. Acești indicatori relativi se numesc frecvențe și sunt desemnați în mod convențional prin, adică ... Suma tuturor părților este egală cu una. Frecvențele pot fi exprimate și ca procent, iar suma lor va fi egală cu 100%.

Semnele variate pot fi de altă natură. Variantele unor caracteristici sunt exprimate în numere întregi, de exemplu, numărul de camere dintr-un apartament, numărul de cărți publicate etc. Aceste semne sunt numite discontinue sau discrete. Variante de alte caracteristici pot lua orice valori în anumite limite, cum ar fi executarea sarcinilor planificate, salariu și altele.Aceste semne se numesc continue.

Serie de variații discrete. Dacă variantele seriilor de variații sunt exprimate sub formă de mărimi discrete, atunci o astfel de serie de variații se numește discretă aspect prezentată în tabel. 5.2:

Tabelul 5.2

Distribuirea elevilor în funcție de notele obținute la examen

Note (x)

Număr de studenți (f)

În% la total ()

Natura distribuției în serii discrete este descrisă grafic sub forma unui poligon de distribuție, Figura 5.1.

Figura: 5.1. Distribuirea elevilor în funcție de notele obținute la examen.

Serie de variație a intervalului. Pentru caracteristicile continue, seriile de variații sunt construite la intervale, adică valorile atributului din ele sunt exprimate ca intervale „de la și până la”. În acest caz, valoarea minimă a unei caracteristici într-un astfel de interval se numește limita inferioară a intervalului, iar maximul se numește limita superioară a intervalului.

Seriile de variații de intervale sunt construite atât pentru caracteristici discontinue (discrete), cât și pentru cele care variază pe o gamă largă. Rândurile de intervale pot fi la intervale egale sau inegale. În practica economică, în cea mai mare parte, se utilizează intervale inegale, crescând sau scăzând progresiv. O astfel de nevoie apare mai ales în acele cazuri în care variabilitatea caracteristicii este realizată inegal și în limite largi.

Luați în considerare tipul de serie de intervale cu intervale egale, tabel. 5.3:

Tabelul 5.3

Distribuția lucrătorilor pe producție

Generație, tr. (X)

Număr de lucrători (f)

Frecvența cumulativă (f´)

Seria intervalului de distribuție este reprezentată grafic sub forma unei histograme, Figura 5.2.

Figura 5.2. Distribuția lucrătorilor pe producție

Frecvența acumulată (cumulată). În practică, este necesară transformarea seriei de distribuție în serie cumulativă,pe baza frecvențelor acumulate. Ele pot fi utilizate pentru a determina mijloacele structurale care facilitează analiza datelor din seria de distribuție.

Frecvențele acumulate sunt determinate prin adăugarea succesivă la frecvențele (sau părțile) din primul grup al acestor indicatori ai grupurilor ulterioare ale seriei de distribuție. Cumulurile și ogivele sunt utilizate pentru a ilustra seria de distribuție. Pentru a le reprezenta, valorile caracteristicii discrete (sau capetele intervalelor) sunt marcate pe axa absciselor, iar totalul crescător al frecvențelor (cumulativ) este marcat pe axa ordonată, Fig. 5.3.

Figura: 5.3. Distribuția cumulativă a lucrătorilor după producție

Dacă scalele de frecvențe și opțiuni sunt inversate, adică reflectă frecvențele acumulate pe axa abscisei și valorile opțiunilor pe axa ordonată, apoi curba care caracterizează schimbarea frecvențelor de la grup la grup se va numi ogive de distribuție, Fig. 5.4.

Figura: 5.4. Gama de distribuție a lucrătorilor pentru producție

Seria de variații cu intervale egale oferă una dintre cele mai importante cerințe pentru serii statistice distribuție, asigurând comparabilitatea lor în timp și spațiu.

Densitatea distribuției. Cu toate acestea, frecvențele intervalelor individuale inegale din aceste serii nu sunt direct comparabile. În astfel de cazuri, pentru a asigura comparabilitatea necesară, se calculează densitatea distribuției, adică determinați câte unități din fiecare grup sunt pe unitate a intervalului.

La trasarea graficului de distribuție a seriei de variații cu intervale inegale, înălțimea dreptunghiurilor este determinată proporțional nu cu frecvențele, ci cu indicatorii densității de distribuție a valorilor atributului studiat în intervalele corespunzătoare.

Compilarea seriei de variații și reprezentarea sa grafică este primul pas în prelucrarea datelor inițiale și prima etapă în analiza populației studiate. Următorul pas în analiza seriilor de variații este de a determina principalii indicatori generalizatori, numiți caracteristicile seriei. Aceste caracteristici ar trebui să ofere o idee despre valoarea medie a unei trăsături în unități de populație.

valoarea medie... Valoarea medie este o caracteristică generalizată a trăsăturii studiate la populația studiată, reflectând nivelul său tipic pe unitate de populație în condiții specifice de loc și timp.

Media este întotdeauna numită, are aceeași dimensiune ca și atributul pentru unitățile individuale ale populației.

Înainte de calcularea valorilor medii, este necesar să se grupeze unitățile populației studiate, evidențiind grupurile omogene calitativ.

Media calculată pentru populație în ansamblu se numește media generală și, pentru fiecare grup, media grupului.

Există două tipuri de valori medii: puterea (media aritmetică, media armonică, media geometrică, pătratul mediu); structurale (modă, mediană, quartile, decile).

Alegerea mediei pentru calcul depinde de scop.

Tipuri de medii de putere și metode pentru calculul acestora.În practica prelucrării statistice a materialului colectat, apar diferite probleme, pentru soluționarea cărora sunt necesare medii diferite.

Statistica matematică derivă diverse mijloace din formule ale puterii medii:

unde este valoarea medie; x - variante individuale (valori caracteristice); z - exponent (pentru z \u003d 1 - medie aritmetică, z \u003d 0 medie geometrică, z \u003d - 1 - medie armonică, z \u003d 2 - pătrat mediu).

Cu toate acestea, întrebarea care tip de medie ar trebui aplicată în fiecare caz individual este rezolvată printr-o analiză specifică a populației studiate.

Cel mai frecvent tip de medie în statistici este medie aritmetică... Se calculează în cazurile în care volumul caracteristicii medii este format ca suma valorilor sale pentru unitățile individuale ale populației statistice studiate.

În funcție de natura datelor inițiale, media aritmetică este determinată în diferite moduri:

Dacă datele nu sunt grupate, atunci calculul se efectuează conform formulei unei valori medii simple

Calculul mediei aritmetice într-o serie discretăapare conform formulei 3.4.

Calculul mediei aritmetice în seria de intervale. În seria de variație a intervalului, unde mijlocul intervalului este considerat în mod convențional ca valoarea unei caracteristici din fiecare grup, media aritmetică poate diferi de media calculată din datele ne-grupate. Mai mult, cu cât este mai mare valoarea intervalului în grupuri, cu atât sunt mai mari posibilele abateri ale mediei calculate din datele grupate față de media calculată din datele non-grupate.

Când se calculează media pe o serie de variații de intervale, pentru a efectua calculele necesare, intervalele sunt transferate în punctele lor medii. Și apoi media este calculată utilizând formula mediei ponderate aritmetice.

Proprietățile mediei aritmetice.Media aritmetică are câteva proprietăți care simplifică calculele, să le luăm în considerare.

1. Media aritmetică a numerelor constante este egală cu acest număr constant.

Dacă x \u003d a. Atunci .

2. Dacă greutățile tuturor variantelor sunt schimbate proporțional, adică crește sau scade cu același număr de ori, atunci media aritmetică a noii serii nu se va schimba față de aceasta.

Dacă toate greutățile f sunt reduse cu un factor de k, atunci .

3. Suma abaterilor pozitive și negative a variantelor individuale de la medie, înmulțită cu greutățile, este egală cu zero, adică

Daca atunci. De aici.

Dacă toate opțiunile sunt reduse sau crescute cu orice număr, atunci media aritmetică a noii serii va scădea sau crește cu aceeași cantitate.

Reduceți toate opțiunile x pe a, adică x´ = xa.

Atunci

Media aritmetică a seriei originale poate fi obținută prin adăugarea la media redusă a numărului scăzut anterior din opțiuni a, adică ...

5. Dacă toate opțiunile sunt reduse sau crescute cu k ori, atunci media aritmetică a noii serii va scădea sau crește cu aceeași cantitate, adică în k timp.

Lasă, atunci .

Prin urmare, adică pentru a obține media seriei inițiale, media aritmetică a seriei noi (cu opțiuni reduse) trebuie mărită cu ktimp.

Armonica medie.Media armonică este reciprocă a mediei aritmetice. Se folosește când informații statistice nu conține frecvențe pentru variantele individuale ale populației, dar este prezentat ca produs al acestora (M \u003d xf). Media armonică va fi calculată prin formula 3.5

Aplicarea practică a mediei armonice - pentru calcularea unor indici, în special a indicelui prețurilor.

Media geometrică.Atunci când se utilizează media geometrică, valorile individuale ale caracteristicii sunt, de regulă, valorile relative dinamică, construită sub formă de cantități de lanț, ca relație cu nivelul anterior al fiecărui nivel într-o serie de dinamici. Media caracterizează astfel rata medie de creștere.

Media geometrică este, de asemenea, utilizată pentru a determina valoarea echidistantă de la valorile maxime și minime ale unei caracteristici. De exemplu, o companie de asigurări încheie contracte pentru furnizarea de servicii de asigurare auto. În funcție de evenimentul asigurat specific, plata asigurării poate varia de la 10.000 $ la 100.000 $ pe an. Plata medie a asigurării va fi USD.

Media geometrică este o valoare utilizată ca medie a rapoartelor sau în seriile de distribuție prezentate sub forma unei progresii geometrice atunci când z \u003d 0. Această medie este convenabilă de utilizat atunci când se acordă atenție nu diferențelor absolute, ci raporturilor a două numere.

Formulele de calcul sunt după cum urmează

unde sunt variantele caracteristicii medii; - producerea de opțiuni; f- frecvența opțiunilor.

Media geometrică este utilizată la calcularea ratei medii anuale de creștere.

Medie pătrată.Formula rădăcină-medie-pătrat este utilizată pentru a măsura gradul de variabilitate a valorilor individuale ale unei caracteristici în jurul mediei aritmetice din seria de distribuție. Deci, atunci când se calculează indicatorii de variație, media se calculează din pătratele abaterilor valorilor individuale ale atributului de la media aritmetică.

Pătratul mediu rădăcină este calculat prin formula

În cercetarea economică, pătratul mediu rădăcină într-o formă modificată este utilizat pe scară largă în calcularea indicatorilor de variație a unei trăsături, cum ar fi varianța, deviația standard.

Regula majorității. Există următoarea relație între mediile de putere - cu cât exponentul este mai mare, cu atât este mai mare valoarea medie, Tabelul 5.4:

Tabelul 5.4

Raportul dintre medii

Valoarea Z

Raportul dintre medii

Acest raport este numit regula majorantului.

Medii structurale.Pentru a caracteriza structura populației, se utilizează indicatori speciali, care pot fi numiți medii structurale. Acești indicatori includ moda, mediana, quartile și decile.

Modă. Modul (Mo) este cea mai comună valoare a unei caracteristici în unitățile de populație. Moda este valoarea caracteristicii care corespunde punctului maxim al curbei de distribuție teoretică.

Moda este utilizată pe scară largă în practica comercială în studiul cererii consumatorilor (atunci când se determină mărimea îmbrăcămintei și încălțămintei care sunt foarte solicitate), înregistrând prețuri. Pot exista mai multe moduri în agregat.

Calculul modului într-un rând discret. În seria discretă, modul este varianta cu cea mai mare frecvență. Luați în considerare găsirea unui mod într-un rând discret.

Calculul modului în seria de intervale. În seria de variație a intervalului, modul este aproximativ considerat varianta centrală a intervalului modal, adică intervalul care are cea mai mare frecvență (frecvență). În interval este necesar să se găsească valoarea caracteristicii, care este modul. Pentru o serie de intervale, modul va fi determinat de formulă

unde este limita inferioară a intervalului modal; - valoarea intervalului modal; - frecvența corespunzătoare intervalului modal; - frecvența care precede intervalul modal; Este frecvența intervalului care urmează modului.

Median.Mediana () este valoarea caracteristicii din unitatea de mijloc a seriei clasate. O serie clasificată este o serie în care valorile caracteristice sunt scrise în ordine crescătoare sau descendentă. Sau mediana este o valoare care împarte numărul unei serii de variații ordonate în două părți egale: o parte are o valoare a unui atribut variabil mai mică decât varianta medie, iar cealaltă - mare.

Pentru a găsi mediana, se determină mai întâi numărul său de ordine. Pentru a face acest lucru, cu un număr impar de unități, se adaugă una la suma tuturor frecvențelor și totul este împărțit la două. Când numărul de unități este par, mediana se găsește ca valoare a atributului unității, numărul ordinal care este determinat de suma totală a frecvențelor împărțită la două. Cunoscând numărul ordinal al medianei, este ușor să-i găsești valoarea din frecvențele acumulate.

Calculul medianei într-o serie discretă.Conform sondajului eșantion, s-au obținut date privind distribuția familiilor după numărul de copii, fila. 5.5. Pentru a determina mediana, mai întâi îi determinăm numărul ordinal

În aceste familii, numărul copiilor este 2, deci \u003d 2. Astfel, la 50% din familii, numărul copiilor nu depășește 2.

–Frecvența acumulată, care precede intervalul median;

Pe de o parte, aceasta este o proprietate foarte pozitivă, deoarece în acest caz, se ia în considerare acțiunea tuturor cauzelor care afectează toate unitățile din populația studiată. Pe de altă parte, chiar și o observație care a căzut întâmplător în datele inițiale poate distorsiona semnificativ ideea nivelului de dezvoltare a trăsăturii studiate în populația considerată (în special în serii scurte).

Cvartile și decile.Prin analogie cu găsirea medianei în seria variațională, puteți găsi valoarea caracteristicii pentru orice unitate din seria clasată. Deci, în special, puteți găsi valoarea unei caracteristici în unități care împart o serie în 4 părți egale, în 10 etc.

Quartile. Variantele care împart o serie clasificată în patru părți egale se numesc quartile.

În același timp, disting: quartila inferioară (sau prima) (Q1) - valoarea atributului în unitatea seriei clasate împărțind populația în raportul ¼ la ¾ și quartila superioară (sau a treia) (Q3) - valoarea atributului în unitatea seriei clasate, împărțind populația în raport ¾ la ¼.

- frecvența intervalelor de quartile (inferioară și superioară)

Intervalele care conțin Q1 și Q3 sunt determinate din frecvențele (sau părțile) acumulate.

Decile. În plus față de quartile, se calculează decile - opțiuni care împart seria clasificată în 10 părți egale.

Sunt notate cu D, prima decilă D1 împarte rândul într-un raport de 1/10 și 9/10, al doilea D2 - 2/10 și 8/10 etc. Acestea sunt calculate în conformitate cu aceeași schemă ca mediana și quartile.

Atât mediana, câtilele, cât și decilele aparțin așa-numitei statistici ordinale, care sunt înțelese ca o variantă care ocupă un anumit loc ordinal în seria clasată.

În ultima lecție și și-a dat seama că știe multe, cei care nu au înțeles, au uitat sau au trecut pe lângă ei, pot urma linkul și își pot reîmprospăta cunoștințele)). Dar există o altă vorbă foarte interesantă în teoria statisticii. Există trei tipuri de minciuni în lume - minciuni, minciuni flagrante și ... STATISTICI !!!

Afirmația complet contradictorie este diferită - statisticile știu totul... Dar parțial există ceva adevăr în el. Este vorba despre datele care au fost colectate pentru procesare.

Dar despre asta vom vorbi mai târziu ...

Cu toate acestea, reveniți la categoriile statistice. Categoriile sau termenii statistici de bază sunt o parte importantă a științei. Iar punctul aici este că acești termeni sunt utilizați în mod regulat în procesul de prelucrare și analiză a datelor. Aici sunt atât de importante pentru știința statistică.

Populația statistică - Acesta este un grup de obiecte sau fenomene socio-economice ale vieții sociale, unite printr-o conexiune comună, dar care diferă între ele prin trăsături individuale. Aceasta este cea mai comună definiție a unei populații. Acesta include caracteristicile sale și, ceea ce este foarte important, și alte categorii statistice. Să încercăm să simplificăm sau să înțelegem ce este un set prin exemplu.
Un agregat este o combinație de elemente sau fenomene sau oameni etc. Nu numai că există de obicei multe părți sau elemente agregate (întotdeauna mai multe decât una), dar toate sunt oarecum similare. Deci această asemănare este semnul prin care aceste elemente erau unite. Elementele au un lucru în comun și multe alte caracteristici diferă.



Iată un mic exemplu. Imaginea arată oamenii în mod condiționat. Aceasta este o colecție de oameni - pe această bază, au fost combinați într-o colecție. Cu toate acestea, suntem cu toții diferiți și avem o mulțime de caracteristici care ne diferențiază unul de celălalt - sex, vârstă, educație, stare civilă, nivel de venit, locul de reședință etc.
În general, în agregat, puteți combina diferite elemente, doar dacă ar fi ceva de studiat:
- totalitatea școlarilor - studiul general la școală, iar diferențele sunt sexul, vârsta, clasa, locul de studiu și multe altele;
- ansamblul copacilor din pădure - lucrul obișnuit sunt copacii, diferențele de vârstă, tipul de copac, înălțimea etc .;
- un set de întreprinderi - o întreprindere comună, diferențe, industrie, numărul de angajați, producție, profit etc.
Și există un număr imens de astfel de exemple.

Sarcina. Să presupunem că imaginea arată o colecție de studenți. Descrieți-l, de ce este un agregat, ce au elevii. Există elemente suplimentare în imagine care nu aparțin acestui set?

Și ultimul termen foarte important este variația!
Variație - acestea sunt fluctuații în atributul populației statistice. În statistici, se spune - semnul fluctuează sau variază.
Variația trăsăturilor este fundamentul științei statistice. Nu ar exista nicio variație, nu ar exista statistici. Tocmai pentru că semnele se schimbă și există un studiu al acestora. Dacă nu ar exista schimbări și diferențe și totul ar fi același, atunci nu ar mai fi nimic de studiat și nu ar exista statistici.

Și apoi vom trece la. Dar mai întâi, temele.

Sarcină de control. Dați exemple de două sau trei agregate, selectați unitățile agregate din ele și caracterizați-le cu caracteristici. Dați un exemplu de statistici și variații ale unei trăsături.

Raport - Corpuri de statistici de stat în Federația Rusă - funcții, sarcini, structură. - Serviciul Federal de Statistică al Statului - http://www.gks.ru/

Trimite-ți munca bună în baza de cunoștințe este simplu. Folosiți formularul de mai jos

Studenții, studenții absolvenți, tinerii oameni de știință care folosesc baza de cunoștințe în studiile și munca lor vă vor fi foarte recunoscători.

postat pe http://www.allbest.ru/

Problema 1

Într-o anumită regiune, 12 390 infracțiuni au fost comise anul acesta, iar 11 800 infracțiuni au fost comise în anul precedent. Calculați (în%) rata de creștere și rata de creștere a numărului de infracțiuni înregistrate în anul curent în raport cu anul precedent. De asemenea, calculați ratele criminalității pentru fiecare an, dacă populația regiunii la sfârșitul anului precedent era de 1.475.000, iar la sfârșitul anului curent - 1.770.000 de persoane. Trageți concluzii despre dinamica criminalității în regiune.

Decizie: Pentru a obține o imagine exactă a criminalității, un astfel de indicator al criminalității ca dinamica, adică o schimbare în timp, este de o mare importanță. Dinamica criminalității se caracterizează prin conceptele de creștere absolută (sau declin) și rate de creștere și creștere a criminalității, pentru a determina care sunt aceste caracteristici calculate conform anumitor formule.

Ratele de creștere a criminalității sunt calculate pe baza indicatorilor de bază ai dinamicii, ceea ce implică compararea datelor pentru un număr de ani (și uneori decenii, dacă este necesară o acoperire largă a materialului) cu o bază constantă, care este înțeleasă ca nivelul infracțiunii din perioada inițială de analiză. Acest calcul permite criminologilor să garanteze în mod semnificativ comparabilitatea indicatorilor relativi, calculați ca procente, care arată modul în care infracțiunea perioadelor ulterioare este legată de cea anterioară.

În calcul, datele din anul inițial sunt luate ca 100%; indicatorii obținuți în anii următori reflectă doar procentul de creștere, ceea ce face calculul corect și imaginea mai obiectivă; atunci când se operează cu date relative, este posibil să se excludă influența unei creșteri sau scăderi a numărului de rezidenți care au atins vârsta răspunderii penale asupra scăderii sau creșterii criminalității.

Rata criminalității este calculată ca procent. Rata de creștere a criminalității arată cât de mult a crescut sau a scăzut rata criminalității ulterioare în comparație cu perioada precedentă. Se adoptă o notație convențională pentru vectorul ratei de creștere: dacă procentul crește, se pune un semn plus, dacă scade, se pune un semn minus.

În raport cu condițiile problemei noastre, ar trebui să aplicăm formulele adecvate și să calculăm creșterea și creșterea criminalității.

1) Rata de creștere a criminalității este calculată prin formula ^

Tr \u003d U / U2 * 100%,

unde U este un indicator al nivelului de criminalitate, iar U2 este un indicator al nivelului de criminalitate din perioada anterioară. Deci, rata de creștere a criminalității în condițiile problemei va fi - 12390/11800 * 100% \u003d 1,05%.

2) Rata de creștere a criminalității se calculează utilizând următoarea formulă:

Tpr \u003d Tr-100%.

Deci rata de creștere în condițiile problemei va fi de 1,05% -100% \u003d 98,95%.

Rata criminalității este un indicator generalizat specific al numărului total de infracțiuni înregistrate, corelat cu populația. Reprezintă numărul infracțiunilor la 100 mii, 10 mii sau o mie din populație și este o măsură obiectivă a infracțiunii, permițându-vă să comparați nivelurile acesteia în diferite regiuni și în ani diferiți.

Rata criminalității ajută la evaluarea mai adecvată a dinamicii ratei criminalității calculată pe cap de locuitor.

Rata criminalității este calculată utilizând formula:

KP \u003d (P x 100000): N,

unde P este numărul absolut al infracțiunilor înregistrate; iar H este dimensiunea absolută a întregii populații.

Ambii indicatori sunt luați în același volum teritorial și temporal. Numărul infracțiunilor este de obicei calculat la 100 de mii de oameni. Dar cu un număr mic de infracțiuni și populație (într-un oraș, district, la o întreprindere), rata criminalității poate fi calculată la 10 mii sau la 1.000 de locuitori. în orice caz, aceste numere indică dimensiunea coeficientului luat în considerare, care trebuie indicat: numărul infracțiunilor la 100 mii sau 10 mii din populație.

Să calculăm rata criminalității în raport cu condițiile problemei noastre:

1) CP \u003d (12390 * 100000): 1.770.000 persoane. \u003d 700 (în anul curent).

2) KP \u003d (11800 * 100000): 1 475 000 \u003d 800 (în anul precedent).

Infracțiunile din regiune sunt în scădere, deoarece, analizând rata criminalității, putem concluziona că odată cu creșterea populației din regiune (cu 16,6%) și cu o ușoară creștere a numărului de infracțiuni cu 1,05%, în general, creșterea criminalității scade (-98,95 %).

Problema 2

Vârsta a 11 tineri specialiști ai instituției recrutați în serviciu în acest an a fost, respectiv, 19,25,21,23,23,23,25,20,18,20,21 ani. Rezumați și grupați datele într-un tabel de frecvențe statistice. Pentru claritate, construiți un poligon de frecvență și găsiți, de asemenea, vârsta modală, medie și medie a angajaților angajați.

Decizie: Gruparea - Aceasta este o împărțire a populației în grupuri care sunt omogene într-un fel. Din punctul de vedere al unităților individuale ale populației, gruparea este unirea unităților individuale ale populației în grupuri care sunt omogene într-un fel.

Metoda de grupare se bazează pe următoarele categorii - atribut de grupare, interval de grupare și număr de grupuri.

Atribut de grupare - Acesta este un semn prin care unitățile individuale ale populației sunt combinate în grupuri omogene.

Intervalul delimitează limitele cantitative ale grupurilor. De regulă, reprezintă intervalul dintre valorile maxime și minime ale unei caracteristici dintr-un grup.

Determinarea numărului de grupuri.

Numărul de grupuri este aproximativ determinat de formula Sturgess:

n \u003d 1 + 3.2log n \u003d 1 + 3.2log (11) \u003d 4.

Lățimea intervalului va fi:

Xmax este valoarea maximă a atributului de grupare din agregat. Xmin este valoarea minimă a atributului de grupare. Să definim limitele grupului.

Număr de grup

Linia de fund

Limită superioară

Aceeași valoare a caracteristicii servește ca superioară și limite inferioare două grupuri adiacente (anterioare și următoare).

Pentru fiecare valoare a seriei, calculăm de câte ori se încadrează într-unul sau alt interval. Pentru a face acest lucru, sortăm rândul în ordine crescătoare.

Numărul populației

Frecvența fi

Poligonul de frecvență este un grafic al densității și probabilității unei variabile aleatorii; este o linie întreruptă care leagă punctele corespunzătoare valorilor mediane ale intervalelor de grupare și frecvențelor acestor intervale.

Valoarea medie:

Modăvaloarea inului. Moda este cea mai comună semnificație a unei caracteristici în unitățile unei anumite populații.

unde x 0 - începutul intervalului modal; h este mărimea intervalului; f 2 - frecvența corespunzătoare intervalului modal; f 1 - frecvența premodală; f 3 - frecvența postmodală.

Alegem 19.75 ca început al intervalului, deoarece acest interval conține cel mai mare număr.

Cea mai frecventă valoare a rândului este 20,92.

Median... Mediana împarte eșantionul în două părți: jumătate din opțiune este mai mică decât mediana, jumătate este mai mult.

În seria de intervale a distribuției, puteți specifica imediat numai intervalul în care va fi localizat modul sau mediana. Mediana corespunde variantei din mijlocul rândului clasat. Intervalul mediu este 19.75-21.5, deoarece în acest interval, frecvența acumulată S este mai mare decât numărul median (mediana este primul interval, a cărui frecvență acumulată depășește jumătate din suma totală a frecvenței).

Astfel, 50% din unitățile de populație vor fi mai mici de 21,28.

Problema 3

Determinați dimensiunea eșantionului necesar pentru studiul vârstei medii a angajaților certificați ai Serviciului Penitenciar Federal din Rusia, cu condiția ca abaterea standard să fie de 10 ani, iar eroarea maximă admisibilă de eșantionare să nu depășească 5%.

Căutăm o soluție conform formulei pentru determinarea mărimii eșantionului pentru selecție repetată.

Ф (t) \u003d g / 2 \u003d 0,95 / 2 \u003d 0,475 și această valoare conform tabelului Laplace corespunde t \u003d 1,96.

Estimarea abaterii standard s \u003d 10; eroare de eșantionare e \u003d 5.

Problema 4

Următorul tabel oferă statistici oficiale ale departamentului privind distribuția condamnaților în funcție de termenele de închisoare (pedeapsă) pentru 2002-2011, postate pe site-ul oficial al Serviciului Federal al Penitenciarelor din Rusia: www.fsin.su. Găsiți intervalul și coeficientul de variație al numărului de condamnați pentru fiecare an calendaristic și trageți concluzii despre omogenitatea structurii acestei caracteristici statistice.

Principalul indicator al omogenității datelor este coeficientul de variație. În statistici, se acceptă în general că, dacă valoarea coeficientului este mai mică de 33%, atunci setul de date este omogen, dacă este mai mare de 33%, atunci este eterogen.

Coeficientul de variație

Din moment ce v? 30%, atunci populația este omogenă, iar variația este slabă. Rezultatele obținute pot fi de încredere.

Termenul pedepsei

1-3 ani

3-5 ani

5-10 ani

10 - 15 ani

Peste 15 ani

Valoare maximă (funcția MAX)

Valoare minimă (funcția MIN)

Variație de glisare

Valoare medie (funcția MEDIE)

Abaterea standard (funcția STANDARD LONA)

Coeficientul de variație

Medie simplă:

Modăvaloare

Median

Găsim mijlocul seriei clasate: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Acest număr corespunde valorii seriei 70580. Prin urmare, mediana Me \u003d 70580.

Indicatori de variație. .

R \u003d X max - X min.

R \u003d 295916-2250 \u003d 293666.

Abaterea liniară medie

Fiecare valoare a seriei diferă de cealaltă cu o medie de 90895,71.

Dispersie

(eroare medie eșantionare).

Fiecare valoare a seriei diferă de valoarea medie 103008 cu o medie de 107169,83.

Coeficientul de variație - o măsură a răspândirii relative a valorilor populației: arată cât din media acestei valori este răspândirea medie a acesteia.

Din moment ce v\u003e

sau

Coeficientul de oscilație

Medie simplă:

Modă

Nu există modă (toate valorile seriei sunt individuale).

Median... Mediana este valoarea unei caracteristici care împarte unitățile seriei clasate în două părți. Mediana corespunde variantei din mijlocul rândului clasat.

Găsim mijlocul seriei clasate: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Acest număr corespunde valorii seriei 76186. Prin urmare, mediana Me \u003d 76186.

Indicatori de variație. Indicatori absoluți ai variației.

Gama de variație este diferența dintre valorile maxime și minime ale caracteristicii seriei primare.

R \u003d X max - X min

R \u003d 291112-3101 \u003d 288011.

Abaterea liniară medie - calculat pentru a lua în considerare diferențele tuturor unităților din populația studiată.

Fiecare valoare a seriei diferă de cealaltă cu o medie de 83422,69.

Dispersie - caracterizează măsura dispersiei în jurul valorii sale medii (măsura dispersiei, adică abaterea de la medie).

Deviație standard (eroare medie de eșantionare).

Fiecare valoare a seriei diferă de valoarea medie de 97334,29 cu o medie de 100750,25.

Ratele relative de variație... Indicatorii relativi ai variației includ: coeficientul de oscilație, coeficient liniar variații, deviație relativă liniară.

Coeficientul de variație - o măsură a răspândirii relative a valorilor populației: arată cât din media acestei valori este răspândirea medie a acesteia.

Din moment ce v\u003e 70%, populația se apropie de marginea neomogenității, iar variația este puternică.

În acest caz, în cercetările practice, diferite metode statistice conduc totalitatea la o formă omogenă.

Coeficientul de variație liniar sau Abaterea liniară relativă - caracterizează ponderea valorii medii a semnului abaterilor absolute de la medie.

Coeficientul de oscilație - reflectă variabilitatea relativă a valorilor extreme ale caracteristicii în jurul mediei.

Medie simplă:

Modăvaloarea inului. Moda este cea mai comună semnificație a unei caracteristici în unitățile unei anumite populații.

Nu există modă (toate valorile seriei sunt individuale).

Median... Mediana este valoarea unei caracteristici care împarte unitățile seriei clasate în două părți. Mediana corespunde variantei din mijlocul rândului clasat.

Găsim mijlocul seriei clasate: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Acest număr corespunde valorii seriei 71093. Prin urmare, mediana Me \u003d 71093.

Indicatori de variație. Indicatori absoluți ai variației.

Gama de variație este diferența dintre valorile maxime și minime ale caracteristicii seriei primare.

R \u003d X max - X min

R \u003d 243852-3856 \u003d 239996.

Abaterea liniară medie - calculat pentru a lua în considerare diferențele tuturor unităților din populația studiată.

Fiecare valoare a seriei diferă de cealaltă cu o medie de 68998,08.

Dispersie - caracterizează măsura dispersiei în jurul valorii sale medii (măsura dispersiei, adică abaterea de la medie).

Deviație standard (eroare medie de eșantionare).

Fiecare valoare a seriei diferă de valoarea medie de 85765,57 cu o medie de 82541,55.

Ratele relative de variație... Indicatorii relativi ai variației includ: coeficient de oscilație, coeficient de variație liniar, deviație liniară relativă.

Coeficientul de variație - o măsură a răspândirii relative a valorilor populației: arată cât din media acestei valori este răspândirea medie a acesteia.

Din moment ce v\u003e 70%, populația se apropie de marginea neomogenității, iar variația este puternică.

Coeficientul de variație este semnificativ mai mare de 33%. În consecință, setul considerat este eterogen și media pentru acesta nu este suficient de tipică. În acest caz, în cercetările practice, diferite metode statistice conduc totalitatea la o formă omogenă.

Coeficientul de variație liniar sau Abaterea liniară relativă - caracterizează ponderea valorii medii a semnului abaterilor absolute de la medie.

Coeficientul de oscilație - reflectă variabilitatea relativă a valorilor extreme ale caracteristicii în jurul mediei.

:

Modă... Moda este cea mai comună semnificație a unei caracteristici în unitățile unei anumite populații.

Nu există modă (toate valorile seriei sunt individuale).

Median... Mediana este valoarea unei caracteristici care împarte unitățile seriei clasate în două părți. Mediana corespunde variantei din mijlocul rândului clasat.

Găsim mijlocul seriei clasate: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Acest număr corespunde valorii seriei 74588. Prin urmare, mediana Me \u003d 74588.

Indicatori de variație. Indicatori absoluți ai variației.

Gama de variație este diferența dintre valorile maxime și minime ale caracteristicii seriei primare.

R \u003d X max - X min,

R \u003d 242984-5304 \u003d 237680.

Abaterea liniară medie - calculat pentru a lua în considerare diferențele tuturor unităților din populația studiată.

Fiecare valoare a seriei diferă de cealaltă cu o medie de 73148,73.

Dispersie - caracterizează măsura dispersiei în jurul valorii sale medii (măsura dispersiei, adică abaterea de la medie).

Deviație standard (eroare medie de eșantionare).

Fiecare valoare a seriei diferă de valoarea medie de 92104,14 cu o medie de 82873,1.

Ratele relative de variație... Indicatorii relativi ai variației includ: coeficient de oscilație, coeficient de variație liniar, deviație liniară relativă.

Coeficientul de variație - o măsură a răspândirii relative a valorilor populației: arată cât din media acestei valori este răspândirea medie a acesteia.

Din moment ce v\u003e 70%, populația se apropie de marginea neomogenității, iar variația este puternică.

Coeficientul de variație este semnificativ mai mare de 33%. În consecință, setul considerat este eterogen și media pentru acesta nu este suficient de tipică. În acest caz, în cercetările practice, diferite metode statistice conduc totalitatea la o formă omogenă.

Coeficientul de variație liniar sau Abaterea liniară relativă - caracterizează ponderea valorii medii a semnului abaterilor absolute de la medie.

Coeficientul de oscilație - reflectă variabilitatea relativă a valorilor extreme ale caracteristicii în jurul mediei.

Media aritmetică simplă:

Modă... Moda este cea mai comună semnificație a unei caracteristici în unitățile unei anumite populații.

Nu există modă (toate valorile seriei sunt individuale).

Median... Mediana este valoarea unei caracteristici care împarte unitățile seriei clasate în două părți. Mediana corespunde variantei din mijlocul rândului clasat.

Găsim mijlocul seriei clasate: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Acest număr corespunde valorii seriei 76678. Prin urmare, mediana Me \u003d 76678

Indicatori de variație. Indicatori absoluți ai variației.

Gama de variație este diferența dintre valorile maxime și minime ale caracteristicii seriei primare.

R \u003d X max - X min.

R \u003d 249346-6536 \u003d 242810.

Abaterea liniară medie - calculat pentru a lua în considerare diferențele tuturor unităților din populația studiată.

Fiecare valoare a seriei diferă de cealaltă cu o medie de 79680,53.

Dispersie - caracterizează măsura dispersiei în jurul valorii sale medii (măsura dispersiei, adică abaterea de la medie).

Deviație standard (eroare medie de eșantionare).

Fiecare valoare a seriei diferă de valoarea medie de 99551,71 cu o medie de 87389,04.

Ratele relative de variație... Indicatorii relativi ai variației includ: coeficient de oscilație, coeficient de variație liniar, deviație liniară relativă.

Coeficientul de variație - o măsură a răspândirii relative a valorilor populației: arată cât din media acestei valori este răspândirea medie a acesteia.

Din moment ce v\u003e 70%, populația se apropie de marginea neomogenității, iar variația este puternică.

Coeficientul de variație este semnificativ mai mare de 33%. În consecință, setul considerat este eterogen și media pentru acesta nu este suficient de tipică. În acest caz, în cercetările practice, diferite metode statistice conduc totalitatea la o formă omogenă.

Coeficientul de variație liniar sau Abaterea liniară relativă - caracterizează ponderea valorii medii a semnului abaterilor absolute de la medie.

Coeficientul de oscilație - reflectă variabilitatea relativă a valorilor extreme ale caracteristicii în jurul mediei.

Media aritmetică simplă:

Modă... Moda este cea mai comună semnificație a unei caracteristici în unitățile unei anumite populații.

Nu există modă (toate valorile seriei sunt individuale).

Median... Mediana este valoarea unei caracteristici care împarte unitățile seriei clasate în două părți. Mediana corespunde variantei din mijlocul rândului clasat.

Găsim mijlocul seriei clasate: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Acest număr corespunde valorii seriei 76461. Prin urmare, mediana Me \u003d 76461.

Indicatori de variație. Indicatori absoluți ai variației.

Gama de variație este diferența dintre valorile maxime și minime ale caracteristicii seriei primare.

R \u003d X max - X min.

R \u003d 254722-6704 \u003d 248018.

Abaterea liniară medie - calculat pentru a lua în considerare diferențele tuturor unităților din populația studiată.

Fiecare valoare a seriei diferă de cealaltă cu o medie de 82302,82.

Dispersie - caracterizează măsura dispersiei în jurul valorii sale medii (măsura dispersiei, adică abaterea de la medie).

Deviație standard (eroare medie de eșantionare).

Fiecare valoare a seriei diferă de valoarea medie de 102346,71 cu o medie de 89787,88.

Ratele relative de variație... Indicatorii relativi ai variației includ: coeficient de oscilație, coeficient de variație liniar, deviație liniară relativă.

Coeficientul de variație - o măsură a răspândirii relative a valorilor populației: arată cât din media acestei valori este răspândirea medie a acesteia.

Din moment ce v\u003e 70%, populația se apropie de marginea neomogenității, iar variația este puternică.

Coeficientul de variație este semnificativ mai mare de 33%. În consecință, setul considerat este eterogen și media pentru acesta nu este suficient de tipică. În acest caz, în cercetările practice, diferite metode statistice conduc totalitatea la o formă omogenă.

Coeficientul de variație liniar sau Abaterea liniară relativă - caracterizează ponderea valorii medii a semnului abaterilor absolute de la medie.

Coeficientul de oscilație - reflectă variabilitatea relativă a valorilor extreme ale caracteristicii în jurul mediei.

Media aritmetică simplă:

Modă... Moda este cea mai comună semnificație a unei caracteristici în unitățile unei anumite populații.

Nu există modă (toate valorile seriei sunt individuale).

Median... Mediana este valoarea unei caracteristici care împarte unitățile seriei clasate în două părți. Mediana corespunde variantei din mijlocul rândului clasat.

Găsim mijlocul seriei clasate: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Acest număr corespunde valorii seriei 78959. Prin urmare, mediana Me \u003d 78959.

Indicatori de variație. Indicatori absoluți ai variației.

Gama de variație este diferența dintre valorile maxime și minime ale caracteristicii seriei primare.

R \u003d X max - X min.

R \u003d 261334-7635 \u003d 253699.

Abaterea liniară medie - calculat pentru a lua în considerare diferențele tuturor unităților din populația studiată.

Fiecare valoare a seriei diferă de cealaltă cu o medie de 83791,55.

Dispersie - caracterizează măsura dispersiei în jurul valorii sale medii (măsura dispersiei, adică abaterea de la medie).

Deviație standard (eroare medie de eșantionare).

Fiecare valoare a seriei diferă de media 104898,86 cu o medie de 91616,15.

Ratele relative de variație... Indicatorii relativi ai variației includ: coeficient de oscilație, coeficient de variație liniar, deviație liniară relativă.

Coeficientul de variație - o măsură a răspândirii relative a valorilor populației: arată cât din media acestei valori este răspândirea medie a acesteia.

Din moment ce v\u003e 70%, populația se apropie de marginea neomogenității, iar variația este puternică.

Coeficientul de variație este semnificativ mai mare de 33%. În consecință, setul considerat este eterogen și media pentru acesta nu este suficient de tipică. În acest caz, în cercetările practice, diferite metode statistice conduc totalitatea la o formă omogenă.

Coeficientul de variație liniar sau Abaterea liniară relativă - caracterizează ponderea valorii medii a semnului abaterilor absolute de la medie.

Coeficientul de oscilație - reflectă variabilitatea relativă a valorilor extreme ale caracteristicii în jurul mediei.

Media aritmetică simplă:

Modă... Moda este cea mai comună semnificație a unei caracteristici în unitățile unei anumite populații.

Nu există modă (toate valorile seriei sunt individuale).

Median... Mediana este valoarea unei caracteristici care împarte unitățile seriei clasate în două părți. Mediana corespunde variantei din mijlocul rândului clasat.

Găsim mijlocul seriei clasate: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Acest număr corespunde valorii seriei 75916. Prin urmare, mediana Me \u003d 75916.

Indicatori de variație. Indicatori absoluți ai variației.

Gama de variație este diferența dintre valorile maxime și minime ale caracteristicii seriei primare.

R \u003d X max - X min.

R \u003d 263863-8145 \u003d 255718.

Abaterea liniară medie - calculat pentru a lua în considerare diferențele tuturor unităților din populația studiată.

Fiecare valoare a seriei diferă de cealaltă cu o medie de 82767,96.

Dispersie - caracterizează măsura dispersiei în jurul valorii sale medii (măsura dispersiei, adică abaterea de la medie).

Deviație standard (eroare medie de eșantionare).

Fiecare valoare a seriei diferă de valoarea medie de 103440,71 cu o medie de 91207,92.

Ratele relative de variație... Indicatorii relativi ai variației includ: coeficient de oscilație, coeficient de variație liniar, deviație liniară relativă.

Coeficientul de variație - o măsură a răspândirii relative a valorilor populației: arată cât din media acestei valori este răspândirea medie a acesteia.

Din moment ce v\u003e 70%, populația se apropie de marginea neomogenității, iar variația este puternică.

Coeficientul de variație este semnificativ mai mare de 33%. În consecință, setul considerat este eterogen și media pentru acesta nu este suficient de tipică. În acest caz, în cercetările practice, diferite metode statistice conduc totalitatea la o formă omogenă.

Coeficientul de variație liniar sau Abaterea liniară relativă - caracterizează ponderea valorii medii a semnului abaterilor absolute de la medie.

Coeficientul de oscilație - reflectă variabilitatea relativă a valorilor extreme ale caracteristicii în jurul mediei.

Media aritmetică simplă:

Modă... Moda este cea mai comună semnificație a unei caracteristici în unitățile unei anumite populații.

Nu există modă (toate valorile seriei sunt individuale).

Median... Mediana este valoarea unei caracteristici care împarte unitățile seriei clasate în două părți. Mediana corespunde variantei din mijlocul rândului clasat.

Găsim mijlocul seriei clasate: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Acest număr corespunde valorii seriei 78019. Prin urmare, mediana Me \u003d 78019.

Indicatori de variație. Indicatori absoluți ai variației.

Gama de variație este diferența dintre valorile maxime și minime ale caracteristicii seriei primare.

R \u003d X max - X min

R \u003d 260094-7798 \u003d 252296.

Abaterea liniară medie - calculat pentru a lua în considerare diferențele tuturor unităților din populația studiată.

Fiecare valoare a seriei diferă de cealaltă cu o medie de 77827,76.

Dispersie - caracterizează măsura dispersiei în jurul valorii sale medii (măsura dispersiei, adică abaterea de la medie).

Deviație standard (eroare medie de eșantionare).

Fiecare valoare a seriei diferă de valoarea medie de 99212,29 cu o medie de 88081,39.

Ratele relative de variație... Indicatorii relativi ai variației includ: coeficient de oscilație, coeficient de variație liniar, deviație liniară relativă.

Coeficientul de variație - o măsură a răspândirii relative a valorilor populației: arată cât din media acestei valori este răspândirea medie a acesteia.

Din moment ce v\u003e 70%, populația se apropie de marginea neomogenității, iar variația este puternică.

Coeficientul de variație este semnificativ mai mare de 33%. În consecință, setul considerat este eterogen și media pentru acesta nu este suficient de tipică. În acest caz, în cercetările practice, diferite metode statistice conduc totalitatea la o formă omogenă.

Coeficientul de variație liniar sau Abaterea liniară relativă - caracterizează ponderea valorii medii a semnului abaterilor absolute de la medie.

Coeficientul de oscilație - reflectă variabilitatea relativă a valorilor extreme ale caracteristicii în jurul mediei.

Media aritmetică simplă:

Modă... Moda este cea mai comună semnificație a unei caracteristici în unitățile unei anumite populații.

Nu există modă (toate valorile seriei sunt individuale).

Median... Mediana este valoarea unei caracteristici care împarte unitățile seriei clasate în două părți. Mediana corespunde variantei din mijlocul rândului clasat.

Găsim mijlocul seriei clasate: h \u003d (n + 1) / 2 \u003d (7 + 1) / 2 \u003d 4. Acest număr corespunde valorii seriei 72248. Prin urmare, mediana Me \u003d 72248.

Indicatori de variație. Indicatori absoluți ai variației.

Gama de variație este diferența dintre valorile maxime și minime ale caracteristicii seriei primare.

R \u003d X max - X min.

R \u003d 242137-7173 \u003d 234964.

Abaterea liniară medie - calculat pentru a lua în considerare diferențele tuturor unităților din populația studiată.

Fiecare valoare a seriei diferă de cealaltă cu o medie de 70459,02.

Dispersie - caracterizează măsura dispersiei în jurul valorii sale medii (măsura dispersiei, adică abaterea de la medie).

Deviație standard (eroare medie de eșantionare).

Fiecare valoare a seriei diferă de valoarea medie de 91375,14 cu o medie de 80674,43.

Ratele relative de variație... Indicatorii relativi ai variației includ: coeficient de oscilație, coeficient de variație liniar, deviație liniară relativă.

Coeficientul de variație - o măsură a răspândirii relative a valorilor populației: arată cât din media acestei valori este răspândirea medie a acesteia.

Din moment ce v\u003e 70%, populația se apropie de marginea neomogenității, iar variația este puternică.

Coeficientul de variație este semnificativ mai mare de 33%. În consecință, setul considerat este eterogen și media pentru acesta nu este suficient de tipică. În acest caz, în cercetările practice, diferite metode statistice conduc totalitatea la o formă omogenă.

Coeficientul de variație liniar sau Abaterea liniară relativă - caracterizează ponderea valorii medii a semnului abaterilor absolute de la medie.

Coeficientul de oscilație - reflectă variabilitatea relativă a valorilor extreme ale caracteristicii în jurul mediei.

Problema 5

În condițiile sarcinii anterioare, efectuați o regrupare a intervalelor specificate ale termenilor pedepsei pentru a îmbunătăți indicatorii relativi ai variației trăsăturii în 2010. Trasați histogramele distribuției condamnaților în funcție de termenele de închisoare (pedeapsă) pentru 2010 înainte și după gruparea datelor și trageți concluzii cu privire la omogenitatea structurii caracteristicii statistice studiate.

Decizie:

Din moment ce v\u003e 30%, dar v<70 %, то вариация умеренная.

Coeficientul de variație este semnificativ mai mare de 33%. În consecință, setul considerat este eterogen și media pentru acesta nu este suficient de tipică.

Să rearanjăm datele după cum urmează:

Grupa 1) include grupuri: până la un an, un an, de la 1-3 ani, respectiv 156978.

Grupul 2) intră complet din grup peste 3 până la 5 ani și 1/5 din grup peste 5 până la 10 ani obținem 1/5 * 260094 + 168651 \u003d 220669,8.

Grupa 3) include 3 \\ 5 grupuri de la 5 la 10 adică 3 \\ 5 * 260094 \u003d 156056.4.

Grupa 4) (1 \\ 5 * 260094) + (1 \\ 5 * 78019) \u003d 67622.6.

Grupa 5) 3 \\ 5 * 78019 \u003d 46811.4.

Grupa 6 30744+ (1 \\ 5 * 78019) \u003d 46347,8.

Diagramă cu bare. Pentru a obține o concluzie despre omogenitatea caracteristicii statistice investigate, calculăm coeficientul de variație:

Din moment ce v\u003e 30%, dar v<70 %, то вариация умеренная.

Coeficientul de variație este semnificativ mai mare de 33%. În consecință, setul considerat este eterogen și media pentru acesta nu este suficient de tipică.

Problema 6

Descrieți într-o formă scurtă (teză, pe 1-2 pagini) conținutul și rezultatele unui studiu statistic oficial recent în sfera socială și juridică (sunt necesare subiecte - la alegerea dvs., link-uri către resurse Internet), trageți concluzii și prezentați ipoteze statistice adecvate pe termen scurt perspectivă.

Un studiu privind restanțele salariale începând cu 1 decembrie 2015 a fost luat ca studiu statistic oficial.

Începând cu 1 decembrie 2015, conform organizațiilor (care nu au legătură cu întreprinderile mici), datorii totale în ceea ce privește salariile în gama tipurilor observate de activitate economică s-au ridicat la 3900 milioane de rublepentru eași în comparație cu 1 noiembrie 2015 a crescut cu 395 milioane de ruble (11,3%).

Restanțe salariale restante din cauza lipsei fondurilor proprii ale organizațiilor începând cu 1 decembrie 2015 inventat 3818 milioane de rublepentru ea, sau 97,9% din suma totală a datoriilor restante. Comparativ cu 1 noiembrie 2015 a crescut cu 389 milioane de ruble (11,3%). Creanţă din cauza primirii cu întârziere a fondurilor de la bugete de toate nivelurile inventat 82 milioane de rublepentru ea și a crescut față de 1 noiembrie 2015. cu 6 milioane de ruble (cu 7,7%), inclusiv datoria din federal bugets-a ridicat la 62 de milioane de ruble și a scăzut față de 1 noiembrie 2015. cu 6 milioane de ruble (cu 8,6%), bugetele entităților constitutive ale Federației Ruses-a ridicat la 1,1 milioane de ruble (o creștere de 0,2 milioane de ruble sau 20,7%), bugetele locale - 19 milioane de ruble (o creștere de 12 milioane de ruble, sau de 2,5 ori).

În minerit, producție, asistență medicală și servicii sociale, pescuit și piscicultură, 100% din restanțele salariale restante se datorează lipsei de fonduri de la organizații.

În volumul total al restanțelor salariale restante, 37% se încadrează în industriile prelucrătoare, 29% - în construcții, 9% - în producția și distribuția de energie electrică, gaze și apă, 7% - în transporturi, 6% - în minerit, 5% - pentru agricultură, vânătoare și furnizarea de servicii în aceste zone, exploatare forestieră.

Volumul restanțelor salariale începând cu 1 decembrie 2015 a reprezentat mai puțin de 1% din fondul salarial lunar al angajaților din tipurile de activitate economică observate.

Restanțe salariale pentru ultima lună, pentru care s-au efectuat acumulări, în volumul total al datoriilor restante s-a ridicat la o medie de 29%: producția și distribuția de energie electrică, gaze și apă - 75%, activități în domeniul educației - 37%, asistență medicală și servicii sociale - 35%, cercetare și dezvoltare - 32%, construcții - 29%, transport - 23%, industria prelucrătoare - 22%.

Din suma totală a salariilor neplătite, datoriile formate în 2014 au reprezentat 457 milioane de ruble (11,7%). și mai devreme - 657 milioane de ruble (16,8%).

În general, observând imaginea arieratelor salariale în dinamică (http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image 5258.gif), putem concluziona că un declin semnificativ va avea loc în ianuarie , Februarie 2016.

Procentul principal al datoriilor scade asupra producției - 37%, 29% - pentru construcții, cel mai probabil acest lucru se datorează unei scăderi a cererii consumatorilor de produse, respectiv, scade profitul.

Să prezentăm o ipoteză. Din ianuarie 2016, procentul arieratelor va scădea, datorită distribuției bugetului anual pentru anul următor, luând în considerare rambursarea parțială a arieratelor salariale și se va ridica la 2.700 milioane dinamica mediană a variației criminalității

Pentru a testa ipoteza (luăm acest tabel ca bază http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image5258.gif).

Să construim o serie variațională discretă. Pentru a face acest lucru, să sortăm rândul în ordine crescătoare și să numărăm numărul de repetări pentru fiecare element al rândului.

Să calculăm media:

Să calculăm varianța. Dispersie - caracterizează măsura dispersiei în jurul valorii sale medii (măsura dispersiei, adică abaterea de la medie).

Folosind un test unilateral cu b \u003d 0,05, testați această ipoteză dacă, într-un eșantion de n \u003d 24 luni, media a fost 2741,25, iar varianța este cunoscută și este egală cu y \u003d 193469,27

Decizie... Deviație standard:

Se prezintă ipoteza nulă H 0 că valoarea așteptării matematice a populației generale este egală cu numărul m 0: \u003d 2700.

Ipoteză alternativă:

H 1: m? 2700, zona critică este bilaterală.

Pentru a testa ipoteza nulă, se utilizează o variabilă aleatorie:

unde x este media eșantionului; S este abaterea standard a populației generale.

Dacă ipoteza nulă este adevărată, atunci variabila aleatoare T are o distribuție normală standard. Valoarea critică a statisticii T este determinată pe baza tipului de ipoteză alternativă:

P (| T |

Găsiți valoarea experimentală a statisticii T:

Deoarece dimensiunea eșantionului este suficient de mare (n\u003e 30), atunci în loc de adevărata valoare a deviației standard, se poate folosi estimarea sa S \u003d 439.851.

Ф (t cr) \u003d (1-b) / 2 \u003d (1-0,05) / 2 \u003d 0,475.

Folosind tabelul funcției Laplace, găsim la care t kp valoarea lui Ф (t kp) \u003d 0,475.

Valoarea experimentală a criteriului T nu a intrat în regiunea critică T? t kp, prin urmare ar trebui acceptată ipoteza nulă. Valoarea așteptării matematice a populației generale poate fi luată egală cu 2700

Bibliografie

1. Kazantsev S.Ya. Statistici juridice: manual / Ed. S.Ya. Kazantsev, S. Ya. Lebedeva - M.: UNITY-DANA: Law and Law, 2009

2. Kurys? În K.N. Bazele statisticii juridice: manual. alocație / K.N. Kurys? VYUI FSIN al Rusiei. - Vladimir, 2005 .-- 44 p.

3. Makarova N.V. Statistici în Excel: manual. alocație / N.V. Makarova, V. Ya. Trofimete. - M.: Finanțe și statistici.

4. Kondratyuk L. V., Ovchinsky V. S. Dimensiune criminologică / ed. K.K. Goryainova. - M.: Norma, 2008.

5. Yakovlev VB Statistici. Calcule în Microsoft Excel: manual. Manual pentru universități / V.B. Yakovlev. - M.: Koloss, 2005 .-- 352 p.

Postat pe Allbest.ru

...

Documente similare

    Studiul delincvenței juvenile din punctul de vedere al obiectului cercetării criminologice. Relația dintre alcoolismul adolescenților, abuzul de substanțe, dependența de droguri și criminalitatea. Cauze și condiții și modalități de prevenire a delincvenței juvenile.

    hârtie pe termen adăugată la 04/08/2011

    Metodologia unei cercetări criminologice specifice. Caracteristicile criminologice ale criminalității violente și prevenirea acesteia. Pericolul social și gravitatea consecințelor infracțiunilor violente. Statistica criminalității.

    test, adăugat 15.01.2011

    Formula pentru calcularea ratei criminalității. Calculul sarcinii anuale medii pe judecător, durata medie a cercetării cauzelor penale, rata medie anuală a criminalității. Calculul indicatorilor modului, medianei, variației și abaterii standard.

    test, adăugat 20.04.2011

    Studiul bazelor crimei egoiste: concept, elemente, obiecte și aspecte subiective. Descrierea prevenirii criminalității sociale și speciale-criminologice din motive mercenare. Elaborarea unui set de măsuri pentru prevenirea infracțiunilor.

    teză, adăugată 11/09/2012

    Conceptul și subiectul prognozei criminologice. Stabilirea posibilelor schimbări în starea, nivelul, structura și dinamica criminalității în viitor. Evaluarea dezvoltării criminalității în viitor. Planificarea luptei împotriva criminalității, prevenirea acesteia.

    hârtie de termen, adăugată 29.05.2015

    Cercetarea tipurilor de prognoză și proiectare criminologică în domeniul criminalității. Caracteristici ale prezicerii delincvenței juvenile în Republica Kazahstan. Dezvoltarea de programe de combatere a criminalității la nivel național.

    teză, adăugată 25/10/2015

    Delincvența juvenilă ca obiect al cercetării criminologice. Caracteristici de bază, criminologice ale delincvenței juvenile. Starea infracțiunii. Caracteristicile caracteristicilor personale ale minorilor.

    rezumat, adăugat la 04/01/2003

    Tendințe în comportamentul criminal al femeilor moderne: creșterea și proporția constantă a infracțiunilor grave și recurente, întinerirea criminalilor și o creștere a numărului de femei în vârstă printre condamnate. Măsuri generale pentru prevenirea criminalității feminine.

    rezumat, adăugat 03/01/2014

    Calculul indicatorilor relativi ai structurii și coordonării categoriilor de condamnați în funcție de gravitatea infracțiunilor comise. Coeficienții infracțiunilor și condamnărilor de către districtele federale și din Rusia în ansamblu. Calculul indicatorilor dinamici utilizând MS Excel.

    test, adăugat 31.07.2011

    Conceptul, tipurile, semnificațiile, factorii determinanți ai infracțiunilor latente, motivele apariției acesteia, prevenirea și modalitățile de reducere. Determinarea nivelului și analiza structurii criminalității. O abordare sistematică a studiului criminalității latente ca fenomen social.


1. Valori medii: esență, valoare, tipuri

O contribuție importantă la fundamentarea și dezvoltarea teoriei valorilor medii a fost adusă de un om de știință proeminent al secolului al XIX-lea Adolphe Quetelet (1796-1874), membru al Academiei Belgiene de Științe, membru corespondent al Academiei de Științe din Petersburg.

valoarea medie - caracteristicile generalizatoare ale trăsăturii studiate la populația studiată. Acesta definește nivelul său tipic pe unitate de populație în condiții specifice de loc și timp.

valoarea medie numit întotdeauna, are aceeași dimensiune (unitate de măsură) ca atributul pentru unitățile individuale ale populației.

Principalul condiție pentru utilizarea științifică a mediei este omogenitatea calitativă a populației pentru care se calculează media.

    putere-lege (medie aritmetică, medie armonică, medie geometrică, medie pătrată, medie cubică);

    structural (modă, mediană).

Puterea medie - rădăcina gradului k din media tuturor opțiunilor luate k-Al grad, are următoarea formă:

unde este caracteristica prin care se găsește media se numește caracteristică medie,

x eu sau ( x 1 , x 2 ... X n) Este valoarea caracteristicii medii pentru fiecare unitate a populației,

f eu - repetabilitatea valorii individuale a atributului.

În funcție de grad k se obțin diferite tipuri de medii de putere, formulele de calcul pentru care sunt prezentate mai jos în Tabelul 1.

Tabelul 1 - Tipuri de medii de putere

Valoare k

Numele mediu

Formule medii

ponderat

Armonica medie

, w eu \u003d x eu F eu

Media geometrică

Media aritmetică

=

=

Rădăcină medie pătrată

=

=

f eu frecvența repetării valorii individuale a caracteristicii (greutatea acesteia)

Frecvența poate fi și greutate, adică raportul dintre rata de repetare a valorii atributului individual și suma frecvențelor:

Selectarea tipului de medie:

Media aritmetică simplă se folosește dacă valoarea individuală a unei trăsături în unități ale populației nu se repetă sau apare o dată sau același număr de ori, adică când media este calculată din date neagregate.

Când o valoare individuală a trăsăturii studiate apare de mai multe ori în unități ale populației studiate, atunci frecvența repetării valorilor individuale ale trăsăturii (greutatea) este prezentă în formulele calculate ale mediilor de putere. În acest caz, ele se numesc formule medii ponderate.

Dacă, în funcție de starea problemei, este necesar să rămâneți neschimbat atunci când calculați suma valorilor reciproce ale valorilor individuale ale atributului, atunci valoarea medie este medie armonică.

Dacă, atunci când înlocuiți valorile individuale ale unei caracteristici cu o valoare medie, este necesar să păstrați produsul valorilor individuale neschimbat, atunci ar trebui să aplicați medie geometrică... Media geometrică este utilizată pentru a calcula ratele medii de creștere în analiza seriilor temporale.

Dacă, atunci când înlocuiți valorile individuale ale unei caracteristici cu o valoare medie, este necesar să păstrați neschimbată suma pătratelor valorilor inițiale, atunci media va fi medie pătratică... Pătratul mediu rădăcină este utilizat pentru a calcula abaterea standard atunci când se analizează variația unei caracteristici din seria de distribuție.

Mijloacele de putere de diferite tipuri, calculate pentru aceeași populație, au cantități diferite și cu cât exponentul este mai mare k, cu atât este mai mare valoarea mediei corespunzătoare, dacă toate valorile inițiale ale caracteristicii sunt egale, atunci toate mediile sunt egale cu această constantă:

Garm. ≤ geom. ≤ aritmă. ≤ pătrat ≤ cubic

aceasta proprietate medie-putere se numește creștere cu o creștere a exponentului funcției determinante majoranți.

Mediile structurale sunt folosite atunci când calculul mijloacelor legii puterii este imposibil sau impracticabil.

Mediile structurale includ: modă și median.

Modă - aceasta este cea mai comună valoare a unei trăsături în unitățile unei populații date. Dacă există opțiuni și frecvențe în seria de distribuție, valoarea modului corespunde valorii caracteristicii pentru cel mai mare număr de unități (cea mai mare frecvență), adică pentru o serie de variații discrete, modul se găsește prin definiție.

Median - valoarea atributului pentru o unitate a populației din mijlocul seriei de distribuție clasată, atunci când toate valorile individuale ale atributului unităților studiate sunt aranjate în ordinea creșterii sau descreșterii lor.

În cazul unui număr impar de observații, mediana se găsește prin definiție, adică opțiune (Unde n - numărul de observații). Cu un număr par de observații, mediana este determinată de formula:

Pentru seria de distribuție a intervalelor, magnitudinea modului și a medianei sunt calculate prin următoarele formule:
;
,

unde: - marginea inferioară a intervalului modal sau median;

- dimensiunea intervalului;

și
- frecvențe care preced și urmează intervalul modal;

- frecvența intervalului modal sau median;

- suma frecvențelor acumulate în intervalele premergătoare medianei.

Calculul medianei din datele negroupate este după cum urmează:

1. Valorile individuale ale caracteristicii sunt aranjate în ordine crescătoare. 2. Se determină numărul ordinal al medianei Nu. Eu \u003d (n+1) / 2

    Indicatori de variație, esență, valoare, tipuri. Legile variației

Diferiti indicatori absoluti si relativi sunt folositi pentru a masura variatia unei caracteristici.

Indicatorii absoluți (măsura) variației includ: gama de fluctuații, deviația absolută medie, varianța, abaterea standard.

Variație de glisare Este diferența dintre valorile maxime și minime ale caracteristicii:
.

Gama de variație arată măsura în care variază dimensiunea trăsăturii care formează seria de distribuție.

Deviația absolută medie (SAO) - media valorilor absolute ale abaterilor variantei individuale față de medie.

(simplu),
(ponderat)

Dispersie- media pătratelor abaterilor opțiunilor pentru valorile atributului de la valoarea lor medie:

(simplu),
(ponderat)

Varianța poate fi descompusă în elementele sale constitutive, ceea ce face posibilă evaluarea influenței diferiților factori care determină variația trăsăturii.

acestea. varianța este egală cu diferența dintre pătratul mediu al valorilor atributului și pătratul mediei.

Proprietăți de dispersie, permițând simplificarea modului de calcul:

    Varianța constantei este 0.

    Dacă toate variantele valorilor caracteristice sunt reduse cu același număr de ori, atunci varianța nu va scădea.

    Dacă toate variantele valorilor caracteristice sunt reduse cu același număr de ori ( k ori), atunci varianța va scădea cu k 2 timp.

Deviație standard (RMS) este rădăcina pătrată a varianței, arată cât de mult fluctuează valoarea trăsăturii în medie în unitățile populației studiate: =

RMS este o măsură a fiabilității. Cu cât deviația standard este mai mică, cu atât media aritmetică reflectă mai bine întreaga populație reprezentată.

Gama de variație, CAO, RMS sunt numite cantități, adică au aceleași unități de măsură ca valorile caracteristice individuale.

Există 4 tipuri de dispersie: generală, intergrup, intragrup, grup.

Se numește varianța calculată pentru întreaga populație ca întreg varianța totală. Măsoară variabilitatea unei caracteristici dependente (rezultante) cauzată de acțiunea asupra ei a tuturor factorilor fără excepție.

Varianța totală este egală cu suma mediei variațiilor intragrup și intergrup:

Dacă populația este împărțită în grupuri, atunci pentru fiecare grup se poate determina propria varianță, care caracterizează variația din cadrul grupului. Varianța grupului - abateri standard de la media grupului, adică din valoarea medie a caracteristicii din acest grup.

undej - număr de serie x și f în cadrul grupului.

Varianța grupului caracterizează variația unei trăsături dintr-un grup datorită tuturor celorlalți factori, cu excepția celui de la baza grupării.

ȘI măsurarea variației asupra populației în ansamblu se calculează ca media varianței intragrup:

unde sunt varianțele grupului,

n j - numărul de unități în grupuri.

Mediile de grup diferă între ele și de media generală, adică varia. Variația lor se numește variație intergrup. Pentru a o caracteriza, calculați pătratul mediu al abaterilor mediei grupului față de media totală:

unde j medii de grup, - media generală, n j - numărul de unități din grup.

Varianța intergrupului (varianța mijloacelor de grup) măsoară variația atributului rezultat datorită atributului factorial care stă la baza grupării.

Când se compară variabilitatea diferitelor caracteristici din aceeași populație sau când se compară variabilitatea aceluiași atribut în mai multe agregate cu valori diferite ale mediei aritmetice, se utilizează indicatori relativi de variație.

Acești indicatori sunt calculați ca raportul dintre indicatorii absoluți de variație și media aritmetică (sau mediană)

Coeficientul de variație

Abaterea liniară relativă

Coeficientul de oscilație

Cea mai frecvent utilizată măsură a volatilității relative este coeficientul de variație, care arată abaterea medie de la valoarea medie a caracteristicii în procente.

Se folosește pentru: evaluarea comparativă a variației; caracteristicile omogenității populației. Populația este considerată omogenă dacă coeficientul de variație nu depășește 33%, adică mai puțin de 33%.

Z acte de variație.

Legea variației valorilor individuale ale unei caracteristici sau „regula celor trei sigme”. Statisticianul belgian A. Quetelet a descoperit că variațiile unor fenomene de masă respectă legea distribuției erorilor descoperite de K. Gauss și P. Laplace aproape simultan. Curba care reprezintă această distribuție arată ca un clopot (Fig. 2).

De lege normala (termenul a fost propus de statisticianul englez K. Pearson) distribuție variabilitatea valorilor individuale ale caracteristicii este înăuntru
(regula celor trei sigme).

Proprietățile naturale ale unei persoane (înălțime, greutate, rezistență fizică), caracteristicile produselor industriale (dimensiune, greutate, rezistență electrică, elasticitate etc.) respectă legea distribuției normale. În sfera fenomenelor sociale care se schimbă rapid, efectul acestei legi este relativ rar. Cu toate acestea, în unele cazuri, folosind trei reguli sigmapractic posibil.

Legea variației valorilor medii. Variația valorilor medii este mai mică decât variația valorilor individuale ale trăsăturii. Valorile medii ale caracteristicii variază în:
Unde n - Număr de unități.