Průměrný. Stanovení průměru, variace a tvaru rozdělení

Průměrný plat... Průměrná délka života... Téměř každý den slýcháme tyto fráze používané k popisu velkého množství jediným číslem. Ale kupodivu je "průměrná hodnota" poněkud zákeřný pojem, často zavádějící obyčejného člověka, který nemá zkušenosti s matematickými statistikami.

Co je za problém?

Průměrnou hodnotou se nejčastěji rozumí aritmetický průměr, který se pod vlivem jednotlivých skutečností nebo událostí značně mění. A nezískáte skutečnou představu o tom, jak přesně jsou distribuovány hodnoty, které se učíte.

Vezměme si klasický příklad průměrné mzdy.

Abstraktní společnost má deset zaměstnanců. Devět z nich pobírá plat asi 50 000 rublů a jeden 1 500 000 rublů (zvláštní shodou okolností je zároveň generálním ředitelem této společnosti).

Průměrná hodnota v tomto případě bude 195 150 rublů, což, jak vidíte, je špatné.

Jaké jsou způsoby výpočtu průměru?

Prvním způsobem je výpočet již zmíněného aritmetický průměr, což je součet všech hodnot dělený jejich počtem.

  • x – aritmetický průměr;
  • x n - specifická hodnota;
  • n - počet hodnot.
  • Funguje dobře s normálním rozložením hodnot ve vzorku;
  • Snadný výpočet;
  • Intuitivní.
  • Nedává skutečnou představu o rozložení hodnot;
  • Nestabilní množství, které se snadno vyhodí (jako v případě generálního ředitele).

Druhým způsobem je výpočet móda, což je nejčastěji se vyskytující hodnota.

  • M 0 - režim;
  • x0 je dolní mez intervalu, který obsahuje režim;
  • n je hodnota intervalu;
  • f m - frekvence (kolikrát se určitá hodnota vyskytuje v řadě);
  • f m-1 - frekvence intervalu předcházejícího modálu;
  • f m+1 je frekvence intervalu následujícího za modálem.
  • Skvělé pro získání pocitu veřejného mínění;
  • Dobré pro nečíselné údaje (barvy sezóny, bestsellery, hodnocení);
  • Snadno pochopitelné.
  • Móda možná prostě neexistuje (žádné opakování);
  • Může existovat několik režimů (multimodální distribuce).

Třetím způsobem je výpočet mediány, tedy hodnota, která rozděluje uspořádaný vzorek na dvě poloviny a leží mezi nimi. A pokud taková hodnota neexistuje, pak se jako medián bere aritmetický průměr mezi hranicemi polovin vzorku.

  • Me je medián;
  • x0 je dolní mez intervalu, který obsahuje medián;
  • h je hodnota intervalu;
  • f i - frekvence (kolikrát se určitá hodnota vyskytuje v řadě);
  • S m-1 - součet četností intervalů předcházejících mediánu;
  • f m je počet hodnot ve středním intervalu (jeho frekvence).
  • Poskytuje nejrealističtější a nejreprezentativnější odhad;
  • Odolný vůči emisím.
  • Výpočet je obtížnější, protože vzorek musí být objednán před výpočtem.

Zvažovali jsme základní metody pro zjištění průměrné hodnoty, tzv opatření centrální tendence(ve skutečnosti je jich více, ale tyto jsou nejoblíbenější).

Nyní se vraťme k našemu příkladu a vypočítejme všechny tři varianty průměru pomocí speciálních funkcí Excelu:

  • AVERAGE(číslo1;[číslo2];…) — funkce pro určení aritmetického průměru;
  • FASHION.ONE(číslo1,[číslo2],...) - módní funkce (starší verze Excelu používaly FASHION(číslo1,[číslo2],...));
  • MEDIAN(číslo1;[číslo2];...) je funkce pro nalezení mediánu.

A zde jsou hodnoty, které máme:

Režim a medián v tomto případě mnohem lépe charakterizují průměrnou mzdu ve firmě.

Ale co dělat, když ve vzorku není 10 hodnot jako v příkladu, ale miliony? V Excelu to nelze spočítat, ale v databázi, kde jsou vaše data uložena, žádný problém.

Vypočítejte aritmetický průměr v SQL

Zde je vše docela jednoduché, protože SQL poskytuje speciální agregační funkci AVG .

A k jeho použití stačí napsat následující dotaz:

Výpočet režimu v SQL

SQL nemá samostatnou funkci pro nalezení režimu, ale můžete si ji snadno a rychle napsat sami. K tomu musíme zjistit, který z platů se nejčastěji opakuje a vybrat ten nejoblíbenější.

Napíšeme dotaz:

/* S VAZBAMI musí být přidáno k TOP(), pokud je sada multimodální, což znamená, že sada má více režimů */ VYBERTE NEJLEPŠÍ(1) S VAZBAMI plat JAKO "Mzdový režim" OD zaměstnanců SESKUPIT PODLE platu POŘADÍ PODLE POČTU(*) DESC

Vypočítejte medián v SQL

Stejně jako u módy nemá SQL vestavěnou funkci pro výpočet mediánu, ale má obecnou funkci pro výpočet percentilů PERCENTILE_CONT .

Všechno to vypadá takto:

/* V tomto případě bude 0,5 percentilem medián */ VYBERTE TOP(1) PERCENTILE_CONT(0,5) V RÁMCI SKUPINY (POŘADÍTE PODLE platu) NAD() JAKO "střední plat" OD zaměstnanců

Více o práci funkce PERCENTILE_CONT je lepší si přečíst v nápovědě Microsoftu a Google BigQuery .

Jaký způsob vůbec použít?

Z výše uvedeného vyplývá, že medián je nejlepší způsob, jak vypočítat průměrnou hodnotu.

Ale není tomu tak vždy. Pokud pracujete s průměrem, pak si dejte pozor na multimodální distribuci:

Graf ukazuje bimodální rozdělení se dvěma píky. Taková situace může nastat například při hlasování ve volbách.

V tomto případě jsou aritmetický průměr a medián hodnoty někde uprostřed a neřeknou nic o tom, co se skutečně děje, a je lepší okamžitě rozpoznat, že máte co do činění s bimodální distribucí nahlášením dvou režimů.

Ještě lépe, rozdělte vzorek do dvou skupin a pro každou shromážděte statistická data.

Závěr:

Při výběru metody pro zjištění průměru je nutné vzít v úvahu přítomnost odlehlých hodnot a také normální rozložení hodnot ve vzorku.

Konečná volba míry centrálního trendu je vždy na analytikovi.

Aritmetický průměr – statistický ukazatel, který ukazuje průměrnou hodnotu daného pole dat. Takový ukazatel se vypočítá jako zlomek, jehož čitatel je součtem všech hodnot pole a jmenovatelem je jejich počet. Aritmetický průměr je důležitý koeficient, který se používá při výpočtech domácností.

Význam koeficientu

Aritmetický průměr je základním ukazatelem pro porovnání dat a výpočet přijatelné hodnoty. Například plechovka piva od určitého výrobce se prodává v různých obchodech. Ale v jednom obchodě to stojí 67 rublů, v jiném - 70 rublů, ve třetím - 65 rublů a v posledním - 62 rublů. Existuje poměrně velký rozsah cen, takže kupujícího bude zajímat průměrná cena plechovky, aby při nákupu produktu mohl porovnat své náklady. V průměru má plechovka piva ve městě cenu:

Průměrná cena = (67 + 70 + 65 + 62) / 4 = 66 rublů.

Když znáte průměrnou cenu, je snadné určit, kde je výhodné nakupovat zboží a kde budete muset přeplatit.

Aritmetický průměr se neustále používá ve statistických výpočtech v případech, kdy je analyzován homogenní soubor dat. Ve výše uvedeném příkladu se jedná o cenu plechovky piva stejné značky. Nemůžeme však porovnávat cenu piva od různých výrobců nebo ceny piva a limonády, protože v tomto případě bude rozptyl hodnot větší, průměrná cena bude rozmazaná a nespolehlivá a samotný smysl výpočtů bude zkreslena na karikaturu „průměrná teplota v nemocnici“. Pro výpočet heterogenních datových polí se používá aritmetický vážený průměr, kdy každá hodnota obdrží svůj vlastní váhový faktor.

Výpočet aritmetického průměru

Vzorec pro výpočty je velmi jednoduchý:

P = (a1 + a2 + … an) / n,

kde a je hodnota veličiny, n je celkový počet hodnot.

K čemu lze tento ukazatel použít? První a zřejmé použití je ve statistice. Téměř každá statistická studie používá aritmetický průměr. Může to být průměrný věk sňatku v Rusku, průměrná známka studenta z předmětu nebo průměrná útrata za potraviny za den. Jak bylo uvedeno výše, bez zohlednění vah může výpočet průměrů poskytnout podivné nebo absurdní hodnoty.

Například prezident Ruské federace prohlásil, že podle statistik je průměrný plat Rusa 27 000 rublů. Většině lidí v Rusku se tato výše platu zdála absurdní. Není divu, pokud výpočet zohledňuje příjmy oligarchů, šéfů průmyslových podniků, velkých bankéřů na jedné straně a platy učitelů, uklízeček a prodavačů na straně druhé. Dokonce i průměrné platy v jedné specializaci, například účetní, budou mít vážné rozdíly v Moskvě, Kostromě a Jekatěrinburgu.

Jak vypočítat průměry pro heterogenní data

Ve mzdových situacích je důležité zvážit váhu každé hodnoty. To znamená, že platům oligarchů a bankéřů by byla dána váha např. 0,00001 a platům prodejců 0,12. Jsou to čísla ze stropu, ale zhruba ilustrují převahu oligarchů a prodejců v ruské společnosti.

Aby bylo možné vypočítat průměr průměrů nebo průměrnou hodnotu v poli heterogenních dat, je nutné použít aritmetický vážený průměr. Jinak dostanete průměrný plat v Rusku na úrovni 27 000 rublů. Pokud chcete znát svou průměrnou známku z matematiky nebo průměrný počet vstřelených branek vybraného hokejisty, pak se vám bude hodit kalkulačka aritmetického průměru.

Náš program je jednoduchý a pohodlný kalkulátor pro výpočet aritmetického průměru. K provedení výpočtů stačí zadat hodnoty parametrů.

Podívejme se na pár příkladů

Výpočet průměrné známky

Mnoho učitelů používá k určení roční známky z předmětu metodu aritmetického průměru. Představme si, že dítě dostane z matematiky tyto čtvrtletní známky: 3, 3, 5, 4. Jakou roční známku mu dá učitel? Použijeme kalkulačku a vypočítáme aritmetický průměr. Nejprve vyberte příslušný počet polí a do zobrazených buněk zadejte hodnoty známek:

(3 + 3 + 5 + 4) / 4 = 3,75

Učitel hodnotu zaokrouhlí ve prospěch žáka a žák dostane solidní čtyřku za ročník.

Výpočet snědených sladkostí

Pojďme si ukázat nějakou absurditu aritmetického průměru. Představte si, že Máša a Vova měli 10 sladkostí. Máša snědla 8 bonbónů a Vova jen 2. Kolik bonbónů snědlo v průměru každé dítě? Pomocí kalkulačky lze snadno spočítat, že děti v průměru snědly každé 5 sladkostí, což je naprosto nepravdivé a zdravé. Tento příklad ukazuje, že aritmetický průměr je důležitý pro smysluplné datové sady.

Závěr

Výpočet aritmetického průměru je široce používán v mnoha vědeckých oborech. Tento ukazatel je oblíbený nejen ve statistických výpočtech, ale také ve fyzice, mechanice, ekonomii, medicíně nebo financích. Využijte naše kalkulačky jako pomocníka při řešení problémů s aritmetickým průměrem.

Pamatovat si!

Na najít aritmetický průměr, musíte sečíst všechna čísla a vydělit jejich součet jejich číslem.


Najděte aritmetický průměr 2, 3 a 4 .

Označme aritmetický průměr písmenem „m“. Podle výše uvedené definice najdeme součet všech čísel.


Výslednou částku vydělte počtem odebraných čísel. Máme tři čísla.

V důsledku toho dostáváme vzorec aritmetického průměru:


K čemu je aritmetický průměr?

Kromě toho, že je neustále nabízeno k nalezení ve třídě, je hledání aritmetického průměru v životě velmi užitečné.

Rozhodnete se například prodávat fotbalové míče. Jelikož jste ale v tomto oboru nováčkem, je zcela nepochopitelné, za jakou cenu míčky prodáváte.

Pak se rozhodnete zjistit, za jakou cenu již vaši konkurenti prodávají fotbalové míče ve vašem okolí. Zjistěte si ceny v obchodech a udělejte si tabulku.

Ceny za míče v obchodech se ukázaly být značně odlišné. Jakou cenu bychom měli zvolit, abychom prodali fotbalový míč?

Pokud zvolíme nejnižší (290 rublů), pak zboží prodáme se ztrátou. Pokud zvolíte nejvyšší (360 rublů), kupující od nás nebudou kupovat fotbalové míče.

Potřebujeme průměrnou cenu. Tady přichází na pomoc průměrný.

Vypočítejte aritmetický průměr cen za fotbalové míče:

průměrná cena =

290 + 360 + 310
3
=
960
3
= 320 třít.

Tak jsme dostali průměrnou cenu (320 rublů), za kterou můžeme prodat fotbalový míč ne příliš levně a ne příliš draho.

Průměrná rychlost pohybu

S aritmetickým průměrem úzce souvisí pojem průměrná rychlost.

Při sledování pohybu dopravy ve městě můžete vidět, že auta buď zrychlují a jedou vysokou rychlostí, pak zpomalují a jedou nízkou rychlostí.

Takových úseků je na trase vozidel mnoho. Proto se pro usnadnění výpočtů používá koncept průměrné rychlosti.

Pamatovat si!

Průměrná rychlost pohybu je celková ujetá vzdálenost dělená celkovou dobou pohybu.

Zvažte problém pro průměrnou rychlost.

Úkol číslo 1503 z učebnice "Vilenkin Grade 5"

Auto jelo 3,2 hodiny po dálnici rychlostí 90 km/h, poté 1,5 hodiny po polní cestě rychlostí 45 km/h a nakonec 0,3 hodiny po polní cestě rychlostí 30 km/h. Najděte průměrnou rychlost auta za celou cestu.

Pro výpočet průměrné rychlosti pohybu potřebujete znát celou vzdálenost ujetou autem a celou dobu, po kterou se auto pohybovalo.

S 1 \u003d V 1 t 1

S 1 \u003d 90 3,2 \u003d 288 (km)

- Dálnice.

S 2 \u003d V 2 t 2

S 2 \u003d 45 1,5 \u003d 67,5 (km) - polní cesta.

S 3 \u003d V 3 t 3

S 3 \u003d 30 0,3 \u003d 9 (km) - venkovská silnice.

S = Si + S2 + S3

S \u003d 288 + 67,5 + 9 \u003d 364,5 (km) - celá cesta ujetá autem.

T \u003d t 1 + t 2 + t 3

T \u003d 3,2 + 1,5 + 0,3 \u003d 5 (h) - po celou dobu.

V cf \u003d S: t

V cf \u003d 364,5: 5 \u003d 72,9 (km / h) - průměrná rychlost vozu.

Odpověď: V av = 72,9 (km / h) - průměrná rychlost vozu.

V matematice je aritmetický průměr čísel (nebo jednoduše průměr) součtem všech čísel v daném souboru dělený jejich počtem. Toto je nejobecnější a nejrozšířenější koncept průměrné hodnoty. Jak jste již pochopili, abyste našli průměrnou hodnotu, musíte sečíst všechna čísla, která vám byla poskytnuta, a vydělit výsledek počtem členů.

Jaký je aritmetický průměr?

Podívejme se na příklad.

Příklad 1. Jsou uvedena čísla: 6, 7, 11. Musíte zjistit jejich průměrnou hodnotu.

Řešení.

Nejprve najdeme součet všech zadaných čísel.

Nyní výsledný součet vydělíme počtem členů. Protože máme tři členy, budeme dělit třemi.

Proto je průměr čísel 6, 7 a 11 8. Proč 8? Ano, protože součet 6, 7 a 11 bude stejný jako tři osmičky. To je jasně vidět na obrázku.

Průměrná hodnota tak trochu připomíná „zarovnání“ řady čísel. Jak vidíte, hromady tužek se staly jednou úrovní.

Zvažte další příklad pro upevnění získaných znalostí.

Příklad 2 Jsou uvedena čísla: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Musíte najít jejich aritmetický průměr.

Řešení.

Najdeme součet.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Vydělte počtem termínů (v tomto případě 15).

Proto je průměrná hodnota této řady čísel 22.

Nyní zvažte záporná čísla. Připomeňme si, jak je shrnout. Například máte dvě čísla 1 a -4. Pojďme najít jejich součet.

1 + (-4) = 1 – 4 = -3

Když to víte, zvažte další příklad.

Příklad 3 Najděte průměrnou hodnotu řady čísel: 3, -7, 5, 13, -2.

Řešení.

Hledání součtu čísel.

3 + (-7) + 5 + 13 + (-2) = 12

Protože existuje 5 členů, vydělíme výsledný součet 5.

Proto je aritmetický průměr čísel 3, -7, 5, 13, -2 2,4.

V naší době technologického pokroku je pro zjištění průměrné hodnoty mnohem pohodlnější použít počítačové programy. Jedním z nich je Microsoft Office Excel. Najít průměr v Excelu je rychlé a snadné. Navíc je tento program součástí softwarového balíčku od Microsoft Office. Zvažte stručný návod, jak pomocí tohoto programu najít aritmetický průměr.

Abyste mohli vypočítat průměrnou hodnotu řady čísel, musíte použít funkci AVERAGE. Syntaxe této funkce je:
=Průměr(argument1, argument2, ... argument255)
kde argument1, argument2, ... argument255 jsou buď čísla, nebo odkazy na buňky (buňky znamenají rozsahy a pole).

Aby to bylo jasnější, otestujme si získané znalosti.

  1. Do buněk C1 - C6 zadejte čísla 11, 12, 13, 14, 15, 16.
  2. Vyberte buňku C7 kliknutím na ni. V této buňce zobrazíme průměrnou hodnotu.
  3. Klikněte na záložku "Vzorce".
  4. Vyberte Další funkce > Statistické pro otevření rozevíracího seznamu.
  5. Vyberte PRŮMĚRNÝ. Poté by se mělo otevřít dialogové okno.
  6. Vyberte a přetáhněte buňky C1-C6 a nastavte rozsah v dialogovém okně.
  7. Potvrďte své akce tlačítkem "OK".
  8. Pokud jste vše udělali správně, v buňce C7 byste měli mít odpověď - 13.7. Po kliknutí na buňku C7 se v řádku vzorců zobrazí funkce (=Průměr(C1:C6)).

Tuto funkci je velmi užitečné použít pro účetnictví, faktury, nebo když potřebujete jen zjistit průměr z velmi dlouhého rozsahu čísel. Proto se často používá v kancelářích a velkých společnostech. To umožňuje udržovat v evidenci pořádek a umožňuje rychle něco spočítat (například průměrný příjem za měsíc). Můžete také použít Excel k nalezení střední hodnoty funkce.

Průměrný

Tento termín má jiné významy, viz průměrný význam.

Průměrný(v matematice a statistice) množiny čísel - součet všech čísel dělený jejich počtem. Je to jedno z nejběžnějších měřítek centrální tendence.

To bylo navrženo (spolu s geometrickým průměrem a harmonickým průměrem) Pythagorejci.

Zvláštními případy aritmetického průměru jsou průměr (obecné populace) a výběrový průměr (vzorků).

Úvod

Označte sadu dat X = (X 1 , X 2 , …, X n), pak se průměr vzorku obvykle označuje vodorovným pruhem nad proměnnou (x ¯ (\displaystyle (\bar (x))) , vyslovováno " X s pomlčkou").

Řecké písmeno μ se používá k označení aritmetického průměru celé populace. Pro náhodnou veličinu, pro kterou je definována střední hodnota, je μ pravděpodobnost střední nebo matematické očekávání náhodné veličiny. Pokud je sada X je soubor náhodných čísel se střední pravděpodobností μ, pak pro libovolný vzorek X i z této kolekce μ = E( X i) je očekávání tohoto vzorku.

V praxi je rozdíl mezi μ a x ¯ (\displaystyle (\bar (x))) v tom, že μ je typická proměnná, protože můžete vidět spíše vzorek než celou populaci. Pokud je tedy vzorek reprezentován náhodně (z hlediska teorie pravděpodobnosti), pak x ¯ (\displaystyle (\bar (x))) (ale ne μ) lze považovat za náhodnou proměnnou s rozdělením pravděpodobnosti na vzorku ( rozdělení pravděpodobnosti střední hodnoty).

Obě tyto veličiny se počítají stejným způsobem:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\součet _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Li X je náhodná veličina, pak matematické očekávání X lze považovat za aritmetický průměr hodnot při opakovaném měření veličiny X. To je projev zákona velkých čísel. Proto se k odhadu neznámého matematického očekávání používá výběrový průměr.

V elementární algebře je dokázáno, že střední n+ 1 číslo nad průměrem nčísla tehdy a jen tehdy, když je nové číslo větší než starý průměr, menší tehdy a jen tehdy, když je nové číslo menší než průměr, a nemění se právě tehdy, když je nové číslo rovno průměru. Více n, tím menší je rozdíl mezi novým a starým průměrem.

Všimněte si, že je k dispozici několik dalších „průměrů“, včetně mocninného průměru, Kolmogorova průměru, harmonického průměru, aritmeticko-geometrického průměru a různých vážených průměrů (např. aritmeticky vážený průměr, geometricky vážený průměr, harmonický vážený průměr) .

Příklady

  • Pro tři čísla je třeba je sečíst a vydělit 3:
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • Pro čtyři čísla je třeba je sečíst a vydělit 4:
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Nebo snadněji 5+5=10, 10:2. Protože jsme sečetli 2 čísla, což znamená, že kolik čísel sečteme, tolik vydělíme.

Spojitá náhodná veličina

Pro spojitě rozloženou hodnotu f (x) (\displaystyle f(x)) je aritmetický průměr na intervalu [ a ; b ] (\displaystyle ) je definován pomocí určitého integrálu:

F (x) ¯ [ a ; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Některé problémy s používáním průměru

Nedostatek robustnosti

Hlavní článek: Robustnost ve statistice

Ačkoli se aritmetický průměr často používá jako průměr nebo centrální trendy, tento koncept se nevztahuje na robustní statistiky, což znamená, že aritmetický průměr je silně ovlivněn „velkými odchylkami“. Je pozoruhodné, že pro distribuce s velkou šikmostí nemusí aritmetický průměr odpovídat pojmu „průměr“ a hodnoty průměru z robustních statistik (například medián) mohou lépe popisovat centrální trend.

Klasickým příkladem je výpočet průměrného příjmu. Aritmetický průměr může být chybně interpretován jako medián, což může vést k závěru, že existuje více lidí s vyšším příjmem, než ve skutečnosti je. „Průměrný“ příjem je interpretován tak, že příjmy většiny lidí se tomuto číslu blíží. Tento „průměrný“ (ve smyslu aritmetického průměru) příjem je vyšší než příjem většiny lidí, protože vysoký příjem s velkou odchylkou od průměru aritmetický průměr silně zkresluje (naproti tomu medián příjmu „odolává“ taková šikmost). Tento „průměrný“ příjem však neříká nic o počtu lidí blízko středního příjmu (a neříká nic o počtu lidí blízko modálního příjmu). Pokud se však pojmy „průměr“ a „většina“ vezmou na lehkou váhu, pak lze nesprávně dojít k závěru, že většina lidí má příjmy vyšší, než ve skutečnosti jsou. Například zpráva o „průměrném“ čistém příjmu v Medině ve Washingtonu, vypočítaném jako aritmetický průměr všech ročních čistých příjmů obyvatel, dá díky Billu Gatesovi překvapivě vysoké číslo. Zvažte vzorek (1, 2, 2, 2, 3, 9). Aritmetický průměr je 3,17, ale pět ze šesti hodnot je pod tímto průměrem.

Složené úročení

Hlavní článek: ROI

Pokud čísla násobit, ale ne složit, musíte použít geometrický průměr, ne aritmetický průměr. Nejčastěji se tento incident stane při výpočtu návratnosti investice do financí.

Pokud například akcie klesly o 10 % v prvním roce a vzrostly o 30 % ve druhém roce, pak je nesprávné vypočítat „průměrný“ nárůst za tyto dva roky jako aritmetický průměr (-10 % + 30 %) / 2 = 10 %; správný průměr je v tomto případě dán složeným ročním tempem růstu, z něhož je roční růst jen asi 8,16653826392 % ≈ 8,2 %.

Důvodem je, že procenta mají pokaždé nový výchozí bod: 30 % je 30 % z nižšího počtu, než byla cena na začátku prvního roku: pokud akcie začínaly na 30 USD a klesly o 10 %, mají na začátku druhého roku hodnotu 27 USD. Pokud akcie vzrostou o 30 %, na konci druhého roku mají hodnotu 35,1 USD. Aritmetický průměr tohoto růstu je 10 %, ale protože akcie vzrostly pouze o 5,1 USD za 2 roky, průměrný nárůst o 8,2 % dává konečný výsledek 35,1 USD:

[30 $ (1 - 0,1) (1 + 0,3) = 30 $ (1 + 0,082) (1 + 0,082) = 35,1 $]. Pokud stejným způsobem použijeme aritmetický průměr 10 %, nedostaneme skutečnou hodnotu: [30 $ (1 + 0,1) (1 + 0,1) = 36,3 $].

Složený úrok na konci roku 2: 90 % * 130 % = 117 % , tj. celkový nárůst o 17 % a průměrný roční složený úrok je 117 % ≈ 108,2 % (\displaystyle (\sqrt (117\%)) \cca 108,2\%), což je průměrný roční nárůst o 8,2%.

Pokyny

Hlavní článek: Statistiky destinací

Při výpočtu aritmetického průměru nějaké proměnné, která se cyklicky mění (například fáze nebo úhel), je třeba věnovat zvláštní pozornost. Například průměr 1° a 359° by byl 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Toto číslo je nesprávné ze dvou důvodů.

  • Za prvé, úhlové míry jsou definovány pouze pro rozsah od 0° do 360° (nebo od 0 do 2π při měření v radiánech). Stejný pár čísel tedy mohl být zapsán jako (1° a -1°) nebo jako (1° a 719°). Průměry každého páru se budou lišit: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2))= 0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\circ )) .
  • Za druhé, v tomto případě by hodnota 0° (ekvivalent 360°) byla geometricky nejlepším průměrem, protože čísla se od 0° odchylují méně než od jakékoli jiné hodnoty (hodnota 0° má nejmenší rozptyl). Porovnat:
    • číslo 1° se odchyluje od 0° pouze o 1°;
    • číslo 1° se odchyluje od vypočteného průměru 180° o 179°.

Průměrná hodnota pro cyklickou proměnnou, vypočtená podle výše uvedeného vzorce, bude uměle posunuta vzhledem ke skutečnému průměru do středu číselného rozsahu. Z tohoto důvodu se průměr počítá jiným způsobem, a to číslo s nejmenším rozptylem (středový bod) jako průměrná hodnota. Místo odečítání se také používá modulo vzdálenost (tj. obvodová vzdálenost). Například modulární vzdálenost mezi 1° a 359° je 2°, nikoli 358° (na kruhu mezi 359° a 360°==0° - jeden stupeň, mezi 0° a 1° - také 1°, celkem -2 °).

Vážený průměr - co to je a jak jej vypočítat?

V procesu studia matematiky se studenti seznamují s pojmem aritmetický průměr. V budoucnu se ve statistice a některých dalších vědách studenti potýkají i s výpočtem jiných průměrů. Jaké mohou být a jak se od sebe liší?

Průměry: Význam a rozdíly

Ne vždy přesné ukazatele umožňují pochopení situace. Pro posouzení té či oné situace je někdy nutné analyzovat obrovské množství čísel. A pak přijdou na pomoc průměry. Umožňují vám zhodnotit situaci obecně.


Od školních dob si mnoho dospělých pamatuje existenci aritmetického průměru. Je to velmi snadné spočítat - součet posloupnosti n členů je dělitelný n. To znamená, že pokud potřebujete vypočítat aritmetický průměr v posloupnosti hodnot 27, 22, 34 a 37, musíte vyřešit výraz (27 + 22 + 34 + 37) / 4, protože 4 hodnoty se používá ve výpočtech. V tomto případě bude požadovaná hodnota rovna 30.

Často se v rámci školního kurzu studuje i geometrický průměr. Výpočet této hodnoty je založen na extrakci kořene n-tého stupně ze součinu n členů. Pokud vezmeme stejná čísla: 27, 22, 34 a 37, pak výsledek výpočtů bude 29,4.

Harmonický průměr na všeobecně vzdělávací škole obvykle není předmětem studia. Používá se však poměrně často. Tato hodnota je převrácená hodnota aritmetického průměru a vypočítá se jako podíl n - počet hodnot a součet 1/a 1 +1/a 2 +...+1/a n . Pokud pro výpočet opět vezmeme stejnou řadu čísel, pak harmonická bude 29,6.

Vážený průměr: Vlastnosti

Všechny výše uvedené hodnoty však nemusí být použity všude. Například ve statistice při výpočtu některých průměrných hodnot hraje důležitou roli „váha“ každého čísla použitého ve výpočtech. Výsledky jsou více odhalující a správné, protože berou v úvahu více informací. Tato skupina hodnot je souhrnně označována jako „vážený průměr“. Ve škole se neprodávají, takže stojí za to se jim věnovat podrobněji.

V první řadě je vhodné vysvětlit, co se rozumí „váhou“ konkrétní hodnoty. Nejjednodušší způsob, jak to vysvětlit, je na konkrétním příkladu. Tělesná teplota každého pacienta je v nemocnici měřena dvakrát denně. Ze 100 pacientů na různých odděleních nemocnice bude mít 44 normální teplotu – 36,6 stupně. Dalších 30 bude mít zvýšenou hodnotu - 37,2, 14 - 38, 7 - 38,5, 3 - 39 a zbývající dvě - 40. A pokud vezmeme aritmetický průměr, pak tato hodnota obecně pro nemocnici bude přes 38 stupňů ! Téměř polovina pacientů má ale úplně normální teplotu. A zde by bylo správnější použít vážený průměr a „váhou“ každé hodnoty bude počet osob. V tomto případě bude výsledek výpočtu 37,25 stupňů. Rozdíl je zřejmý.

V případě výpočtů váženého průměru lze „váhu“ brát jako počet zásilek, počet lidí pracujících v daný den, obecně cokoli, co lze měřit a ovlivnit konečný výsledek.

Odrůdy

Vážený průměr odpovídá aritmetickému průměru diskutovanému na začátku článku. První hodnota však, jak již bylo zmíněno, zohledňuje i váhu každého čísla použitého ve výpočtech. Kromě toho existují také vážené geometrické a harmonické hodnoty.

Existuje další zajímavá odrůda použitá v řadě čísel. Jedná se o vážený klouzavý průměr. Na jejím základě se počítají trendy. Kromě samotných hodnot a jejich váhy se zde používá i periodicita. A při výpočtu průměrné hodnoty v určitém okamžiku se berou v úvahu také hodnoty za předchozí časová období.

Výpočet všech těchto hodnot není tak obtížný, ale v praxi se obvykle používá pouze obvyklý vážený průměr.

Metody výpočtu

V době informatizace není potřeba ručně počítat vážený průměr. Bylo by však užitečné znát vzorec výpočtu, abyste mohli získané výsledky zkontrolovat a případně opravit.

Nejjednodušší bude zvážit výpočet na konkrétním příkladu.

Je nutné zjistit, jaká je průměrná mzda v tomto podniku, s přihlédnutím k počtu pracovníků pobírajících konkrétní plat.

Výpočet váženého průměru se tedy provádí pomocí následujícího vzorce:

x = (a 1 *š 1 +a 2 *š 2 +...+a n *š n)/(š 1 +š 2 +...+š n)

Výpočet by byl například:

x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33,48

Je zřejmé, že při ručním výpočtu váženého průměru není žádný zvláštní problém. Vzorec pro výpočet této hodnoty v jedné z nejoblíbenějších aplikací se vzorci - Excel - vypadá jako funkce SUMPRODUCT (řada čísel; řada vah) / SUM (řada vah).

Jak zjistit průměrnou hodnotu v excelu?

jak najít aritmetický průměr v excelu?

Vladimír09854

Snadné jako koláč. Abyste našli průměrnou hodnotu v excelu, potřebujete pouze 3 buňky. V prvním napíšeme jedno číslo, ve druhém - další. A ve třetí buňce vyhodnotíme vzorec, který nám dá průměrnou hodnotu mezi těmito dvěma čísly z první a druhé buňky. Pokud se buňka č. 1 nazývá A1, buňka č. 2 se nazývá B1, pak do buňky se vzorcem musíte napsat takto:

Tento vzorec vypočítá aritmetický průměr dvou čísel.

Pro krásu našich výpočtů můžeme buňky zvýraznit čarami, ve formě talíře.

V samotném Excelu je také funkce pro určení průměrné hodnoty, ale já používám staromódní metodu a zadám vzorec, který potřebuji. Tím pádem mám jistotu, že Excel spočítá přesně tak, jak potřebuji, a nepřijde mi na nějaké vlastní zaokrouhlování.

M3sergey

To je velmi snadné, pokud jsou data již zadána do buněk. Pokud vás zajímá jen nějaké číslo, stačí vybrat požadovaný rozsah/rozsahy a ve stavovém řádku vpravo dole se objeví hodnota součtu těchto čísel, jejich aritmetický průměr a jejich počet.

Můžete vybrat prázdnou buňku, kliknout na trojúhelník (rozbalovací seznam) "Autosum" a tam zvolit "Průměr", načež odsouhlasit navržený rozsah pro výpočet, nebo si vybrat vlastní.

Nakonec můžete použít vzorce přímo - klikněte na "Vložit funkci" vedle řádku vzorců a adresy buňky. Funkce PRŮMĚR je v kategorii "Statistické" a bere jako argumenty jak čísla, tak odkazy na buňky atd. Tam si můžete vybrat i složitější možnosti, například AVERAGEIF - výpočet průměru podle podmínky.

Najděte průměr v excelu je poměrně jednoduchý úkol. Zde musíte pochopit, zda chcete tuto průměrnou hodnotu použít v některých vzorcích nebo ne.

Pokud potřebujete získat pouze hodnotu, pak stačí vybrat požadovaný rozsah čísel, poté excel automaticky vypočítá průměrnou hodnotu - zobrazí se ve stavovém řádku nadpis "Průměr".

V případě, že chcete výsledek použít ve vzorcích, můžete to udělat takto:

1) Sečtěte buňky pomocí funkce SUM a vše vydělte počtem čísel.

2) Správnější možností je použití speciální funkce s názvem PRŮMĚR. Argumenty této funkce mohou být čísla zadaná sekvenčně nebo rozsah čísel.

Vladimír Tichonov

zakroužkujte hodnoty, které budou zahrnuty do výpočtu, klikněte na záložku "Vzorce", tam vlevo uvidíte "AutoSum" a vedle něj trojúhelník směřující dolů. klikněte na tento trojúhelník a zvolte "Průměr". Voila, hotovo) ve spodní části sloupce uvidíte průměrnou hodnotu :)

Jekatěrina Mutalapová

Začněme od začátku a popořadě. Co znamená průměr?

Střední hodnota je hodnota, která je aritmetickým průměrem, tj. se vypočítá sečtením sady čísel a následným vydělením celkového součtu čísel jejich počtem. Například pro čísla 2, 3, 6, 7, 2 to bude 4 (součet čísel 20 se vydělí jejich číslem 5)

V excelové tabulce pro mě osobně bylo nejjednodušší použít vzorec =PRŮMĚR. Chcete-li vypočítat průměrnou hodnotu, musíte zadat data do tabulky, do sloupce dat napsat funkci =AVERAGE() a v závorkách uvést rozsah čísel v buňkách se zvýrazněním sloupce s daty. Poté stiskněte ENTER nebo jednoduše klikněte levým tlačítkem myši na libovolnou buňku. Výsledek se zobrazí v buňce pod sloupcem. Na první pohled je popis nesrozumitelný, ale ve skutečnosti jde o minuty.

Dobrodruh 2000

Program Excel je mnohostranný, takže existuje několik možností, které vám umožní najít průměr:

První možnost. Jednoduše sečtete všechny buňky a vydělíte jejich počtem;

Druhá možnost. Použijte speciální příkaz, do požadované buňky napište vzorec "=PRŮMĚR (a zde uveďte rozsah buněk)";

Třetí možnost. Pokud vyberete požadovaný rozsah, všimněte si, že na stránce níže je zobrazena také průměrná hodnota v těchto buňkách.

Existuje tedy mnoho způsobů, jak zjistit průměrnou hodnotu, stačí si vybrat ten nejlepší pro vás a neustále jej používat.

V Excelu můžete pomocí funkce AVERAGE vypočítat jednoduchý aritmetický průměr. Chcete-li to provést, musíte zadat několik hodnot. Stiskněte rovná se a vyberte v kategorii Statistické, mezi nimiž vyberte funkci PRŮMĚR



Pomocí statistických vzorců můžete také vypočítat aritmetický vážený průměr, který je považován za přesnější. K jeho výpočtu potřebujeme hodnoty ukazatele a frekvenci.

Jak zjistit průměr v Excelu?

Situace je taková. Je tam následující tabulka:

Sloupce vystínované červeně obsahují číselné hodnoty známek za předměty. Ve sloupci "Průměr" je třeba vypočítat jejich průměrnou hodnotu.
Problém je v tomto: celkem je 60-70 objektů a některé z nich jsou na jiném listu.
Díval jsem se do jiného dokumentu, průměr už je spočítaný a v buňce je vzorec jako
="název listu"!|E12
ale to udělal nějaký programátor, kterého vyhodili.
Řekněte mi, prosím, kdo tomu rozumí.

Sekýrovat

Do řádku funkcí vložíte „PRŮMĚR“ z navržených funkcí a vyberete si, odkud je třeba vypočítat (B6: N6) například pro Ivanova. Nevím jistě o sousedních listech, ale určitě je to obsaženo ve standardní nápovědě Windows

Řekněte mi, jak vypočítat průměrnou hodnotu ve Wordu

Prosím, řekněte mi, jak vypočítat průměrnou hodnotu ve Wordu. Konkrétně jde o průměrnou hodnotu hodnocení, nikoli o počet lidí, kteří hodnocení obdrželi.


Julia Pavlová

Word umí s makry hodně. Stiskněte ALT+F11 a napište makro program..
Kromě toho vám Insert-Object... umožní použít jiné programy, dokonce i Excel, k vytvoření listu s tabulkou uvnitř dokumentu Wordu.
Ale v tomto případě si musíte zapsat svá čísla do sloupce tabulky a dát průměr do spodní buňky stejného sloupce, že?
Chcete-li to provést, vložte pole do spodní buňky.
Vložit-Pole...-Vzorec
Obsah pole
[=PRŮMĚR (NAŠE)]
vrátí průměr součtu buněk výše.
Pokud je pole vybráno a je stisknuto pravé tlačítko myši, lze jej aktualizovat, pokud se čísla změnila,
zobrazit kód nebo hodnotu pole, změnit kód přímo v poli.
Pokud se něco pokazí, smažte celé pole v buňce a vytvořte jej znovu.
AVERAGE znamená průměr, NAD - asi, tedy o řadu buněk výše.
Sám jsem to všechno nevěděl, ale snadno jsem to našel v NÁPOVĚDĚ, samozřejmě s trochou přemýšlení.

Ve většině případů jsou data soustředěna kolem nějakého centrálního bodu. K popisu jakéhokoli souboru dat tedy stačí uvést průměrnou hodnotu. Zvažte postupně tři číselné charakteristiky, které se používají k odhadu střední hodnoty rozdělení: aritmetický průměr, medián a modus.

Průměrný

Aritmetický průměr (často označovaný jednoduše jako průměr) je nejběžnějším odhadem průměru rozdělení. Je to výsledek dělení součtu všech pozorovaných číselných hodnot jejich počtem. Pro ukázku čísel X 1, X 2, ..., Xn, průměr vzorku (označený symbolem ) rovná se \u003d (X 1 + X 2 + ... + Xn) / n, nebo

kde je průměr vzorku, n- velikost vzorku, Xi– i-tý prvek vzorku.

Stáhněte si poznámku ve formátu nebo formátu, příklady ve formátu

Zvažte výpočet aritmetického průměru pětiletých průměrných ročních výnosů 15 velmi rizikových podílových fondů (obrázek 1).

Rýže. 1. Průměrný roční výnos 15 velmi rizikových podílových fondů

Průměrná hodnota vzorku se vypočítá takto:

To je dobrý výnos, zejména ve srovnání s výnosem 3–4 %, který vkladatelé bank nebo družstevních záložen obdrželi za stejné časové období. Pokud seřadíte hodnoty výnosů, snadno zjistíte, že osm fondů má výnos nad průměrem a sedm pod průměrem. Aritmetický průměr funguje jako bilanční bod, takže nízkopříjmové fondy vyrovnávají vysokopříjmové fondy. Do výpočtu průměru se zapojují všechny prvky vzorku. Žádný z ostatních odhadů distribučního průměru tuto vlastnost nemá.

Kdy vypočítat aritmetický průměr. Protože aritmetický průměr závisí na všech prvcích vzorku, přítomnost extrémních hodnot významně ovlivňuje výsledek. V takových situacích může aritmetický průměr zkreslit význam číselných údajů. Proto při popisu souboru dat obsahujících extrémní hodnoty je nutné uvést medián nebo aritmetický průměr a medián. Pokud se například ze vzorku odebere výnos fondu RS Emerging Growth, vzorový průměr výnosu 14 fondů se sníží o téměř 1 % na 5,19 %.

Medián

Medián je střední hodnota uspořádaného pole čísel. Pokud pole neobsahuje opakující se čísla, pak polovina jeho prvků bude menší než a polovina větší než medián. Pokud vzorek obsahuje extrémní hodnoty, je lepší použít k odhadu průměru spíše medián než aritmetický průměr. Chcete-li vypočítat medián vzorku, musíte jej nejprve seřadit.

Tento vzorec je nejednoznačný. Jeho výsledek závisí na tom, zda je číslo sudé nebo liché. n:

  • Pokud vzorek obsahuje lichý počet položek, je medián (n+1)/2-tý prvek.
  • Pokud vzorek obsahuje sudý počet prvků, leží medián mezi dvěma středními prvky vzorku a rovná se aritmetickému průměru vypočtenému přes tyto dva prvky.

Abychom vypočítali medián pro vzorek 15 velmi rizikových podílových fondů, musíme nejprve seřadit nezpracovaná data (obrázek 2). Potom bude medián proti číslu středního prvku vzorku; v našem příkladu číslo 8. Excel má speciální funkci =MEDIAN(), která pracuje i s neuspořádanými poli.

Rýže. 2. Medián 15 fondů

Medián je tedy 6,5. To znamená, že polovina velmi rizikových fondů nepřesahuje 6,5, zatímco druhá polovina ano. Všimněte si, že medián 6,5 je o něco větší než medián 6,08.

Pokud ze vzorku odebereme ziskovost fondu RS Emerging Growth, pak se medián zbývajících 14 fondů sníží na 6,2 %, tedy ne tak výrazně jako aritmetický průměr (obr. 3).

Rýže. 3. Medián 14 fondů

Móda

Termín poprvé zavedl Pearson v roce 1894. Móda je číslo, které se ve vzorku vyskytuje nejčastěji (nejmódnější). Móda dobře popisuje například typickou reakci řidičů na semafor k zastavení provozu. Klasickým příkladem využití módy je volba velikosti vyráběné šarže bot nebo barvy tapety. Pokud má distribuce více režimů, pak se říká, že je multimodální nebo multimodální (má dva nebo více „vrcholů“). Multimodální distribuce poskytuje důležité informace o povaze zkoumané proměnné. Například v sociologických průzkumech, pokud proměnná představuje preferenci nebo postoj k něčemu, pak multimodalita může znamenat, že existuje několik výrazně odlišných názorů. Multimodalita je také indikátorem toho, že vzorek není homogenní a že pozorování mohou být generována dvěma nebo více „překrývajícími se“ distribucemi. Na rozdíl od aritmetického průměru odlehlé hodnoty neovlivňují režim. Pro průběžně rozložené náhodné veličiny, jako jsou průměrné roční výnosy podílových fondů, režim někdy vůbec neexistuje (nebo nedává smysl). Protože tyto indikátory mohou nabývat různých hodnot, opakující se hodnoty jsou extrémně vzácné.

Kvartily

Kvartily jsou míry, které se nejčastěji používají k vyhodnocení distribuce dat při popisu vlastností velkých numerických vzorků. Zatímco medián rozděluje uspořádané pole na polovinu (50 % prvků pole je menší než medián a 50 % je větší), kvartily rozdělují uspořádanou datovou sadu na čtyři části. Hodnoty Q1, medián a Q3 jsou 25., 50. a 75. percentil, v tomto pořadí. První kvartil Q 1 je číslo, které rozděluje vzorek na dvě části: 25 % prvků je méně než a 75 % je více než první kvartil.

Třetí kvartil Q 3 je číslo, které také rozděluje vzorek na dvě části: 75 % prvků je méně než a 25 % je více než třetí kvartil.

Pro výpočet kvartilů ve verzích Excelu před rokem 2007 byla použita funkce =QUARTILE(pole, část). Počínaje Excelem 2010 platí dvě funkce:

  • =QUARTILE.ON(pole, část)
  • =QUARTILE.EXC(pole; část)

Tyto dvě funkce poskytují mírně odlišné hodnoty (obrázek 4). Například při výpočtu kvartilů pro vzorek obsahující údaje o průměrném ročním výnosu 15 velmi rizikových podílových fondů je Q 1 = 1,8 nebo -0,7 pro QUARTILE.INC a QUARTILE.EXC, resp. Mimochodem, dříve použitá funkce QUARTILE odpovídá moderní funkci QUARTILE.ON. Chcete-li vypočítat kvartily v aplikaci Excel pomocí výše uvedených vzorců, lze pole dat ponechat bez pořadí.

Rýže. 4. Vypočítejte kvartily v Excelu

Znovu zdůrazněme. Excel umí vypočítat kvartily pro jednorozměrné diskrétní série, obsahující hodnoty náhodné proměnné. Výpočet kvartilů pro rozdělení na základě frekvence je uveden v části níže.

geometrický průměr

Na rozdíl od aritmetického průměru geometrický průměr měří, jak moc se proměnná změnila v průběhu času. Geometrický průměr je kořen n stupně z produktu n hodnoty (v Excelu se používá funkce = CUGEOM):

G= (X 1 * X 2 * ... * X n) 1/n

Podobný parametr - geometrický průměr míry návratnosti - je určen vzorcem:

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

Kde R i- míra návratnosti i-té časové období.

Předpokládejme například, že počáteční investice je 100 000 USD. Do konce prvního roku klesne na 50 000 USD a do konce druhého roku se vrátí na původních 100 000 USD. Míra návratnosti této investice během dvou roční období se rovná 0, protože počáteční a konečná výše prostředků se navzájem rovnají. Aritmetický průměr roční míry návratnosti je však = (-0,5 + 1) / 2 = 0,25 nebo 25 %, protože míra návratnosti v prvním roce R 1 = (50 000 - 100 000) / 100 000 = -0,5 a ve druhém R 2 = (100 000 - 50 000) / 50 000 = 1. Přitom geometrický průměr míry návratnosti za dva roky je: G = [(1–0,5) * (1 + 1 )] 1 /2 – 1 = ½ – 1 = 1 – 1 = 0. Geometrický průměr tedy přesněji odráží změnu (přesněji absenci změny) objemu investic za dvouleté období než aritmetický průměr.

Zajímavosti. Za prvé, geometrický průměr bude vždy menší než aritmetický průměr stejných čísel. S výjimkou případu, kdy jsou všechna převzatá čísla navzájem rovna. Za druhé, po zvážení vlastností pravoúhlého trojúhelníku lze pochopit, proč se průměr nazývá geometrický. Výška pravoúhlého trojúhelníku, spuštěného k přeponě, je průměrem úměrným mezi průměty nohou na přeponu a každá větev je průměrnou úměrností mezi přeponou a jejím průmětem na přeponu (obr. 5). To poskytuje geometrický způsob konstrukce geometrického průměru dvou (délkových) segmentů: musíte sestavit kruh na součtu těchto dvou segmentů jako průměr, pak výšku, obnovenou od bodu jejich spojení k průsečíku s kruh, dá požadovanou hodnotu:

Rýže. 5. Geometrický charakter geometrického průměru (obrázek z Wikipedie)

Druhou důležitou vlastností číselných údajů je jejich variace charakterizující stupeň rozptylu dat. Dva různé vzorky se mohou lišit jak ve středních hodnotách, tak ve variacích. Nicméně, jak je znázorněno na Obr. Jak je znázorněno na obr. 6 a 7, dva vzorky mohou mít stejnou variaci, ale různé průměry, nebo stejnou střední hodnotu a zcela odlišné variace. Data odpovídající polygonu B na Obr. 7 se mění mnohem méně než data, ze kterých byl polygon A postaven.

Rýže. 6. Dvě symetrická zvonovitá rozdělení se stejným rozptylem a různými středními hodnotami

Rýže. 7. Dvě symetrická rozdělení ve tvaru zvonu se stejnými středními hodnotami a různým rozptylem

Existuje pět odhadů odchylek dat:

  • rozpětí,
  • Rozsah interkvartilní,
  • rozptyl,
  • standardní odchylka,
  • variační koeficient.

rozsah

Rozsah je rozdíl mezi největším a nejmenším prvkem vzorku:

Přejetí = XMax-XMin

Rozsah vzorku obsahujícího údaje o průměrných ročních výnosech 15 velmi rizikových podílových fondů lze vypočítat pomocí uspořádaného pole (viz obrázek 4): Rozsah = 18,5 - (-6,1) = 24,6. To znamená, že rozdíl mezi nejvyššími a nejnižšími průměrnými ročními výnosy u velmi rizikových fondů je 24,6 %.

Rozsah měří celkové rozšíření dat. Přestože rozsah vzorku je velmi jednoduchým odhadem celkového rozptylu dat, jeho slabinou je, že nebere v úvahu přesně to, jak jsou data rozdělena mezi minimální a maximální prvky. Tento efekt je dobře vidět na Obr. 8, který znázorňuje vzorky se stejným rozsahem. Stupnice B ukazuje, že pokud vzorek obsahuje alespoň jednu extrémní hodnotu, rozsah vzorku je velmi nepřesným odhadem rozptylu dat.

Rýže. 8. Porovnání tří vzorků se stejným rozsahem; trojúhelník symbolizuje podporu rovnováhy a jeho umístění odpovídá průměrné hodnotě vzorku

Rozsah interkvartilní

Interkvartil neboli střední rozsah je rozdíl mezi třetím a prvním kvartilem vzorku:

Mezikvartilní rozsah \u003d Q 3 - Q 1

Tato hodnota umožňuje odhadnout rozšíření 50 % prvků a nezohlednit vliv extrémních prvků. Mezikvartilové rozpětí pro vzorek obsahující údaje o průměrných ročních výnosech 15 velmi rizikových podílových fondů lze vypočítat pomocí údajů na Obr. 4 (například pro funkci QUARTILE.EXC): Interkvartilní rozsah = 9,8 - (-0,7) = 10,5. Interval mezi 9,8 a -0,7 je často označován jako střední polovina.

Je třeba poznamenat, že hodnoty Q 1 a Q 3, a tedy i mezikvartilové rozmezí, nezávisí na přítomnosti odlehlých hodnot, protože jejich výpočet nebere v úvahu žádnou hodnotu, která by byla menší než Q 1 nebo větší než Q 3 . Celkové kvantitativní charakteristiky, jako je medián, první a třetí kvartil a mezikvartilové rozpětí, které nejsou ovlivněny odlehlými hodnotami, se nazývají robustní ukazatele.

Zatímco rozpětí a mezikvartilové rozpětí poskytují odhad celkového a středního rozptylu vzorku, ani jeden z těchto odhadů nebere v úvahu přesně to, jak jsou data distribuována. Rozptyl a směrodatná odchylka bez tohoto nedostatku. Tyto indikátory umožňují posoudit míru kolísání dat kolem průměru. Ukázkový rozptyl je aproximace aritmetického průměru vypočteného ze čtverců rozdílů mezi každým prvkem vzorku a průměrem vzorku. Pro vzorek X 1 , X 2 , ... X n je výběrový rozptyl (označený symbolem S 2 dán následujícím vzorcem:

Obecně je rozptyl vzorku součtem kvadrátů rozdílů mezi prvky vzorku a průměrem vzorku, dělený hodnotou rovnou velikosti vzorku mínus jedna:

Kde - aritmetický průměr, n- velikost vzorku, X i - i-tý ukázkový prvek X. V Excelu před verzí 2007 byla pro výpočet výběrového rozptylu použita funkce =VAR(), od verze 2010 je použita funkce =VAR.V().

Nejpraktičtější a široce přijímaný odhad rozptylu dat je standardní odchylka. Tento indikátor je označen symbolem S a je roven druhé odmocnině výběrového rozptylu:

V Excelu před verzí 2007 byla pro výpočet směrodatné odchylky použita funkce =STDEV(), od verze 2010 je použita funkce =STDEV.B(). Pro výpočet těchto funkcí lze datové pole neuspořádat.

Ani výběrový rozptyl, ani výběrová směrodatná odchylka nemohou být negativní. Jediná situace, ve které mohou být indikátory S 2 a S nulové, je, pokud jsou všechny prvky vzorku stejné. V tomto zcela nepravděpodobném případě je rozsah a mezikvartilní rozsah také nulový.

Číselná data jsou ze své podstaty nestálá. Každá proměnná může nabývat mnoha různých hodnot. Například různé podílové fondy mají různé míry návratnosti a ztráty. Vzhledem k variabilitě numerických dat je velmi důležité studovat nejen odhady průměru, které jsou sumativní povahy, ale také odhady rozptylu, které charakterizují rozptyl dat.

Rozptyl a směrodatná odchylka nám umožňují odhadnout rozptyl dat kolem průměru, jinými slovy určit, kolik prvků ve vzorku je menší než průměr a kolik je větší. Disperze má některé cenné matematické vlastnosti. Jeho hodnota je však druhou mocninou měrné jednotky – čtvereční procento, čtvereční dolar, čtvereční palec atd. Přirozeným odhadem rozptylu je proto směrodatná odchylka, která se vyjadřuje v obvyklých měrných jednotkách – procentech příjmu, dolarech nebo palcích.

Směrodatná odchylka umožňuje odhadnout míru fluktuace prvků vzorku kolem střední hodnoty. Téměř ve všech situacích leží většina pozorovaných hodnot v rozmezí plus nebo mínus jedné standardní odchylky od průměru. Když tedy známe aritmetický průměr prvků vzorku a směrodatnou výběrovou odchylku, je možné určit interval, do kterého patří většina dat.

Standardní odchylka výnosů u 15 velmi rizikových podílových fondů je 6,6 (obrázek 9). To znamená, že výnosnost většiny fondů se neliší od průměrné hodnoty o více než 6,6 % (tj. pohybuje se v rozmezí od – S= 6,2 – 6,6 = –0,4 až +S= 12,8). Ve skutečnosti tento interval obsahuje pětiletý průměrný roční výnos 53,3 % (8 z 15) fondů.

Rýže. 9. Směrodatná odchylka

Všimněte si, že v procesu sčítání čtverců rozdílů získávají položky, které jsou dále od průměru, větší váhu než položky, které jsou blíže. Tato vlastnost je hlavním důvodem, proč se aritmetický průměr nejčastěji používá k odhadu střední hodnoty rozdělení.

Variační koeficient

Na rozdíl od předchozích odhadů rozptylu je variační koeficient relativním odhadem. Vždy se měří v procentech, nikoli v původních datových jednotkách. Variační koeficient, označený symboly CV, měří rozptyl dat kolem průměru. Variační koeficient se rovná standardní odchylce dělené aritmetickým průměrem a vynásobené 100 %:

Kde S- standardní odchylka vzorku, - průměr vzorku.

Variační koeficient umožňuje porovnat dva vzorky, jejichž prvky jsou vyjádřeny v různých měrných jednotkách. Například manažer poštovní doručovací služby hodlá modernizovat vozový park nákladních vozidel. Při nakládání balíků je třeba vzít v úvahu dva typy omezení: hmotnost (v librách) a objem (v krychlových stopách) každého balíku. Předpokládejme, že ve vzorku 200 pytlů je průměrná hmotnost 26,0 liber, směrodatná odchylka hmotnosti je 3,9 liber, průměrný objem balení je 8,8 kubických stop a směrodatná odchylka objemu 2,2 kubických stop. Jak porovnat rozložení hmotnosti a objemu balíků?

Vzhledem k tomu, že se jednotky měření hmotnosti a objemu od sebe liší, musí manažer porovnávat relativní rozptyl těchto hodnot. Hmotnostní variační koeficient je CV W = 3,9 / 26,0 * 100 % = 15 % a objemový variační koeficient CV V = 2,2 / 8,8 * 100 % = 25 %. Relativní rozptyl objemů paketů je tedy mnohem větší než relativní rozptyl jejich vah.

Distribuční formulář

Třetí důležitou vlastností vzorku je forma jeho rozložení. Toto rozdělení může být symetrické nebo asymetrické. Pro popis tvaru rozdělení je nutné vypočítat jeho střední hodnotu a medián. Pokud jsou tyto dvě míry stejné, říká se, že proměnná je symetricky rozdělena. Pokud je střední hodnota proměnné větší než medián, má její rozdělení kladnou šikmost (obr. 10). Pokud je medián větší než průměr, distribuce proměnné je negativně zkreslená. Pozitivní šikmost nastává, když se průměr zvýší na neobvykle vysoké hodnoty. Negativní zešikmení nastává, když průměr klesne na neobvykle malé hodnoty. Proměnná je symetricky distribuována, pokud nenabývá extrémních hodnot v žádném směru, takže velké a malé hodnoty proměnné se navzájem ruší.

Rýže. 10. Tři typy rozdělení

Údaje zobrazené na stupnici A mají zápornou šikmost. Tento obrázek ukazuje dlouhý ocas a zkosení vlevo způsobené neobvykle malými hodnotami. Tyto extrémně malé hodnoty posouvají střední hodnotu doleva a stává se menší než medián. Údaje zobrazené na stupnici B jsou rozloženy symetricky. Levá a pravá polovina distribuce jsou jejich zrcadlové obrazy. Velké a malé hodnoty se navzájem vyvažují a průměr a medián jsou stejné. Údaje uvedené na stupnici B mají pozitivní šikmost. Tento obrázek ukazuje dlouhý ocas a zkosení doprava, způsobené přítomností neobvykle vysokých hodnot. Tyto příliš velké hodnoty posouvají průměr doprava a ten je větší než medián.

V Excelu lze získat popisné statistiky pomocí doplňku Balíček analýzy. Projděte si nabídku DataAnalýza dat, v okně, které se otevře, vyberte řádek Deskriptivní statistika a klikněte OK. V okně Deskriptivní statistika určitě uveďte vstupní interval(obr. 11). Pokud chcete zobrazit popisnou statistiku na stejném listu jako původní data, vyberte přepínač výstupní interval a určete buňku, kam chcete umístit levý horní roh zobrazené statistiky (v našem příkladu $C$1). Pokud chcete data vytisknout na nový list nebo do nového sešitu, jednoduše vyberte příslušný přepínač. Zaškrtněte políčko vedle Konečná statistika. Volitelně si také můžete vybrat Stupeň obtížnosti,k-tý nejmenší ak-tý největší.

Pokud na zálohu Data v oblasti Analýza nevidíte ikonu Analýza dat, musíte nejprve nainstalovat doplněk Balíček analýzy(viz například).

Rýže. 11. Popisná statistika pětiletých průměrných ročních výnosů fondů s velmi vysokou mírou rizika, vypočítaná pomocí add-on Analýza dat Excel programy

Excel vypočítává řadu výše uvedených statistik: průměr, medián, režim, směrodatná odchylka, rozptyl, rozsah ( interval), minimální, maximální a velikost vzorku ( šek). Kromě toho pro nás Excel vypočítává některé nové statistiky: standardní chybu, špičatost a šikmost. standardní chyba se rovná standardní odchylce dělené druhou odmocninou velikosti vzorku. asymetrie charakterizuje odchylku od symetrie rozdělení a je funkcí, která závisí na třetí mocnině rozdílů mezi prvky vzorku a střední hodnotou. Kurtóza je mírou relativní koncentrace dat kolem průměru versus konce distribuce a závisí na rozdílech mezi vzorkem a průměrem zvýšeným na čtvrtou mocninu.

Výpočet deskriptivní statistiky pro běžnou populaci

Průměr, rozptyl a tvar distribuce diskutované výše jsou charakteristiky založené na vzorku. Pokud však datová sada obsahuje numerická měření celé populace, lze její parametry vypočítat. Tyto parametry zahrnují průměr, rozptyl a směrodatnou odchylku základního souboru.

Očekávaná hodnota se rovná součtu všech hodnot obecné populace děleném objemem obecné populace:

Kde µ - očekávaná hodnota, Xi- i-té proměnlivé pozorování X, N- objem běžné populace. V Excelu se pro výpočet matematického očekávání používá stejná funkce jako pro aritmetický průměr: =AVERAGE().

Rozptyl populace rovnající se součtu čtverců rozdílů mezi prvky obecné populace a mat. očekávání děleno velikostí populace:

Kde σ2 je rozptyl běžné populace. Excel před verzí 2007 používá k výpočtu rozptylu základního souboru funkci =VAR() počínaje verzí 2010 =VAR.G().

standardní odchylka populace se rovná druhé odmocnině populačního rozptylu:

Excel před verzí 2007 používá k výpočtu směrodatné odchylky základního souboru =STDEV() počínaje verzí 2010 =STDEV.Y(). Všimněte si, že vzorce pro rozptyl populace a směrodatnou odchylku se liší od vzorců pro výběrový rozptyl a směrodatnou odchylku. Při výpočtu statistiky vzorků S2 A S jmenovatel zlomku je n-1 a při výpočtu parametrů σ2 A σ - objem běžné populace N.

pravidlo palce

Ve většině situací je velká část pozorování soustředěna kolem mediánu a tvoří shluk. V souborech dat s kladným zešikmením je tento shluk umístěn vlevo (tj. pod) od matematického očekávání a v souborech s negativním zešikmením je tento shluk umístěn vpravo (tj. nad) od matematického očekávání. Symetrická data mají stejný průměr a střední hodnotu a pozorování se shlukují kolem střední hodnoty a tvoří distribuci ve tvaru zvonu. Pokud distribuce nemá výraznou šikmost a data jsou soustředěna kolem určitého těžiště, lze k odhadu variability použít orientační pravidlo, které říká: pokud mají data rozložení ve tvaru zvonu, pak přibližně 68 % pozorování jsou menší než jedna směrodatná odchylka od matematického očekávání, přibližně 95 % pozorování je v rozmezí dvou směrodatných odchylek od očekávané hodnoty a 99,7 % pozorování je v rozmezí tří směrodatných odchylek od očekávané hodnoty.

Směrodatná odchylka, což je odhad průměrného kolísání kolem matematického očekávání, tedy pomáhá pochopit, jak jsou pozorování rozdělena, a identifikovat odlehlé hodnoty. Z praktického pravidla vyplývá, že u zvoncovitých rozdělení se pouze jedna hodnota z dvaceti liší od matematického očekávání o více než dvě směrodatné odchylky. Proto hodnoty mimo interval u ± 2σ, lze považovat za odlehlé hodnoty. Kromě toho se pouze tři z 1000 pozorování liší od matematického očekávání o více než tři směrodatné odchylky. Tedy hodnoty mimo interval u ± 3σ jsou téměř vždy odlehlé. Pro distribuce, které jsou velmi šikmé nebo nemají zvonovitý tvar, lze použít pravidlo Biename-Chebyshev.

Před více než sto lety matematici Bienamay a Chebyshev nezávisle na sobě objevili užitečnou vlastnost směrodatné odchylky. Zjistili, že pro jakýkoli soubor dat, bez ohledu na tvar distribuce, procento pozorování, která leží ve vzdálenosti nepřesahující k standardní odchylky od matematického očekávání, ne méně (1 – 1/ 2)*100%.

Například pokud k= 2, Biename-Chebyshevovo pravidlo říká, že alespoň (1 - (1/2) 2) x 100 % = 75 % pozorování musí ležet v intervalu u ± 2σ. Toto pravidlo platí pro všechny k přesahující jednu. Biename-Čebyševovo pravidlo je velmi obecné povahy a platí pro distribuce jakéhokoli druhu. Označuje minimální počet pozorování, přičemž vzdálenost od matematického očekávání nepřesahuje danou hodnotu. Pokud je však distribuce ve tvaru zvonu, orientační pravidlo přesněji odhadne koncentraci dat kolem průměru.

Výpočet popisné statistiky pro rozdělení založené na frekvenci

Nejsou-li k dispozici původní údaje, stává se jediným zdrojem informací rozdělení četnosti. V takových situacích můžete vypočítat přibližné hodnoty kvantitativních ukazatelů rozdělení, jako je aritmetický průměr, směrodatná odchylka, kvartily.

Pokud jsou ukázková data prezentována jako frekvenční rozdělení, lze vypočítat přibližnou hodnotu aritmetického průměru za předpokladu, že všechny hodnoty v každé třídě jsou soustředěny ve středu třídy:

Kde - průměr vzorku, n- počet pozorování nebo velikost vzorku, S- počet tříd v rozdělení frekvencí, mj- střední bod j- třída, Fj- frekvence odpovídající j- třída.

Pro výpočet směrodatné odchylky od rozdělení frekvencí se také předpokládá, že všechny hodnoty v rámci každé třídy jsou soustředěny do středu třídy.

Abychom pochopili, jak jsou kvartily řady určovány na základě četností, uvažujme výpočet dolního kvartilu na základě údajů za rok 2013 o rozložení ruské populace podle průměrného peněžního příjmu na hlavu (obr. 12).

Rýže. 12. Podíl obyvatelstva Ruska s peněžním příjmem na hlavu v průměru za měsíc, rublech

Pro výpočet prvního kvartilu intervalové variační řady můžete použít vzorec:

kde Q1 je hodnota prvního kvartilu, xQ1 je spodní hranice intervalu obsahujícího první kvartil (interval je určen akumulovanou frekvencí, první přesahuje 25 %); i je hodnota intervalu; Σf je součet frekvencí celého vzorku; pravděpodobně vždy rovno 100 %; SQ1–1 je kumulativní četnost intervalu předcházejícího intervalu obsahujícímu dolní kvartil; fQ1 je frekvence intervalu obsahujícího dolní kvartil. Vzorec pro třetí kvartil se liší tím, že na všech místech je třeba místo Q1 použít Q3 a místo ¼ dosadit ¾.

V našem příkladu (obr. 12) je dolní kvartil v rozmezí 7000,1 - 10 000, jehož kumulativní četnost je 26,4 %. Spodní hranice tohoto intervalu je 7000 rublů, hodnota intervalu je 3000 rublů, kumulovaná frekvence intervalu předcházejícího intervalu obsahujícímu dolní kvartil je 13,4 %, frekvence intervalu obsahujícího dolní kvartil je 13,0 %. Tedy: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13,4) / 13 \u003d 9677 rublů.

Úskalí spojená s popisnou statistikou

V této poznámce jsme se podívali na to, jak popsat datovou sadu pomocí různých statistik, které odhadují její průměr, rozptyl a distribuci. Dalším krokem je analýza a interpretace dat. Doposud jsme studovali objektivní vlastnosti dat a nyní přejdeme k jejich subjektivní interpretaci. Na výzkumníka číhají dvě chyby: nesprávně zvolený předmět analýzy a nesprávná interpretace výsledků.

Analýza výkonnosti 15 velmi rizikových podílových fondů je poměrně nezaujatá. Dospěl ke zcela objektivním závěrům: všechny podílové fondy mají různé výnosy, spread výnosů fondů se pohybuje od -6,1 do 18,5 a průměrný výnos je 6,08. Objektivita analýzy dat je zajištěna správnou volbou celkových kvantitativních ukazatelů rozdělení. Bylo zvažováno několik metod pro odhad střední hodnoty a rozptylu dat a byly naznačeny jejich výhody a nevýhody. Jak vybrat správné statistiky, které poskytují objektivní a nezaujatou analýzu? Pokud je distribuce dat mírně zkreslená, měl by být medián zvolen nad aritmetickým průměrem? Který ukazatel přesněji charakterizuje rozptyl dat: směrodatná odchylka nebo rozmezí? Měla by být uvedena kladná šikmost rozdělení?

Na druhou stranu je interpretace dat subjektivní proces. Různí lidé docházejí k různým závěrům a interpretují stejné výsledky. Každý má svůj úhel pohledu. Někdo považuje celkové průměrné roční výnosy 15 fondů s velmi vysokou mírou rizika za dobré a je s obdrženým příjmem celkem spokojen. Jiní si mohou myslet, že tyto fondy mají příliš nízké výnosy. Subjektivita by tedy měla být kompenzována poctivostí, neutralitou a jasností závěrů.

Etické problémy

Analýza dat je neoddělitelně spjata s etickými otázkami. Člověk by měl být kritický k informacím šířeným novinami, rádiem, televizí a internetem. Postupem času se naučíte být skeptičtí nejen k výsledkům, ale i k cílům, předmětu a objektivitě výzkumu. Slavný britský politik Benjamin Disraeli to řekl nejlépe: „Existují tři druhy lží: lži, zatracené lži a statistiky.

Jak je uvedeno v poznámce, při výběru výsledků, které by měly být uvedeny ve zprávě, vyvstávají etické problémy. Měly by být zveřejněny pozitivní i negativní výsledky. Kromě toho musí být při sestavování zprávy nebo písemné zprávy výsledky prezentovány čestně, neutrálně a objektivně. Rozlišujte mezi špatnou a nečestnou prezentací. K tomu je nutné určit, jaké byly záměry mluvčího. Někdy mluvčí vynechává důležité informace z neznalosti a někdy i záměrně (například pokud použije aritmetický průměr k odhadu průměru jasně zkreslených dat, aby získal požadovaný výsledek). Nepoctivé je také potlačování výsledků, které neodpovídají úhlu pohledu výzkumníka.

Jsou použity materiály z knihy Levin et al Statistika pro manažery. - M.: Williams, 2004. - str. 178–209

Funkce QUARTILE zachována, aby byla v souladu se staršími verzemi aplikace Excel