Predikční intervaly pomocí regresní rovnice. Od té doby

Předpokládejme, že chceme rozšířit náš model o další hodnoty nezávislé proměnné a představovat problém předpovídání průměru vodpovídající určité hodnotě, která může ležet mezi pozorováním vzorku z před a mimo tento interval. Prognóza může být bod nebo interval.

Bodová předpověďVypočítá se rovnicí
hodnota .

Intervalová předpověďJe interval spolehlivosti pokrytý danou spolehlivostí 1-
očekávaná hodnota :

, (3.1.13)

. (3.1.14)


Pro parametr můžete vytvořit interval spolehlivosti
která pokrývá skutečnou hodnotu parametru
s danou spolehlivostí 1-
:

. (3.1.16)

Interval spolehlivosti korelačního koeficientu nalezeno vzorcem (3.1.17):

. (3.1.18)

Pro nelineární regrese vypočte se korelační index rovný druhé odmocnině určovacího koeficientu vypočteného podle vzorce (3.1.10).

Posouzení spolehlivosti korelačního indexu se provádí pomocí
- statistika vypočtená podle vzorce (3.2.19):

, (3.1.19)

kde m- počet parametrů v regresní rovnici. Podle Fisherových tabulek (Příloha E) pro danou spolehlivost 1-
a počet stupňů volnosti (
) a (
) najděte hodnotu tabulky
... Pokud
, pak s danou spolehlivostí 1-
lze dojít k závěru, že korelační index je spolehlivý.

Přiměřenost konstruovaného modelu ke zkoumanému procesu lze stanovit pomocí průměrné chyby aproximace (průměrné procento nesouladu mezi teoretickými a skutečnými hodnotami):

. (3.1.20)

Při modelování ekonomických ukazatelů je nejčastěji povolena chyba 5% (někdy 7%, zřídka 10%). Model se považuje za přiměřený (a proto vhodný), pokud
.

Protože stejný trend lze vyjádřit různými modely, často se používá řada funkcí, a pak se vybere ta nejvýhodnější. Výběr nejvýhodnějšího modelu lze provést na základě zbytkové směrodatné odchylky (zbytkové rozptylu):

, (3.1.21)

kde
- počet parametrů v rovnici.

Nejlepší funkce bude ta s menší.

Příklad 3.1 Zjistit závislost objemu zisku na počtu prodejen. Udělejte prognózu za předpokladu, že počet prodejen se zvýší na 25.

Rozhodnutí.Pro nalezení parametrů lineární regresní rovnice (3.1.1) pomocí systému lineárních Gaussových rovnic (3.1.2) sestavíme pomocnou výpočtovou tabulku 3.1.

Jedním ze základních problémů vznikajících při prognózování je stanovení intervalů spolehlivosti prognózy. Je intuitivně jasné, že základ pro výpočet spolehlivosti intervalu prognózy by měl zahrnovat míru oscilace řady. Čím vyšší je tato variabilita, tím větší je interval prognózy. V důsledku toho by měla být otázka intervalu spolehlivosti prognózy zahájena s ohledem na měřič variability. Obvykle se jedná o standardní odchylku:

kde - respektive skutečné a vypočtené hodnoty řady;

f - počet stupňů volnosti, stanovený na základě počtu pozorování ( n) a počet odhadovaných parametrů.

f \u003d n - z,

kde z - počet odhadovaných parametrů.

Například pro parabolu druhého stupně f \u003d n - 3, třetí stupeň f \u003d n- 4 atd.

Součet čtverců odchylek od trendu lze rozložit takto:

Poslední výraz lze zjednodušit. Předpokládejme tedy, že počátek je uprostřed řádku a parametry a a b bude rovna:

Po transformacích dostaneme:

Rozdíl mezi prvními dvěma členy na pravé straně se rovná součtu čtverců odchylek od aritmetického průměru, ᴛ.ᴇ. .

Tím pádem,

Poslední výraz ukazuje, že součet čtverců odchylek od trendových čar je menší než aritmetický průměr.

Součet čtverců odchylek od trendových čar, ᴛ.ᴇ. a standardní odchylka od trendu Sy je základem pro určení kořenové střední čtvercové chyby parametrů.

Před stanovením intervalu spolehlivosti prognózy je třeba provést rezervaci. Jde o to, že předpoklad o normálnosti rozdělení odchylek kolem regresní linie nemůže být při analýze řady ověřen ani ověřen. Diskuse ve 30. a 40. letech 20. století objasnily obtíže spojené s tímto problémem. V důsledku toho nebyl nikdy nalezen zásadně nový přístup. Všechny návrhy se nějakým způsobem týkají stanovení intervalu spolehlivosti na základě odhadu směrodatné odchylky členů série.

Parametry získané během odhadu nejsou prosté chyb. Vypočítané hodnoty nesou břemeno nejistoty spojené s chybami parametrů.

Obecně se interval spolehlivosti prognózy definuje jako

kde je střední čtvercová chyba;

Vypočítaná hodnota v t;

Hodnota t-Studentovo kritérium.

Li t \u003d I + L, pak ten určí hodnotu intervalu spolehlivosti na L jednotek času.

Interval spolehlivosti prognózy by měl zohledňovat nejen nejistotu, ale i možnost odchylky, ,.ᴇ. rozsah variace. Pokud označíme střední čtvercovou chybu jako S p, interval spolehlivosti prognózy bude:

Předpovědní intervaly spolehlivosti - koncepce a typy. Klasifikace a vlastnosti kategorie "Intervaly předpovědi spolehlivosti" 2017, 2018.

Jednou z nejčastějších metod predikce je extrapolace, tj. při předpovídání budoucnosti na základě minulých údajů.

Extrapolace je založena na následujících předpokladech:

§ vývoj jevu lze rozumně charakterizovat hladkou trajektorií - trendem;

§ obecné podmínky, které určují vývojový trend v minulosti, v budoucnu nepodstoupí významné změny.

Extrapolace tedy popisuje určitý obecný budoucí vývoj objektu prognózy. Navíc, pokud vývoj v minulosti měl trvale spasmodický charakter, pak s dostatečně dlouhým pozorovacím obdobím se skoky ukázaly jako „pevné“ v samotném trendu a ten druhý může být opět použit v prognózování.

Provádíme prognózy na základě extrapolace nejlepší formy trendu (lineární) pro vývoz pro období 2001-2007:

Připomeňme, že aktuální proměnná má 7 úrovní řady, které jsou označeny přirozenými čísly. Prognóza dynamiky vývozu v roce 2008 (t \u003d 8) bude tedy:

(miliarda dolarů)

Provádíme prognózy na základě extrapolace nejlepší formy trendu (lineární) pro dovoz pro období 2001-2007:

Připomeňme, že aktuální proměnná má 7 úrovní řady, které jsou označeny přirozenými čísly. Prognóza dynamiky dovozu v roce 2008 (t \u003d 8) bude tedy:

(miliarda dolarů)

Extrapolace umožňuje získat bodovou hodnotu prognózy, kterou lze považovat za uspokojivou, pouze pokud existuje funkční závislost. Ekonomické jevy se však vyznačují závislostí korelace a proměnné jsou zpravidla spojité. Proto je uvedení bodových hodnot prognózy přísně vzato bez obsahu. Z toho vyplývá, že prognóza by měla být uváděna ve formě intervalu hodnot, tj. je nutné určit interval spolehlivosti prognózy.

Předpovídejte intervaly spolehlivosti

Při vytváření prognózy má chyba následující zdroje:

§ volba tvaru křivky, která charakterizuje trend, obsahuje prvek subjektivity. V každém případě často neexistuje pevný základ pro tvrzení, že zvolený tvar křivky je jediný možný, a ještě více nejlepší pro extrapolaci za daných specifických podmínek;

§ Odhad parametrů křivek (jinými slovy, odhad trendu) se provádí na základě omezeného souboru pozorování, z nichž každá obsahuje náhodnou složku. Díky tomu jsou parametry křivky a následně její poloha v prostoru charakterizovány určitou nejistotou;

§ trend charakterizuje průměrnou úroveň řady v každém okamžiku. Individuální pozorování se od nich zpravidla v minulosti lišila.

Je přirozené očekávat, že takové odchylky nastanou v budoucnosti.

Je docela možné, že tvar křivky popisující trend je zvolen nesprávně, nebo když se trend vývoje v budoucnosti může významně změnit a nemusí se řídit typem křivky, která byla přijata během zarovnání. V druhém případě základní předpoklad extrapolace neodpovídá skutečnému stavu věcí. Nalezená křivka vyrovnává časové řady a charakterizuje trend pouze v období, na které se pozorování vztahuje. Extrapolace takového trendu nevyhnutelně povede k chybnému výsledku a chybu tohoto druhu nelze předem odhadnout. V tomto ohledu můžeme pouze poznamenat, že by se zjevně mělo očekávat zvýšení takové chyby (nebo pravděpodobnosti jejího výskytu) se zvýšením dodací lhůty.

Chyba spojená s druhým a třetím zdrojem se může projevit ve formě intervalu spolehlivosti prognózy při vytváření některých předpokladů o vlastnostech řady. S tímto intervalem je bodová předpověď převedena na intervalovou předpověď.

V každém případě posun doby pozorování pouze o jeden krok nebo přidání nebo vyloučení členů řady v důsledku skutečnosti, že každý člen řady obsahuje náhodnou složku, vede ke změně numerických odhadů parametrů. Vypočítané hodnoty tedy nesou břemeno nejistoty spojené s chybami v hodnotách parametrů.

Obecně se interval spolehlivosti trendu definuje jako:

kde je střední čtvercová chyba trendu;

Vypočtená hodnota y t;

Hodnota studentovy t-statistiky.

V STATISTICE lze při výpočtu intervalů spolehlivosti predikce stanovit hodnotu směrodatné odchylky S y pomocí tabulky ANOVA. Hodnota vypočtená v buňce Residual Mean Squares odpovídá radikální expresi ve vzorci pro S, tj. Reziduální rozptyl. Zbývá pouze extrahovat z něj druhou odmocninu.

Pro export (viz tabulka 77), pro import (viz tabulka 80).

To znamená, že pro export S y \u003d 18,11, pro import S y \u003d 25,45.

Hodnota koeficientu spolehlivosti t se zjistí z Studentovy tabulky s přihlédnutím k pravděpodobnosti spolehlivosti 95%. Při použití lineárních a výkonových funkcí je počet stupňů volnosti 4, hodnota kritéria je 2,776.

Interval spolehlivosti pro prognózu vývozu pro rok 2008 je tedy definován jako:

Tuto prognózu lze interpretovat následovně: výše japonského vývozu v roce 2008 s pravděpodobností 95% se bude pohybovat od 704,542 miliard do 805,089 miliard USD.

Interval spolehlivosti prognózy pro dovoz na rok 2008 je definován jako:

Tuto prognózu lze interpretovat následovně: výše japonského dovozu v roce 2008 s pravděpodobností 95% bude od 596,072 miliard do 737,371 miliard USD.

Grafická prezentace výsledků prognózy

Poslední fází předpovědi je konstrukce grafických obrázků, které dávají představu o přesnosti predikce a jasně ukazují rozsah intervalů spolehlivosti.

Tabulka 89. Prognózy pro vývoz



Postava: 63.

Tabulka 90. Prognostické údaje pro export


Postava: 64.

Bohužel v našem případě skutečné hodnoty překročily interval spolehlivosti prognózy, což opět zdůrazňuje problémy při výběru trendového modelu.

Extrapolace na základě průměrného tempa růstu a průměrného absolutního růstu

V této části zvážíme prognózu na základě průměrné míry růstu. Budoucí hodnoty se získají pomocí vzorce:

kde je průměrná míra růstu; - úroveň použitá jako základ pro extrapolaci.

Průměrná míra růstu je definována jako:

kde y n - údaje za poslední rok období a y 1 - údaje za první rok v posuzovaném období.

Počítáme pro export:

Interval spolehlivosti:

Tabulka 91. Výpočty podle vzorce, průměrná míra růstu japonského vývozu

TEST

v disciplíně „Plánování a předpovídání

v tržních podmínkách “

na téma: Předpovědní intervaly spolehlivosti

Posouzení přiměřenosti a přesnosti modelů


Kapitola 1. Teoretická část. 3

Kapitola 2. Praktická část. devět

Seznam použité literatury .. 13


Kapitola 1. Teoretická část

Intervaly spolehlivosti pro předpověď. Posouzení přiměřenosti a přesnosti modelů

1.1 Předpovědní intervaly spolehlivosti

Posledním krokem při aplikaci růstových křivek je extrapolovat trend na základě vybrané rovnice. Předpovídané hodnoty studovaného indikátoru se vypočítají tak, že se do rovnice nahradí časové hodnoty todpovídající době vedení. Prognóza získaná tímto způsobem se nazývá bodová předpověď, protože pro každý okamžik v čase je stanovena pouze jedna hodnota predikovaného indikátoru.

V praxi je kromě bodové predikce žádoucí stanovit hranice možné změny v predikovaném indikátoru, nastavit "vidličku" možných hodnot predikovaného indikátoru, tj. vypočítat intervalovou předpověď.

Rozdíl mezi skutečnými údaji a bodovou prognózou získanou extrapolací trendu z růstových křivek může být způsoben:

1. subjektivní chyba při výběru typu křivky;

2. chyba při odhadování parametrů křivek;

3. chyba spojená s odchylkou jednotlivých pozorování od trendu, která charakterizuje určitou průměrnou úroveň řady v každém okamžiku.

Chyba spojená s druhým a třetím zdrojem se může projevit v intervalu spolehlivosti prognózy. Interval spolehlivosti, který bere v úvahu nejistotu spojenou s pozicí trendu a možnost odchýlit se od tohoto trendu, je definován jako:


kde n je délka časové řady;

L je vedoucí období;

y n + L - bodová předpověď v okamžiku n + L;

t a - hodnota t-statistik studenta;

S p - průměrná chyba čtvercové předpovědi.

Předpokládejme, že trend je charakterizován přímkou:

Protože odhady parametrů jsou určeny vzorkou populace představovanou časovou řadou, obsahují chybu. Chyba parametru a asi vede ke svislému posunu přímky, chyba parametru a 1 - ke změně úhlu sklonu přímky vzhledem k ose vodorovné osy. S ohledem na šíření konkrétních realizací ve vztahu k trendovým čarám může být rozptyl reprezentován jako:

(1.2.),

kde je rozptyl odchylek skutečných pozorování od vypočtených;

t 1 - čas potřebný k extrapolaci;

t 1 \u003d n + L ;


t- pořadové číslo úrovní řady, t \u003d 1,2, ..., n;

Sériové číslo úrovně uprostřed řádku,

Interval spolehlivosti pak lze vyjádřit jako:

(1.3.),

Označme kořen ve výrazu (1.3.) K. Hodnota K závisí pouze na n a L, tj. na délce řádku a době vedení. Proto můžete kompilovat tabulky hodnot K nebo K * \u003d t a K. Poté bude odhad intervalu vypadat takto:

(1.4.),

Výraz podobný jako (1.3.) Lze získat pro polynom druhého řádu:

(1.5.),

(1.6.),

Rozptyl odchylek skutečných pozorování od vypočtených pozorování je určen výrazem:


(1.7.),

kde y t- skutečné hodnoty úrovní řady,

Vypočítané hodnoty úrovní řady,

n- délka časové řady,

k - počet odhadovaných parametrů vyrovnávací křivky.

Šířka intervalu spolehlivosti tedy závisí na hladině významnosti, periodě vedení, standardní odchylce od trendu a stupni polynomu.

Čím vyšší je stupeň polynomu, tím větší je interval spolehlivosti pro stejnou hodnotu S y, protože rozptyl trendové rovnice se počítá jako vážený součet variací odpovídajících parametrů rovnice

Obrázek 1.1. Prognóza intervalů spolehlivosti pro lineární trend

Intervaly spolehlivosti pro predikce získané pomocí exponenciální rovnice jsou stanoveny podobným způsobem. Rozdíl je v tom, že jak při výpočtu parametrů křivky, tak při výpočtu střední čtvercové chyby se nepoužijí samotné hodnoty úrovní časové řady, ale jejich logaritmy.

Intervaly spolehlivosti pro řadu křivek s asymptoty lze určit pomocí stejného schématu, pokud je hodnota asymptotu známa (například pro modifikovaný exponent).

Tabulka 1.1. hodnoty NA* v závislosti na délce časové řady n a dodací lhůta L pro přímku a parabolu. Je zřejmé, že se zvětšením délky řádků ( n) NA* pokles se zvýšením doby vedení L význam NA* zvýšit. V tomto případě není vliv doby vedení pro různé hodnoty stejný n : čím delší je délka řádku, tím menší vliv má doba vedení L.

Tabulka 1.1.

K * hodnoty pro vyhodnocení intervalů spolehlivosti prognózy na základě lineárního trendu a parabolického trendu na úrovni spolehlivosti 0,9 (7).

Lineární trend

Parabolický trend

Délka řada (n)

Doba vedení (L)

délka řádku (p)

doba vedení (L)

7 2,6380 2,8748 3,1399 7 3,948 5,755 8,152
8 2,4631 2,6391 2,8361 8 3,459 4,754 6,461
9 2,3422 2,4786 2,6310 9 3,144 4,124 5,408
10 2,2524 2,3614 2,4827 10 2,926 3,695 4,698
11 2,1827 2,2718 2,3706 11 2,763 3,384 4,189
12 2,1274 2,2017 2,2836 12 2,636 3,148 3,808
13 2,0837 2,1463 2,2155 13 2,536 2,965 3,516
14 2,0462 2,1000 2,1590 14 2,455 2,830 3,286
15 2,0153 2,0621 2,1131 15 2,386 2,701 3,100
16 1,9883 2,0292 2,0735 16 2,330 2,604 2,950
17 1,9654 2,0015 2,0406 17 2,280 2,521 2,823
18 1,9455 1,9776 2,0124 18 2,238 2,451 2,717
19 1,9280 1,9568 1,9877 19 2,201 2,391 2,627
20 1,9117 1,9375 1,9654 20 2,169 2,339 2,549
21 1,8975 1,9210 1,9461 21 2,139 2,293 2,481
22 1,8854 1,9066 1,9294 22 2,113 2,252 2,422
23 1,8738 1,8932 1,9140 23 2,090 2,217 2,371
24 1,8631 1,8808 1,8998 24 2,069 2,185 2,325
25 1,8538 1,8701 1,8876 25 2,049 2,156 2,284

Kapitola 2. Praktická část

Úkol 1.5. Využití adaptivních metod v ekonomické prognóze

1. Vypočítejte exponenciální průměr pro časovou řadu ceny akcií YM. Jako počáteční hodnotu exponenciálního průměru vezměte průměr z prvních 5 úrovní řady. Hodnota adaptačního parametru a je rovna 0,1.

Tabulka 1.2.

Cena akcií IBM

1 510 11 494 21 523
2 497 12 499 22 527
3 504 13 502 23 523
4 510 14 509 24 528
5 509 15 525 25 529
6 503 16 512 26 538
7 500 17 510 27 539
8 500 18 506 28 541
9 500 19 515 29 543
10 495 20 522 30 541

2. Podle údajů úkolu č. 1 vypočítejte exponenciální průměr na hodnotě adaptačního parametru a rovna 0,5. Graficky porovnejte původní časové řady a řadu exponenciálních prostředků získaných pomocí a\u003d 0,1 a a\u003d 0,5. Označte, který řádek je plynulejší.

3. Predikce ceny akcií IBM byla provedena na základě adaptivního polynomického modelu druhého řádu


,

kde je vedoucí období.

V posledním kroku byly získány následující odhady koeficientů:

1 den dopředu (\u003d 1);

2 dny dopředu (\u003d 2).

Řešení 1.5

1. Definujeme

Hodnoty exponenciálního průměru najdete na a=0,1.

. a\u003d 0,1 - podle stavu;

; S 1 \u003d 0,1 x 510 + 0,9 x 506 \u003d 506,4;

; S2 \u003d 0,1 x 497 + 0,9 x 506,4 \u003d 505,46;

; S3 \u003d 0,1 x 504 + 0,9 x 505,46 \u003d 505,31 atd.


a\u003d 0,5 - podle podmínek.

; S 1 \u003d 0,5 x 510 + 0,5 x 506 \u003d 508;

; S2 \u003d 0,5 x 497 + 0,5 x 508 \u003d 502,5 atd.

Výsledky výpočtu jsou uvedeny v tabulce 1.3.

Tabulka 1.3.

Exponenciální průměry

Exponenciální průměr

Exponenciální průměr

a=0,1

a=0,5

a=0,1

a=0,5

1 506,4 508 16 505,7 513,3
2 505,5 502,5 17 506,1 511,7
3 505,3 503,2 18 506,1 508,8
4 505,8 506,6 19 507,0 511,9
5 506,1 507,8 20 508,5 517
6 505,8 505,4 21 509,9 520
7 505,2 502,7 22 511,6 523,5
8 504,7 501,4 23 512,8 523,2
9 504,2 500,7 24 514,3 525,6
10 503,4 497,8 25 515,8 527,3
11 502,4 495,9 26 518,0 532,7
12 502,0 497,5 27 520,1 525,8
13 502,0 499,7 28 522,2 538,4
14 502,7 504,4 29 524,3 540,7
15 505,0 514,7 30 525,9 540,9

Obrázek 1.2. Exponenciální vyhlazování časové řady cen akcií: A - skutečné údaje; B - exponenciální průměr při alfa \u003d 0,1; C - exponenciální průměr při alfa \u003d 0,5

Když a\u003d 0,1, exponenciální průměr je plynulejší, protože v tomto případě jsou náhodné fluktuace časové řady absorbovány v největší míře.

3. Prognóza pro adaptivní polynomiální model druhého řádu je vytvořena v posledním kroku nahrazením posledních hodnot koeficientů do rovnice modelu a hodnoty dodací doby.

Předpověď 1 den dopředu (\u003d 1):

Předpověď 2 dny dopředu (\u003d 2):


Seznam použitých literatura

1. Dubrova T.A. Statistické předpovědní metody v ekonomii: Učebnice / Moskevská státní univerzita, statistika a informatika. - M.: MESI, 2003 .-- 52p.

2. Afanasyev V.N., Yuzbashev M.M. Analýza a predikce časových řad M.: Finance and Statistics, 2001.

3. Lukashin Yu.P. Regresní a adaptivní predikční metody. Tutorial. - M.: MESI, 1997.

Pokud při analýze vývoje objektu prognózy existují důvody pro přijetí dvou základních předpokladů extrapolace, o kterých jsme hovořili výše, pak proces extrapolace spočívá v nahrazení odpovídající hodnoty doby vedení do vzorce popisujícího trend.

Extrapolace, obecně řečeno, poskytuje bodový prognostický odhad. Intuitivně člověk pociťuje nedostatečnost takového odhadu a potřebu získat odhad intervalu tak, aby prognóza pokrývající určitý interval hodnot predikované proměnné byla spolehlivější. Jak je uvedeno výše, přesná shoda mezi skutečnými údaji a prediktivními bodovými odhady získanými extrapolací trendových křivek je nepravděpodobná. Související nejistota má následující zdroje:

1) volba tvaru křivky, která charakterizuje trend, obsahuje prvek subjektivity. V každém případě často neexistuje pevný základ pro tvrzení, že zvolený tvar křivky je jediný možný, nebo dokonce nejlepší pro extrapolaci za daných specifických podmínek;

2) odhad parametrů křivek (jinými slovy odhad trendu) se provádí na základě omezeného souboru pozorování, z nichž každá obsahuje náhodnou složku. Z tohoto důvodu jsou parametry křivky a tím i její poloha v prostoru charakterizovány určitou nejistotou;

3) trend charakterizuje určitou průměrnou úroveň řady v každém okamžiku. Individuální pozorování se od nich zpravidla v minulosti lišila. Je přirozené očekávat, že takové odchylky nastanou v budoucnosti.

Chyba spojená s jeho druhým a třetím zdrojem se může projevit ve formě intervalu spolehlivosti prognózy při vytváření některých předpokladů o vlastnostech řady. S pomocí takového intervalu je předpovědi bodové extrapolace převedena na intervalovou.

Je docela možné, že tvar křivky popisující trend je zvolen nesprávně, nebo když se trend vývoje v budoucnosti může významně změnit a nemusí se řídit typem křivky, která byla přijata během zarovnání. V druhém případě základní předpoklad extrapolace neodpovídá skutečnému stavu věcí. Nalezená křivka vyrovnává časové řady a charakterizuje trend pouze v období, na které se pozorování vztahuje. Extrapolace takového trendu nevyhnutelně povede k chybnému výsledku a chybu tohoto druhu nelze předem odhadnout. V tomto ohledu lze pouze poznamenat, že by se zjevně mělo očekávat zvýšení takové chyby (nebo pravděpodobnosti jejího výskytu) se zvýšením předpovědní doby.

Jedním z hlavních úkolů vyplývajících z extrapolace trendů je stanovení intervalů spolehlivosti prognózy. Je intuitivně zřejmé, že základ pro výpočet intervalu spolehlivosti prognózy by měl být založen na míře proměnlivosti řady pozorovaných hodnot prvku. Čím vyšší je tato volatilita, tím menší je pozice trendu v prostoru „úroveň - čas“ a tím širší by měl být interval pro předpovědní možnosti se stejnou mírou důvěry. Při konstruování intervalu spolehlivosti prognózy je tedy třeba vzít v úvahu posouzení variability nebo variace úrovní řady. Obvykle je takový odhad standardní směrodatná odchylka (směrodatná odchylka) skutečných pozorování od vypočtených pozorování získaných vyrovnáváním časové řady.

Před stanovením intervalu spolehlivosti prognózy je nutné učinit výhradu ohledně některé konvenčnosti výpočtu uvažovaného níže. Následuje poněkud svévolný přenos výsledků zjištěných pro regresi indikátorů vzorku do analýzy časových řad. Skutečnost je taková, že předpoklad regresní analýzy, že rozdělení odchylek kolem regresní linie je normální, nemůže být v podstatě bezpodmínečně uplatňován při analýze časových řad.

Parametry získané v průběhu statistického odhadu nejsou prosté chyby spojené se skutečností, že množství informací, na jejichž základě byl odhad proveden, je omezené, a v jistém smyslu lze tuto informaci považovat za vzorek. V každém případě posun v periodě pozorování pouze o jeden krok nebo přidání nebo vyloučení členů série kvůli skutečnosti, že každý člen řady obsahuje náhodnou složku, vede ke změně numerických odhadů parametrů. Vypočítané hodnoty tedy nesou břemeno nejistoty spojené s chybami v hodnotách parametrů.

Obecně se interval spolehlivosti trendu definuje jako

kde je střední čtvercová chyba trendu;

¾ vypočtená hodnota yt;

¾ hodnota t- Statistiky studentů.

Pokud t \u003d i+ L potom rovnice určí hodnotu intervalu spolehlivosti trendu rozšířeného o L jednotek času.

Interval spolehlivosti prognózy by samozřejmě měl brát v úvahu nejen nejistotu spojenou s pozicí trendu, ale také možnost odchylky od tohoto trendu. V praxi existují případy, kdy více či méně rozumné pro extrapolaci, můžete použít několik typů křivek. V tomto případě se argumentace někdy scvrkne na následující. Protože každá z křivek charakterizuje jeden z alternativních trendů, je zřejmé, že prostor mezi extrapolovanými trendy je pro předpovídanou hodnotu určitým „přirozeným regionem důvěry“. S tímto tvrzením nelze souhlasit. Za prvé, protože každá z možných trendových linií odpovídá některé dříve přijaté hypotéze vývoje. Prostor mezi trendy není spojen s žádným z nich - lze z něj čerpat neomezený počet trendů. Je třeba také dodat, že interval spolehlivosti je spojen s určitou úrovní pravděpodobnosti překročení jeho hranic. Prostor mezi trendy není spojen s žádnou pravděpodobností, ale závisí na výběru typů křivek. Navíc s dostatečně dlouhou dobou vedení se tento prostor zpravidla stává tak významným, že takový „interval spolehlivosti“ ztrácí veškerý význam.

Za předpokladu, že se vezmou v úvahu standardní chyby odhadů parametrů rovnice trendu (které jsou podle definice selektivní, a proto nemusí být odhady neznámých obecných parametrů v důsledku projevu náhodné chyby reprezentativnosti), a bez zvážení posloupnosti transformací získáme obecný vzorec pro interval spolehlivosti prognózy.

kde je hodnota prognózy vypočtená pomocí rovnice trendu pro období t + L

¾ průměrná čtvercová chyba trendu;

К - koeficient zohledňující chyby koeficientů rovnic trendu

¾ hodnota t- Statistiky studentů.

Součinitel NA vypočteno následujícím způsobem

n je počet pozorování (délka dynamické řady);

L - počet předpovědí

Hodnota K závisí pouze na n a L, tj. Na délce pozorování a predikční periodě.

Příklad výpočtu prognózy a konstrukce intervalu spolehlivosti prognózy.

Optimálním trendem je lineární trend ... Je třeba vypočítat projekce objemu dovozů do Německa na roky 1996 a 1997. K tomu je nutné stanovit hodnoty trendových úrovní při hodnotách časových faktorů 14 a 15.

Objem dovozu v roce 1996:

Objem dovozu v roce 1997:

Standardní chyba trendu je Sy \u003d 30,727. Koeficient spolehlivosti Studentovy distribuce při hladině významnosti 0,05 a počtu stupňů volnosti je 2,16. Koeficient K je 1.428:

Dolní mez prvního intervalu spolehlivosti je tedy 378,62: 473,452-30,727 * 2,16 * 1,428.

Horní hranice je 568,28: 473,452 + 30,727 * 2,16 * 1,428.

Výsledky výpočtu musí být prezentovány ve formě tabulky a graficky

Skutečná hodnota objemu dovozů v Německu za rok 1996

Předpokládaná hodnota objemu dovozů v Německu na rok 1996

Dolní mez 95% intervalu spolehlivosti

Skutečná hodnota objemu dovozů v Německu za rok 1997

Prognóza objemu dovozů v Německu na rok 1997

Horní hranice 95% intervalu spolehlivosti

Tento graf je nakreslen takto:

1) je nutné vytvořit kopii existujícího grafu vyhlazování časové řady s lineárním trendem

2) doplňte chybějící hodnoty (skutečné úrovně řady pro roky 1996 a 1997, prognózy pro roky 1996 a 1997, jakož i hranice intervalů spolehlivosti).

Graf je do určité míry podmíněn, protože není pravděpodobné, že bude nastavena přesná stupnice. Můžete kreslit ručně nebo pomocí nástrojů pro kreslení Excel.