Intervalele de predicție a regresiei. pentru că

Să presupunem că vrem să ne extindem modelul la alte valori ale unei variabile independente și să punem problema prezicerii valorii medii lacorespunzător la o anumită valoare, care poate fi între observațiile eșantionului din inainte de în afara acestui interval. Prognoza poate fi punctuală sau interval.

Prognoza punctelorSe calculează după ecuație
valoare .

Prognoza de intervaleEste un interval de încredere care acoperă 1-
valorea estimata :

, (3.1.13)

. (3.1.14)


Puteți crea un interval de încredere pentru parametru
care acoperă adevărata valoare a parametrului
cu fiabilitatea setată 1-
:

. (3.1.16)

Interval de încredere pentru coeficientul de corelație se găsesc după formula (3.1.17):

. (3.1.18)

Pentru regresii neliniare calculați indicele de corelație egal cu rădăcina pătrată a coeficientului de determinare, calculat după formula (3.1.10).

Fiabilitatea indicelui de corelație este evaluată folosind
-statisticile calculate după formula (3.2.19):

, (3.1.19)

unde m- numărul de parametri în ecuația de regresie. Conform tabelelor Fisher (apendicele E) pentru o fiabilitate dată 1-
și numărul de grade de libertate (
) și (
) găsiți valoarea tabelului
. Dacă
, apoi cu o fiabilitate dată de 1-
se poate concluziona că indicele de corelație este fiabil.

Adecvarea modelului construit la procesul studiat poate fi stabilită folosind eroarea medie de aproximare (procentul mediu al discrepanței dintre valorile teoretice și cele reale):

. (3.1.20)

Când modelăm indicatorii economici, este permisă cel mai adesea o eroare de 5% (uneori 7%, mai rar 10%). Un model este considerat adecvat (și deci adecvat) dacă
.

Întrucât aceeași tendință poate fi exprimată prin diferite modele, se utilizează adesea o serie de funcții, apoi se alege cea mai preferată. Modelul cel mai preferat poate fi selectat pe baza abaterii standard reziduale (dispersie reziduală):

, (3.1.21)

unde
- numărul de parametri din ecuație.

Funcția care are cel mai bun mai puțin.

Exemplul 3.1 Cercetați dependența profitului de numărul de puncte de desfacere. Efectuați o prognoză cu presupunerea că numărul de puncte de vânzare va fi crescut la 25.

Decizie.Pentru a găsi parametrii ecuației de regresie liniară (3.1.1) folosind sistemul ecuațiilor Gauss liniare (3.1.2), vom crea un tabel auxiliar de calcul 3.1.

Una dintre sarcinile de bază care apar în prognoză este determinarea intervalelor de încredere ale prognozei. Este intuitiv clar că, în baza calculării încrederii intervalului de prognoză, trebuie să se plaseze un contor de fluctuație în serie. Cu cât această fluctuație este mai mare, cu atât este mai mare intervalul pentru prognoză. În consecință, problema intervalului de încredere al prognozei ar trebui să înceapă cu luarea în considerare a contorului de oscilare. De obicei, o astfel de măsură este abaterea standard:

unde sunt valorile reale și, respectiv, estimate ale seriei;

f - numărul de grade de libertate, determinat pe baza numărului de observații ( n) și numărul de parametri estimate.

f \u003d n - z,

unde z - numărul de parametri estimate.

De exemplu, pentru o parabolă de gradul doi f \u003d n - 3, gradul al treilea f \u003d n- 4 etc.

Suma pătratelor abaterilor de la tendință poate fi descompusă după cum urmează:

Ultima expresie poate fi simplificată. Să presupunem că originea se află în rândul din mijloc, apoi, și parametrii și și b va fi egal cu:

După transformări, obținem:

Diferența primilor doi membri ai părții drepte este egală cu suma abaterilor pătrate de la media aritmetică, ᴛ.ᴇ. .

În acest fel,

Ultima expresie arată că suma abaterilor pătrate de la liniile de tendință este mai mică decât media aritmetică.

Suma pătratelor abaterilor de la liniile de trend, ᴛ.ᴇ. și abaterea standard de la tendință Sy Este baza pentru determinarea erorii pătrate medii a parametrilor.

Înainte de a continua cu determinarea intervalului de încredere al prognozei, trebuie făcută o rezervare. Cert este că asumarea normalității distribuției abaterilor în jurul liniei de regresie nu poate fi confirmată și nici verificată în analiza seriei. Discuțiile din anii 30 și 40 arunca o lumină asupra dificultăților asociate acestei probleme. Drept urmare, nu a fost găsită niciodată o abordare fundamental nouă. Într-un fel sau altul, toate sugestiile sunt legate de determinarea intervalului de încredere bazat pe o estimare a abaterii medii pătrate a membrilor seriei.

Parametrii obținuți în timpul evaluării nu sunt erori. Valorile calculate suportă sarcina incertitudinii asociate cu erorile din valoarea parametrilor.

În general, intervalul de încredere prognozat este definit ca fiind

unde este eroarea medie pătrată;

Valoarea estimată la t;

Valoare tCriteriul studentului.

Dacă t \u003d I + L, atunci acesta din urmă va determina valoarea intervalului de încredere pe L unități de timp.

Intervalul de încredere al prognozei ar trebui să țină seama nu numai de incertitudine, ci de posibilitatea de deviere, ᴛ.ᴇ. interval de variație. Dacă notăm eroarea pătrată medie rădăcină ca S p, atunci intervalul de încredere al prognozei va fi:

Intervalele de previziune a încrederii - concept și tipuri. Clasificarea și caracteristicile categoriei „Intervalele de încredere ale prognozei” 2017, 2018.

Una dintre cele mai frecvente metode de prognoză este extrapolarea, adică. în prezicerea viitorului pe baza datelor din trecut.

Extrapolarea se bazează pe următoarele ipoteze:

§ dezvoltarea fenomenului poate fi caracterizată în mod rezonabil printr-o traiectorie lină - tendință;

§ condițiile generale care determină tendința de dezvoltare în trecut nu vor suferi modificări semnificative în viitor.

Astfel, extrapolarea oferă o descriere a unei dezvoltări comune viitoare a obiectului de prognoză. Mai mult, dacă dezvoltarea din trecut a fost permanent spasmodică, atunci cu o perioadă de observație suficient de lungă, salturile sunt „fixate” în trendul propriu-zis, iar acesta din urmă poate fi folosit din nou în prognoză.

Efectuăm prognoze bazate pe extrapolarea celei mai bune forme de tendință (liniare) pentru export pentru perioada 2001-2007:

Reamintim că variabila curentă are 7 niveluri în serie, notate cu numere naturale. În consecință, prognoza dinamicii exporturilor în 2008 (t \u003d 8) va fi:

(miliarde de dolari)

Efectuăm prognoze bazate pe extrapolarea celei mai bune forme de tendință (liniare) pentru importuri pentru perioada 2001-2007:

Reamintim că variabila curentă are 7 niveluri în serie, notate cu numere naturale. În consecință, prognoza dinamicii importurilor în 2008 (t \u003d 8) va fi:

(miliarde de dolari)

Extrapolarea face posibilă obținerea valorii punctuale a prognozei, care poate fi considerată satisfăcătoare numai dacă există o dependență funcțională. Cu toate acestea, dependența de corelație este caracteristică fenomenelor economice, iar variabilele sunt de obicei continue. Prin urmare, indicarea valorilor punctuale ale prognozei, strict vorbind, este lipsită de conținut. Rezultă că prognoza trebuie să fie dată ca un interval de valori, adică. este necesar să se determine intervalul de încredere al prognozei.

Intervalele de previziune a încrederii

Când faceți o prognoză, eroarea are următoarele surse:

§ alegerea formei curbei care caracterizează tendința conține un element de subiectivitate. În orice caz, deseori nu există o bază solidă pentru a afirma că forma aleasă a curbei este singura posibilă și chiar mai bună pentru extrapolarea în aceste condiții specifice;

§ estimarea parametrilor curbei (cu alte cuvinte, estimarea tendințelor) se bazează pe un set limitat de observații, fiecare conținând o componentă aleatorie. Datorită acestui fapt, parametrii curbei și, prin urmare, poziția acesteia în spațiu, sunt caracterizați de o oarecare incertitudine;

§ o tendință caracterizează nivelul mediu al unei serii la fiecare moment în timp. Observațiile individuale, de regulă, s-au abătut de la ea în trecut.

Este firesc să ne așteptăm ca astfel de abateri să apară în viitor.

Este foarte posibil ca forma curbei care descrie tendința să nu fie aleasă corect sau când tendința de dezvoltare în viitor să se schimbe semnificativ și să nu urmeze tipul de curbă care a fost adoptat în timpul nivelarii. În ultimul caz, ipoteza de bază a extrapolării nu corespunde stării reale a lucrurilor. Curba găsită aliniază doar seria de timp și caracterizează tendința doar în perioada acoperită de observație. Extrapolarea unei astfel de tendințe va conduce inevitabil la un rezultat eronat, iar o eroare de acest gen nu poate fi estimată în avans. În această privință, putem observa doar că, se pare, ar trebui să ne așteptăm la o creștere a unei astfel de erori (sau a probabilității apariției acesteia) cu o creștere a timpului de plumb.

Eroarea asociată celei de-a doua și a treia surse poate fi reflectată sub forma unui interval de încredere al prognozei atunci când se fac unele presupuneri despre proprietatea seriei. Utilizând acest interval, prognoza punctelor este convertită în interval.

În orice caz, trecerea perioadei de observare cu o singură etapă sau adăugarea sau eliminarea membrilor seriei datorită faptului că fiecare membru al seriei conține o componentă aleatorie duce la o modificare a estimărilor numerice ale parametrilor. Prin urmare, valorile calculate au o încărcătură de incertitudine asociată cu erori în valoarea parametrilor.

În general, intervalul de încredere pentru o tendință este definit ca:

unde este eroarea medie pătrată a tendinței;

Valoarea estimată a y t;

Valoarea statisticilor t-student.

În STATISTICA, atunci când se calculează intervalele de încredere prognozate, abaterea medie pătrată S y poate fi determinată folosind analiza tabelului de varianță. Valoarea calculată în celula Pătrate reziduale corespunde expresiei radicale din formula pentru S y, adică variația reziduală. Rămâne doar să extrageți din ea rădăcina pătrată.

Pentru export (vezi tabelul 77), pentru import (vezi tabelul 80).

Deci, pentru export S y \u003d 18.11, pentru import S y \u003d 25.45.

Valoarea coeficientului de încredere t se găsește în tabelul Student, ținând cont de probabilitatea de încredere de 95%. Atunci când se utilizează funcții liniare și de putere, numărul de grade de libertate este 4, respectiv valoarea criteriului este 2,776.

Astfel, intervalul de încredere pentru prognoza exporturilor pentru 2008 este definit ca fiind:

Această prognoză poate fi interpretată după cum urmează: Exporturile Japoniei în 2008 cu o probabilitate de 95% vor varia de la 704.542 miliarde dolari la 805.089 miliarde dolari.

Intervalul de încredere pentru prognoza pentru importuri pentru 2008 este definit ca fiind:

Această prognoză poate fi interpretată astfel: Importurile japoneze în 2008, cu o probabilitate de 95%, vor varia de la 596,072 miliarde dolari la 737,371 miliarde dolari.

Prezentarea grafică a rezultatelor previziunilor

Etapa finală de prognoză este construcția de imagini grafice care să dea o idee despre exactitatea prognozei și să demonstreze clar intervalul de încredere.

Tabelul 89. Date de predicție pentru export



Fig. 63.

Tabelul 90. Date de predicție pentru export


Fig. 64.

Din păcate, în cazul nostru, valorile reale au depășit intervalul de încredere al prognozei, care subliniază încă o dată dificultățile alegerii unui model de tendință.

Extrapolarea bazată pe rata medie de creștere și pe creșterea medie absolută

În acest paragraf, avem în vedere prognoza bazată pe o rată de creștere medie. Valorile perioadelor viitoare sunt obținute, ghidate de formula:

unde este rata medie de creștere; - nivel acceptat ca bază pentru extrapolare.

Rata medie de creștere este definită ca:

unde y n - date pentru ultimul an al perioadei și y 1 - date pentru primul an din perioada considerată.

Calculați pentru export:

Interval de încredere:

Tabelul 91. Calcule după formulă, rata medie de creștere a exporturilor japoneze

TEST

disciplină „Planificare și prognoză

în condiții de piață "

topic: Intervalele de previziune a încrederii

Evaluarea adecvării și exactității modelelor


Capitolul 1. Partea teoretică. 3

Capitolul 2. Partea practică. 9

Lista literaturii folosite .. 13


Capitol 1. Partea teoretică

Intervalele de încredere ale prognozei. Evaluarea adecvării și exactității modelelor

1.1 Intervalele de încredere ale prognozei

Ultimul pas în aplicarea curbelor de creștere este extrapolarea tendinței pe baza ecuației selectate. Valorile prognozate ale indicatorului studiat sunt calculate prin înlocuirea valorilor timpului în ecuație tcorespunzător perioadei de plumb. Prognoza obținută în acest mod se numește prognoza punctuală, deoarece pentru fiecare moment de timp este determinată doar o valoare a indicatorului prevăzut.

În practică, în plus față de prognoza punctuală, este de dorit să se determine limitele unei eventuale modificări a indicatorului de prognoză, să se stabilească un „plug” al valorilor posibile ale indicatorului de prognoză, adică. calculați prognoza intervalului.

Discrepanța dintre datele reale și prognoza punctelor obținute prin extrapolarea tendinței din curbele de creștere poate fi cauzată de:

1. falimentul subiectiv al alegerii tipului de curbă;

2. eroarea de estimare a parametrilor curbelor;

3. Eroarea asociată cu abaterea observațiilor individuale de la tendință, care caracterizează un anumit nivel mediu al seriei la fiecare punct din timp.

Eroarea asociată cu a doua și a treia sursă poate fi reflectată sub forma unui interval de încredere al prognozei. Intervalul de încredere, ținând cont de incertitudinea asociată cu poziția tendinței și posibilitatea abaterii de la această tendință, este determinat sub forma:


unde n este lungimea seriei de timp;

L este perioada de plumb;

y n + L - prognoza punctuală în acest moment n + L;

t a este valoarea statisticilor t-student;

S p este eroarea medie pătrată a prognozei.

Să presupunem că o tendință este caracterizată de o linie dreaptă:

Deoarece estimările parametrilor sunt determinate de setul de eșantionare reprezentat de seriile de timp, acestea conțin o eroare. Eroarea parametrului a ® duce la o deplasare verticală a liniei drepte, eroarea parametrului a 1 duce la o modificare a unghiului de înclinare a dreptei în raport cu abscisa. Având în vedere împrăștierea implementărilor specifice în raport cu liniile de tendință, variația poate fi reprezentată ca:

(1.2.),

unde este variația abaterilor observațiilor reale de la cele calculate;

t 1 - termenul de plumb pentru care se face extrapolarea;

t 1 \u003d n + L ;


t- numărul de serie al nivelurilor seriei, t \u003d 1,2, ..., n;

Numărul de serie al nivelului din mijlocul rândului,

Atunci intervalul de încredere poate fi reprezentat ca:

(1.3.),

Notăm rădăcina în expresia (1.3.) De K. Valoarea lui K depinde doar de n și L, adică. de la lungimea rândului și perioada de plumb. Prin urmare, este posibil să compilați un tabel cu valorile lui K sau K * \u003d t a K. Apoi, estimarea intervalului va arăta ca:

(1.4.),

O expresie similară cu (1.3) poate fi obținută pentru un polinom de ordinul doi:

(1.5.),

(1.6.),

Varianța abaterilor observațiilor reale de la cele calculate este determinată de expresia:


(1.7.),

unde yT- valorile reale ale nivelurilor seriei;

Valorile calculate ale nivelurilor seriei,

n- durata seriei de timp;

k - numărul parametrilor estimate ai curbei de egalizare.

Astfel, lățimea intervalului de încredere depinde de nivelul de semnificație, timpul de plumb, abaterea standard de la tendință și gradul polinomului.

Cu cât gradul polinomului este mai mare, cu atât intervalul de încredere este mai larg pentru aceeași valoare S y, deoarece variația ecuației tendinței este calculată ca suma ponderată a variațiilor parametrilor corespunzători ai ecuației

Figura 1.1. Interviuri de încredere previzionate pentru o tendință liniară

Intervalele de încredere pentru prognozele obținute folosind ecuația exponențială sunt determinate într-un mod similar. Diferența este că atât calculul parametrilor curbei, cât și calcularea erorii pătrate medii nu folosesc valorile nivelurilor seriei de timp în sine, ci logaritmele lor.

Intervalele de încredere pentru o serie de curbe având asimptote pot fi determinate în același mod dacă se cunoaște valoarea asimptotului (de exemplu, pentru un exponent modificat).

În tabelul 1.1. valorile sunt date LA* în funcție de lungimea seriei de timp n și timp de plumb L pentru drept și parabola. Evident, cu lungimea crescândă a rândurilor ( n) valori LA* scade odată cu creșterea timpului de plumb L valorile LA* cresc. Mai mult, influența timpului de plumb nu este aceeași pentru valori diferite n : cu cât lungimea rândului este mai mare, cu atât impactul este mai redus L.

Tabelul 1.1.

Valorile K * pentru estimarea intervalelor de încredere prognozate bazate pe o tendință liniară și o tendință parabolică cu o probabilitate de încredere de 0,9 (7).

Tendință liniară

Tendință parabolică

Lungime rând (p)

Perioada de plumb (L)

lungimea rândului (p)

perioada de plumb (L)

7 2,6380 2,8748 3,1399 7 3,948 5,755 8,152
8 2,4631 2,6391 2,8361 8 3,459 4,754 6,461
9 2,3422 2,4786 2,6310 9 3,144 4,124 5,408
10 2,2524 2,3614 2,4827 10 2,926 3,695 4,698
11 2,1827 2,2718 2,3706 11 2,763 3,384 4,189
12 2,1274 2,2017 2,2836 12 2,636 3,148 3,808
13 2,0837 2,1463 2,2155 13 2,536 2,965 3,516
14 2,0462 2,1000 2,1590 14 2,455 2,830 3,286
15 2,0153 2,0621 2,1131 15 2,386 2,701 3,100
16 1,9883 2,0292 2,0735 16 2,330 2,604 2,950
17 1,9654 2,0015 2,0406 17 2,280 2,521 2,823
18 1,9455 1,9776 2,0124 18 2,238 2,451 2,717
19 1,9280 1,9568 1,9877 19 2,201 2,391 2,627
20 1,9117 1,9375 1,9654 20 2,169 2,339 2,549
21 1,8975 1,9210 1,9461 21 2,139 2,293 2,481
22 1,8854 1,9066 1,9294 22 2,113 2,252 2,422
23 1,8738 1,8932 1,9140 23 2,090 2,217 2,371
24 1,8631 1,8808 1,8998 24 2,069 2,185 2,325
25 1,8538 1,8701 1,8876 25 2,049 2,156 2,284

Capitolul 2. Partea practică

Sarcina 1.5. Utilizarea metodelor adaptative în prognoza economică

1. Calculați media exponențială pentru seria de timp a prețului bursier al UM. Ca valoare inițială a mediei exponențiale, luați media primelor 5 niveluri ale seriei. Valoarea parametrului de adaptare a este considerată a fi 0,1.

Tabelul 1.2.

Pretul actiunilor IBM

1 510 11 494 21 523
2 497 12 499 22 527
3 504 13 502 23 523
4 510 14 509 24 528
5 509 15 525 25 529
6 503 16 512 26 538
7 500 17 510 27 539
8 500 18 506 28 541
9 500 19 515 29 543
10 495 20 522 30 541

2. Conform sarcinii nr. 1, calculați media exponențială cu valoarea parametrului de adaptare și egală cu 0,5. Comparați grafic seria timpului inițial și seria mediilor exponențiale obținute la și\u003d 0,1 și și\u003d 0,5. Indicați ce serie este mai lină.

3. Prezicerea prețurilor acțiunilor IBM s-a bazat pe un model polinomial adaptativ de ordinul doi


,

unde este perioada de plumb.

La ultima etapă, au fost obținute următoarele estimări ale coeficientului:

Cu 1 zi in avans (\u003d 1);

Cu 2 zile în avans (\u003d 2).

Soluția sarcinii 1.5

1. Defini

Găsim valorile mediei exponențiale pentru și=0,1.

. și\u003d 0,1 - după condiție;

; S1 \u003d 0,1 x 510 + 0,9 x 506 \u003d 506,4;

; S2 \u003d 0,1 x 497 + 0,9 x 506,4 \u003d 505,46;

; S 3 \u003d 0,1 x 504 + 0,9 x 505,46 \u003d 505,31 etc.


și\u003d 0,5 - după condiție.

; S 1 \u003d 0,5 x 510 + 0,5 x 506 \u003d 508;

; S 2 \u003d 0,5 x 497 + 0,5 x 508 \u003d 502,5 etc.

Rezultatele calculului sunt prezentate în tabelul 1.3.

Tabelul 1.3.

Medii exponențiale

Media exponențială

Media exponențială

și=0,1

și=0,5

și=0,1

și=0,5

1 506,4 508 16 505,7 513,3
2 505,5 502,5 17 506,1 511,7
3 505,3 503,2 18 506,1 508,8
4 505,8 506,6 19 507,0 511,9
5 506,1 507,8 20 508,5 517
6 505,8 505,4 21 509,9 520
7 505,2 502,7 22 511,6 523,5
8 504,7 501,4 23 512,8 523,2
9 504,2 500,7 24 514,3 525,6
10 503,4 497,8 25 515,8 527,3
11 502,4 495,9 26 518,0 532,7
12 502,0 497,5 27 520,1 525,8
13 502,0 499,7 28 522,2 538,4
14 502,7 504,4 29 524,3 540,7
15 505,0 514,7 30 525,9 540,9

Figura 1.2. Netezirea exponențială a seriei de timp a prețului acțiunii: A - date reale; B este media exponențială cu alfa \u003d 0,1; C - media exponențială cu alfa \u003d 0,5

La și\u003d 0,1, media exponențială este mai lină, deoarece în acest caz, fluctuațiile aleatoare ale seriei de timp sunt absorbite în cea mai mare măsură.

3. Prognoza pentru modelul polinomial adaptativ de ordinul doi se formează la ultima etapă, prin înlocuirea valorilor ultimului coeficient și a valorii - timp de plumb în ecuația modelului.

Prognoza cu 1 zi înainte (\u003d 1):

Prognoza cu 2 zile înainte (\u003d 2):


Lista celor utilizate literatură

1. Dubrova T.A. Metode de prognoză statistică în economie: manual / Universitatea de Stat din Moscova de Economie, Statistică și Informatică. - M .: MESI, 2003 .-- 52 p.

2. Afanasyev V.N., Yuzbashev M.M. Analiza și prognoza seriei de timp M .: Finanțe și statistici, 2001.

3. Lukashin Yu.P. Regresie și metode de prognoză adaptivă. Tutorial. - M .: MESI, 1997.

Dacă, atunci când analizăm dezvoltarea obiectului prognozat, există motive pentru a accepta două ipoteze de bază ale extrapolării, despre care am vorbit mai sus, atunci procesul de extrapolare constă în substituirea valorii corespunzătoare a timpului de plumb în formula care descrie tendința.

Extrapolarea, în general, oferă o estimare predictivă. Intuitiv, insuficiența unei astfel de estimări și necesitatea obținerii unei estimări de intervale sunt resimțite astfel încât prognoza, care acoperă un anumit interval de valori ale variabilei prevăzute, este mai fiabilă. Așa cum am menționat mai sus, coincidența exactă a datelor reale și a estimărilor punctelor predictive obținute prin extrapolarea curbelor care caracterizează tendința este un fenomen improbabil. Eroarea corespunzătoare are următoarele surse:

1) alegerea formei curbei care caracterizează tendința conține un element de subiectivitate. În orice caz, deseori nu există o bază solidă pentru a afirma că forma aleasă a curbei este singura posibilă sau chiar mai bună pentru extrapolare în aceste condiții specifice;

2) estimarea parametrilor curbelor (cu alte cuvinte, estimarea tendinței) se bazează pe un set limitat de observații, fiecare conținând o componentă aleatorie. Datorită acestui fapt, parametrii curbei și, prin urmare, poziția acesteia în spațiu, sunt caracterizați de o oarecare incertitudine;

3) trendul caracterizează un anumit nivel mediu al seriei la fiecare moment în timp. Observațiile individuale, de regulă, s-au abătut de la ea în trecut. Este firesc să ne așteptăm ca astfel de abateri să apară în viitor.

Eroarea asociată celei de-a doua și a treia surse poate fi reflectată sub forma unui interval de încredere al prognozei la realizarea unor presupuneri despre proprietatea seriei. Utilizând acest interval, prognoza extrapolării punctelor este transformată în prognoza de intervale.

Este foarte posibil ca forma curbei care descrie tendința să nu fie aleasă corect sau când tendința de dezvoltare în viitor să se schimbe semnificativ și să nu urmeze tipul de curbă care a fost adoptat în timpul nivelarii. În ultimul caz, ipoteza de bază a extrapolării nu corespunde stării reale a lucrurilor. Curba găsită aliniază doar seria de timp și caracterizează tendința doar în perioada acoperită de observație. Extrapolarea unei astfel de tendințe va conduce inevitabil la un rezultat eronat, iar o eroare de acest gen nu poate fi estimată în avans. În acest sens, putem observa doar că, se pare, ar trebui să ne așteptăm la o creștere a unei astfel de erori (sau a probabilității apariției acesteia) cu o creștere a timpului de predicție.

Una dintre principalele sarcini care decurg din extrapolarea unei tendințe este determinarea intervalelor de încredere ale prognozei. Este intuitiv clar că baza pentru calculul intervalului de încredere prognozat ar trebui să fie o măsură a variabilității unui număr de valori ale semnului observat. Cu cât această fluctuație este mai mare, cu atât poziția tendinței în spațiu este mai puțin definită este „nivel - timp” și mai larg ar trebui să fie intervalul pentru variantele de prognoză cu același grad de încredere. Prin urmare, atunci când se construiește intervalul de încredere al prognozei, trebuie să se țină seama de estimarea oscilației sau a variației nivelurilor seriei. De obicei, o astfel de estimare este abaterea medie pătrată (abaterea standard) a observațiilor reale față de cele calculate obținute prin alinierea seriei de timp.

Înainte de a se determina intervalul de încredere al prognozei, este necesar să se facă o rezervare cu privire la o oarecare convenționalitate a calculului considerat mai jos. Ceea ce urmează este, într-o oarecare măsură, un transfer arbitrar al rezultatelor găsite pentru regresia indicatorilor de eșantion la analiza seriilor de timp. Cert este că asumarea unei analize de regresie despre normalitatea distribuției abaterilor în jurul liniei de regresie nu poate fi, în esență, afirmată necondiționat în analiza seriilor de timp.

Parametrii obținuți în timpul estimării statistice nu sunt exonerați de eroarea asociată faptului că cantitatea de informații pe baza căreia s-a efectuat estimarea este limitată și, într-un anumit sens, aceste informații pot fi considerate ca o probă. În orice caz, trecerea perioadei de observare cu o singură etapă sau adăugarea sau eliminarea membrilor seriei datorită faptului că fiecare membru al seriei conține o componentă aleatorie duce la o modificare a estimărilor numerice ale parametrilor. Prin urmare, valorile calculate au o încărcătură de incertitudine asociată cu erori în valoarea parametrilor.

În general, intervalul de încredere pentru o tendință este definit ca fiind

unde ¾ este eroarea medie pătrată a tendinței;

¾ valoarea estimată yT;

¾ valoare tStatisticile studenților.

Dacă t \u003d i+ L atunci ecuația va determina intervalul de încredere pentru o tendință extinsă de L unități de timp.

Interviul de încredere pentru prognoză ar trebui, în mod evident, să țină seama nu numai de incertitudinea asociată cu poziția tendinței, ci și de posibilitatea abaterii de la această tendință. În practică, există cazuri când este mai mult sau mai puțin justificat pentru extrapolare, puteți aplica mai multe tipuri de curbe. Mai mult, raționamentul se reduce uneori la următoarele. Deoarece fiecare dintre curbe caracterizează una dintre tendințele alternative, este evident că spațiul dintre tendințele extrapolate reprezintă o „zonă naturală de încredere” pentru valoarea prevăzută. Nu putem fi de acord cu această afirmație. În primul rând, deoarece fiecare dintre liniile de trend posibile corespunde unor ipoteze de dezvoltare acceptate anterior. Spațiul dintre tendințe nu este conectat cu niciuna dintre ele - prin intermediul acestuia puteți atrage un număr nelimitat de tendințe. De asemenea, trebuie adăugat că intervalul de încredere este asociat cu un anumit nivel de probabilitate de a trece dincolo de granițele sale. Spațiul dintre tendințe nu este asociat cu niciun nivel de probabilitate, ci depinde de alegerea tipurilor de curbe. Mai mult decât atât, cu un timp suficient de lung, acest spațiu, de regulă, devine atât de semnificativ încât un astfel de „interval de încredere” își pierde tot sensul.

Cu condiția ca erorile standard ale estimărilor parametrilor ecuației tendinței să fie luate în considerare (care, prin definiție, sunt selective și, prin urmare, pot să nu fie estimări ale parametrilor generali necunoscuți, datorită manifestării unei erori aleatorii de reprezentativitate) și, fără a ține cont de succesiunea transformărilor, obținem formula generală pentru intervalul de încredere al prognozei.

unde este valoarea previzionată calculată de ecuația tendinței pentru perioada t + L

¾ eroare medie pătrată a tendinței;

K - coeficient luând în considerare erorile coeficienților ecuației tendinței

¾ valoare tStatisticile studenților.

Coeficient LA calculat după cum urmează

n ¾ numărul de observații (lungimea unei serii de dinamici);

L este numărul de prognoze

Valoarea lui K depinde doar de n și L, adică de durata observației și de perioada de prognoză.

Un exemplu de calcul al prognozei și construirea unui interval de încredere pentru o prognoză.

Tendința optimă este o tendință liniară. . Este necesar să se calculeze prognozele privind volumele de import din Germania pentru 1996 și 1997. Pentru aceasta, este necesar să se determine valorile nivelurilor de tendință cu valorile factorului timp de 14 și 15.

Volumul importurilor din 1996:

Volumul importurilor din 1997:

Eroarea standard a tendinței este Sy \u003d 30.727. Coeficientul de încredere în distribuția studenților la un nivel de semnificație de 0,05 și numărul de grade de libertate este 2,16. Coeficientul K este egal cu 1.428:

Astfel, limita inferioară a primului interval de încredere este 378.62: 473.452-30.727 * 2.16 * 1.428.

Limita superioară este 568.28: 473.452 + 30.727 * 2.16 * 1.428.

Rezultatele calculului trebuie emise sub forma unui tabel și grafic

Valoarea actuală a importului în Germania pentru 1996

Import prognozat în Germania în 1996

Interval de încredere legat inferior 95%

Valoarea actuală a importului în Germania pentru 1997

Import prognozat în Germania în 1997

Limita superioară a intervalului de încredere de 95%

Acest grafic este desenat după cum urmează:

1) este necesar să faceți o copie a unui program existent de netezire a seriei dinamice cu o tendință liniară

2) adăugați valori lipsă (nivelurile reale ale seriilor pentru 1996 și 1997, previziuni pentru 1996 și 1997, precum și limitele intervalelor de încredere).

Programul este oarecum arbitrar, deoarece este puțin probabil să fie stabilită scala exactă. Puteți desena atât manual, cât și folosind instrumentele de desen Excel.