Autoregressive Moving-Average Simulation (First Order) Die Demonstration ist so eingestellt, dass die gleiche zufällige Reihe von Punkten verwendet wird, egal wie die Konstanten und vielfältig sind. Wenn jedoch die Taste quotrandomizequot gedrückt wird, wird eine neue Zufallsreihe erzeugt und verwendet. Wenn man die zufällige Serie identifiziert, kann der Benutzer genau die Effekte auf die ARMA-Reihe von Änderungen in den beiden Konstanten sehen. Die Konstante ist auf (-1,1) begrenzt, da sich die Divergenz der ARMA-Serie ergibt. Die Demonstration ist nur für einen ersten Auftrag. Zusätzliche AR-Begriffe würden es ermöglichen, komplexere Serien zu erzeugen, während zusätzliche MA-Begriffe die Glättung erhöhen würden. Für eine detaillierte Beschreibung der ARMA-Prozesse siehe z. B. G. Box, G. M. Jenkins und G. Reinsel, Zeitreihenanalyse: Prognose und Kontrolle. 3. Aufl. Englewood Cliffs, NJ: Prentice-Hall, 1994. RELATED LINKSAutoregressive Integrated Moving Average ARIMA (p, d, q) Modelle für die Zeitreihenanalyse In den bisherigen Artikeln (Teile 1. 2 und 3) gingen wir ausführlich über die AR (p), MA (q) und ARMA (p, q) lineare Zeitreihenmodelle. Wir haben diese Modelle verwendet, um simulierte Datensätze zu generieren, Modelle zu implementieren, um Parameter wiederherzustellen und diese Modelle dann auf finanzielle Aktiendaten anzuwenden. In diesem Artikel werden wir eine Erweiterung des ARMA-Modells diskutieren, nämlich das Autoregressive Integrated Moving Average Modell oder ARIMA (p, d, q) Modell. Wir werden sehen, dass es notwendig ist, das ARIMA-Modell zu betrachten, wenn wir nicht-stationäre Serien haben. Solche Reihen treten in Gegenwart von stochastischen Trends auf. Quick Recap und nächste Schritte Bisher haben wir die folgenden Modelle berücksichtigt (die Links führen Sie zu den entsprechenden Artikeln): Wir haben unser Verständnis von Zeitreihen stetig mit Konzepten wie serieller Korrelation, Stationarität, Linearität, Residuen, Korrelogrammen, Simulation, Anpassung, Saisonalität, bedingte Heterosedastizität und Hypothesentests. Bisher haben wir keine Vorhersage oder Prognose von unseren Modellen durchgeführt und haben daher keinen Mechanismus für die Herstellung eines Handelssystems oder einer Eigenkapitalkurve. Sobald wir ARIMA (in diesem Artikel), ARCH und GARCH (in den nächsten Artikeln) studiert haben, werden wir in der Lage sein, eine grundlegende langfristige Handelsstrategie auf der Grundlage der Vorhersage der Börsenindexrenditen zu erstellen. Trotz der Tatsache, dass ich in ein paar Details über Modelle gegangen bin, die wir kennen, wird letztlich keine große Leistung (AR, MA, ARMA) haben, sind wir nun in der Prozessreihenmodellierung gut vertraut. Dies bedeutet, dass wir, wenn wir kürzlich kommen, um neuere Modelle (und sogar die derzeit in der Forschungsliteratur) zu studieren, eine signifikante Wissensbasis haben, um zu zeichnen, um diese Modelle effektiv zu bewerten, anstatt sie als Schlüsselfertig zu behandeln Rezept oder Black Box. Noch wichtiger ist, dass es uns das Vertrauen geben wird, um sie auf eigene Faust zu erweitern und zu modifizieren und zu verstehen, was wir tun, wenn wir es tun. Ich bedanke mich davor, dass Sie so geduldig geduldig sind, wie es scheint, dass diese Artikel weit weg sind Die wirkliche Handlung des tatsächlichen Handels. Allerdings ist die wahre quantitative Handelsforschung sorgfältig, gemessen und nimmt erhebliche Zeit, um richtig zu werden. Es gibt keine schnelle Lösung oder reiches Angebot im Quanthandel. Wäre sehr beinahe bereit, unser erstes Trading-Modell zu betrachten, das eine Mischung aus ARIMA und GARCH sein wird, also ist es zwingend notwendig, dass wir einige Zeit damit verbringen, das ARIMA-Modell gut zu verstehen. Sobald wir unser erstes Trading-Modell gebaut haben, werden wir mehr darüber nachdenken Fortgeschrittene Modelle wie Langzeit-Prozesse, State-Space-Modelle (dh die Kalman Filter) und Vector Autoregressive (VAR) Modelle, die uns zu anderen, anspruchsvolleren Trading-Strategien führen wird. Autoregressive Integrated Moving Average (ARIMA) Modelle der Ordnung p, d, q ARIMA Modelle werden verwendet, weil sie eine nicht stationäre Serie auf eine stationäre Serie mit einer Folge von differenzierenden Schritten reduzieren können. Wir können uns von dem Artikel über Weißgeräusche und zufällige Spaziergänge erinnern, dass wir, wenn wir den Differenzoperator auf eine zufällige Spaziergangsserie (eine nicht stationäre Serie) anwenden, mit weißem Rauschen (eine stationäre Serie) verlassen werden: begin nabla xt xt - x wt Ende ARIMA führt diese Funktion im Wesentlichen durch, aber so wiederholt d mal, um eine nicht stationäre Serie auf eine stationäre zu reduzieren. Um andere Formen der Nicht-Stationarität jenseits der stochastischen Trends zu bewältigen, können zusätzliche Modelle verwendet werden. Saisonalitätseffekte (wie die, die bei den Rohstoffpreisen auftreten) können mit dem saisonalen ARIMA-Modell (SARIMA) angegangen werden, aber wir werden SARIMA nicht viel in dieser Serie besprechen. Bedingte heteroscedastische Effekte (wie bei Volatilitäts-Clustering in Aktienindizes) können mit ARCHGARCH angegangen werden. In diesem Artikel werden wir nicht-stationäre Serien mit stochastischen Trends und passen ARIMA Modelle zu diesen Serien. Wir werden auch endlich Prognosen für unsere Finanzreihe vorstellen. Definitionen Vor der Definition von ARIMA-Prozessen müssen wir das Konzept einer integrierten Baureihe diskutieren: Integrierte Serienreihenfolge d Eine Zeitreihe ist in der Reihenfolge d integriert. Ich (d), wenn: begin nablad xt wt end Das heißt, wenn wir die Serie d mal unterscheiden, erhalten wir eine diskrete weiße Rauschreihe. Alternativ mit dem Backward Shift Operator ist eine gleichwertige Bedingung: Nun, da wir eine integrierte Serie definiert haben, können wir den ARIMA-Prozess selbst definieren: Autoregressive Integrated Moving Average Modell der Ordnung p, d, q Eine Zeitreihe ist ein autoregressives integriertes gleitendes Mittelmodell Der Ordnung p, d, q. ARIMA (p, d, q). Wenn nablad xt ein autoregressiver gleitender Durchschnitt der Ordnung p, q, ARMA (p, q) ist. Das heißt, wenn die Serie d mal differenziert wird und dann folgt ein ARMA (p, q) Prozess, dann ist es eine ARIMA (p, d, q) Serie. Wenn wir die Polynomnotation aus Teil 1 und Teil 2 der ARMA-Serie verwenden, dann kann ein ARIMA (p, d, q) - Verfahren in Bezug auf den Backward Shift Operator geschrieben werden. : Wo wt ist eine diskrete weiße Rauschen Serie. Es gibt einige Punkte, um diese Definitionen zu beachten. Da der zufällige Spaziergang durch xt x wt gegeben ist, kann man sehen, daß ich (1) eine andere Darstellung ist, da nabla1 xt wt. Wenn wir einen nichtlinearen Trend vermuten, dann könnten wir in der Lage sein, wiederholtes Differenzieren (d. h. d gt 1) zu verwenden, um eine Reihe auf stationäres weißes Rauschen zu reduzieren. In R können wir den diff-Befehl mit zusätzlichen Parametern verwenden, z. B. Diff (x, d3), um wiederholte Unterschiede durchzuführen. Simulation, Correlogram und Model Fitting Da wir bereits den Befehl arima. sim verwendet haben, um einen ARMA (p, q) Prozess zu simulieren, ist das folgende Verfahren ähnlich dem, das in Teil 3 der ARMA Serie durchgeführt wurde. Der Hauptunterschied ist, dass wir nun d1 setzen werden, das heißt, wir produzieren eine nicht-stationäre Zeitreihe mit einer stochastischen Trending-Komponente. Wie zuvor werden wir ein ARIMA-Modell an unsere simulierten Daten anpassen, versuchen, die Parameter wiederherzustellen, Vertrauensintervalle für diese Parameter zu erzeugen, ein Korrelogramm der Residuen des eingebauten Modells zu erzeugen und schließlich einen Ljung-Box-Test durchzuführen, um festzustellen, ob wir haben eine gute Passform. Wir werden ein ARIMA (1,1,1) Modell simulieren, mit dem autoregressiven Koeffizienten alpha0.6 und dem gleitenden Mittelkoeffizienten beta-0,5. Hier ist der R-Code zu simulieren und zu plotten eine solche Serie: Nun, da wir unsere simulierten Serien haben, werden wir versuchen, ein ARIMA (1,1,1) Modell zu passen. Da wir die Bestellung kennen, werden wir sie einfach in der Passung angeben: Die Konfidenzintervalle werden wie folgt berechnet: Beide Parameterschätzungen fallen in die Konfidenzintervalle und liegen in der Nähe der wahren Parameterwerte der simulierten ARIMA-Serie. Daher sollten wir nicht überrascht sein, die Reste zu sehen, die wie eine Realisierung von diskreten weißen Rauschen aussehen: Schließlich können wir einen Ljung-Box-Test durchführen, um statistische Hinweise auf eine gute Passform zu geben: Wir können sehen, dass der p-Wert signifikant größer ist als 0,05 und als solche können wir sagen, dass es starke Beweise für diskrete weiße Rauschen ist eine gute Passung zu den Residuen. Daher ist das ARIMA (1,1,1) Modell eine gute Passform, wie erwartet. Finanzdaten und Vorhersage In diesem Abschnitt werden wir ARIMA-Modelle an Amazon, Inc. (AMZN) und den SampP500 US Equity Index (GPSC, in Yahoo Finance) passen. Wir werden von der Prognosebibliothek Gebrauch machen, geschrieben von Rob J Hyndman. Lets gehen Sie vor und installieren Sie die Bibliothek in R: Jetzt können wir mit quantmod die tägliche Preisreihe von Amazon ab Anfang 2013 herunterladen. Da wir bereits die ersten Bestellunterschiede der Serie gemacht haben, wird die ARIMA fit in Kürze durchgeführt Für die integrierte Komponente ist kein d gt 0 erforderlich: Wie in Teil 3 der ARMA-Serie werden wir nun die Kombinationen von p, d und q durchlaufen, um das optimale ARIMA (p, d, q) Modell zu finden. Durch optimal bedeutet man die Ordnungskombination, die das Akaike Information Criterion (AIC) minimiert: Wir können sehen, dass eine Reihenfolge von p4, d0, q4 ausgewählt wurde. Bemerkenswert d0, da wir bereits die ersten Größenordnungen oben genommen haben: Wenn wir das Korrelogramm der Residuen zeichnen, können wir sehen, ob wir Beweise für eine diskrete weiße Rauschreihe haben: Es gibt zwei signifikante Peaks, nämlich bei k15 und k21, obwohl wir sollten Erwarten, statistisch signifikante Spitzen zu sehen, einfach aufgrund der Stichprobenvariation 5 der Zeit. Lets einen Ljung-Box-Test durchführen (siehe vorheriger Artikel) und sehen, ob wir einen guten Anhaltspunkt haben: Wie wir sehen können, ist der p-Wert größer als 0,05 und so haben wir für eine gute Passform auf der 95-Ebene. Wir können nun den Prognosebefehl aus der Prognosebibliothek verwenden, um 25 Tage im Voraus für die Rückgabeserie von Amazon vorhersagen zu können: Wir können die Punktvorhersagen für die nächsten 25 Tage mit 95 (dunkelblau) und 99 (hellblauen) Fehlerbändern sehen . Wir werden diese Prognosen in unserer ersten Zeitreihenhandelsstrategie verwenden, wenn wir ARIMA und GARCH kombinieren. Für den SampP500 ist die gleiche Vorgehensweise erforderlich. Zuerst erhalten wir die Daten von quantmod und wandeln sie in einen täglichen Log-Return-Stream um: Wir passen ein ARIMA-Modell an, indem wir die Werte von p, d und q umschleifen: Die AIC sagt uns, dass das beste Modell die ARIMA (2,0, 1) Modell Beachten Sie noch einmal, dass d0, wie wir bereits erste Ordnung Unterschiede der Serie genommen haben: Wir können die Residuen des angepassten Modells zu sehen, ob wir Beweise für diskrete weiße Rauschen haben: Das Korrelogram sieht vielversprechend aus, so dass der nächste Schritt zu laufen ist Die Ljung-Box-Test und bestätigen, dass wir ein gutes Modell passen: Da der p-Wert größer als 0,05 ist, haben wir einen guten Modell. Warum ist das im vorigen Artikel unser Ljung-Box-Test für den SampP500 gezeigt, dass die ARMA (3,3) eine schlechte Passform für die täglichen Log-Rücksendungen war. Beachten Sie, dass ich die SampP500-Daten absichtlich ab 2013 in diesem Artikel abschneiden ließ , Die die flüchtigen Perioden um 2007-2008 praktisch ausschließt. Daher haben wir einen großen Teil des SampP500 ausgeschlossen, wo wir übermäßiges Volatilitäts-Clustering hatten. Dies wirkt sich auf die serielle Korrelation der Serie aus und hat daher die Wirkung, dass die Serie stationärer ist als in der Vergangenheit. Das ist ein wichtiger Punkt. Bei der Analyse von Zeitreihen müssen wir sehr vorsichtig auf bedingte heteroscedastische Serien wie Börsenindizes sein. In der quantitativen Finanzierung wird versucht, Perioden unterschiedlicher Volatilität zu bestimmen, oft als Regimierungserkennung bekannt. Es ist eine der härteren Aufgaben zu erreichen Gut diskutieren diesen Punkt in der nächsten Artikel, wenn wir kommen, um die ARCH und GARCH Modelle zu betrachten. Lets jetzt eine Prognose für die nächsten 25 Tage der SampP500 täglichen Log-Renditen: Nun, da wir die Fähigkeit haben, passen und prognostizieren Modelle wie ARIMA, waren sehr nahe in der Lage, Strategie-Indikatoren für den Handel zu schaffen. Nächste Schritte Im nächsten Artikel werden wir uns das Modell der generalisierten autoregressiven bedingten Heteroscedastizität (GARCH) anschauen und es verwenden, um mehr über die serielle Korrelation in bestimmten Aktien und Aktienindexreihen zu erläutern. Sobald wir GARCH besprochen haben, werden wir in der Lage sein, es mit dem ARIMA-Modell zu kombinieren und Signalindikatoren und damit eine grundlegende quantitative Handelsstrategie zu erstellen. Just Getting Started mit Quantitative TradingDocumentation a ist ein konstanter Vektor von Offsets, mit n Elementen. A i sind n - by-n Matrizen für jedes i. Die A sind autoregressive Matrizen. Es gibt p autoregressive Matrizen. 949 t ist ein Vektor von seriell unkorrelierten Innovationen. Vektoren der Länge n Die 949 t sind multivariate normale Zufallsvektoren mit einer Kovarianzmatrix Q. Wobei Q eine Identitätsmatrix ist, sofern nicht anders angegeben. Bj sind n - by-Matrix für jedes j. Die Bj bewegen die durchschnittlichen Matrizen. Es gibt q gleitende durchschnittliche Matrizen. X t ist eine n - by-Matrix, die exogene Terme zu jedem Zeitpunkt t darstellt. R ist die Anzahl der exogenen Serien. Exogene Ausdrücke sind Daten (oder andere ungemusterte Eingänge) zusätzlich zu der Antwortzeitreihe y t. B ist ein konstanter Vektor von Regressionskoeffizienten der Größe r. So ist das Produkt X t middotb ein Vektor der Größe n. Im allgemeinen sind die Zeitreihen y t und X t beobachtbar. Mit anderen Worten, wenn Sie Daten haben, stellt es eine oder beide dieser Serien dar. Du kennst nicht immer den Offset a. Koeffizient b. Autoregressive Matrizen A i. Und gleitende mittlere Matrizen B j. Sie möchten diese Parameter in der Regel an Ihre Daten anpassen. Siehe die vgxvarx-Funktionsreferenzseite für die Möglichkeit, unbekannte Parameter abzuschätzen. Die Innovationen 949 t sind nicht zu beobachten, zumindest in Daten, obwohl sie in Simulationen beobachtbar sind. Lag Operator Representation Es gibt eine äquivalente Darstellung der linearen autoregressiven Gleichungen in Bezug auf Lagoperatoren. Der Lagoperator L verschiebt den Zeitindex um eins zurück: L y t y t 82111. Der Operator L m verschiebt den Zeitindex um m zurück. L m y t y t 8211 m In der Verzögerungsoperatorform wird die Gleichung für ein SVARMAX (Modell q) r) Modell (A 0 x 2212 x 2211 i 1 p A i L i) y t a X t b (B 0 x 2211 j 1 q B j L j) x03B5 t Diese Gleichung kann als A (L) y t a X t b B (L) x03B5 t geschrieben werden. Ein VAR-Modell ist stabil, wenn det (I n x2212 A 1 z x2212 A 2 z 2 x 2212 x 2212 A pzp) x2260 0 x00A0x00A0forx00A0x00A0 z x2264 1. Diese Bedingung impliziert, dass bei allen Innovationen gleich Null der VAR-Prozess zu einem konvergiert wie die Zeit vergeht. Siehe Luumltkepohl 74 Kapitel 2 für eine Diskussion. Ein VMA-Modell ist invertierbar, wenn det (I n B 1 z B 2 z 2 B q z q) x2260 0 x00A0x00A0forx00A0x00A0 z x2264 1. Diese Bedingung impliziert, dass die reine VAR-Darstellung des Prozesses stabil ist. Für eine Erläuterung, wie man zwischen VAR - und VMA-Modellen umwandelt, siehe Ändern von Modelldarstellungen. Siehe Luumltkepohl 74 Kapitel 11 für eine Diskussion über invertierbare VMA-Modelle. Ein VARMA-Modell ist stabil, wenn sein VAR-Teil stabil ist. Ähnlich ist ein VARMA-Modell invertierbar, wenn sein VMA-Teil invertierbar ist. Es gibt keinen klar definierten Begriff der Stabilität oder Umkehrbarkeit für Modelle mit exogenen Eingaben (z. B. VARMAX-Modelle). Ein exogener Eingang kann ein Modell destabilisieren. VAR-Modelle aufbauen Um ein mehrfaches Zeitreihenmodell oder mehrere Zeitreihendaten zu verstehen, führen Sie in der Regel folgende Schritte durch: Importieren und Vorverarbeiten von Daten. Geben Sie ein Modell an. Spezifikation Strukturen ohne Parameter Werte, um ein Modell zu spezifizieren, wenn Sie möchten, dass MATLAB x00AE die Parameter spezifizieren Spezifikationsstrukturen mit ausgewählten Parameterwerten, um ein Modell anzugeben, in dem Sie einige Parameter kennen und MATLAB schätzen, um die anderen zu bestimmen, die eine bestimmte Anzahl von Lags bestimmen, um zu bestimmen Eine passende Anzahl von Verzögerungen für Ihr Modell Passen Sie das Modell an Daten an. Anpassen von Modellen an Daten, um vgxvarx zu verwenden, um die unbekannten Parameter in Ihren Modellen abzuschätzen. Dies kann Folgendes beinhalten: Ändern von Modelldarstellungen, um Ihr Modell auf einen Typ zu ändern, den vgxvarx behandelt analysiert und prognostiziert mit dem eingebauten Modell. Dies kann Folgendes beinhalten: Untersuchen der Stabilität eines angepassten Modells, um festzustellen, ob Ihr Modell stabil und invertierbar ist. VAR-Modell Prognose, um direkt von Modellen zu prognostizieren oder mit einer Monte-Carlo-Simulation zu prognostizieren. Berechnen von Impulsantworten zur Berechnung von Impulsantworten, die Prognosen auf der Grundlage einer angenommenen Änderung einer Eingabe in eine Zeitreihe geben. Vergleichen Sie die Ergebnisse Ihrer Modellvorhersagen mit Daten, die für die Prognose ausgehändigt wurden. Ein Beispiel finden Sie unter VAR Model Case Study. Ihre Anwendung muss nicht alle Schritte in diesem Workflow beinhalten. Zum Beispiel haben Sie keine Daten, sondern wollen ein parametrisiertes Modell simulieren. In diesem Fall würden Sie nur die Schritte 2 und 4 des generischen Workflows durchführen. Sie können durch einige dieser Schritte iterieren. Verwandte Beispiele Wählen Sie Ihr LandAutoregressive gleitende durchschnittliche Fehlerprozesse (ARMA-Fehler) und andere Modelle, die Verzögerungen von Fehlerbegriffen beinhalten, können mit Hilfe von FIT-Anweisungen geschätzt und mit SOLVE-Anweisungen simuliert oder prognostiziert werden. ARMA-Modelle für den Fehlerprozess werden oft für Modelle mit autokorrelierten Resten verwendet. Das AR-Makro kann verwendet werden, um Modelle mit autoregressiven Fehlerprozessen festzulegen. Das MA-Makro kann verwendet werden, um Modelle mit gleitenden durchschnittlichen Fehlerprozessen zu spezifizieren. Autoregressive Fehler Ein Modell mit Autoregressivfehlern erster Ordnung, AR (1), hat die Form, während ein AR (2) Fehlerprozess die Form und so weiter für höherwertige Prozesse hat. Beachten Sie, dass die s unabhängig und identisch verteilt sind und einen erwarteten Wert von 0 haben. Ein Beispiel für ein Modell mit einer AR (2) - Komponente ist und so weiter für höherwertige Prozesse. Zum Beispiel können Sie ein einfaches lineares Regressionsmodell mit MA (2) gleitenden Durchschnittsfehlern schreiben, da MA1 und MA2 die gleitenden Durchschnittsparameter sind. Beachten Sie, dass RESID. Y automatisch von PROC MODEL definiert wird. Die ZLAG-Funktion muss für MA-Modelle verwendet werden, um die Rekursion der Verzögerungen abzuschneiden. Damit wird sichergestellt, dass die verzögerten Fehler in der Lag-Priming-Phase bei Null beginnen und bei fehlenden Fehlern keine fehlenden Werte ausbreiten, und es stellt sicher, dass die zukünftigen Fehler null sind, anstatt während der Simulation oder Prognose zu fehlen. Einzelheiten zu den Lag-Funktionen finden Sie im Abschnitt Lag Logic. Dieses Modell, das mit dem MA-Makro geschrieben wurde, lautet wie folgt: Allgemeines Formular für ARMA-Modelle Das allgemeine ARMA (p, q) - Verfahren hat folgendes Formular Ein ARMA (p, q) - Modell kann wie folgt angegeben werden: wobei AR i und MA j repräsentieren Die autoregressiven und gleitenden Durchschnittsparameter für die verschiedenen Verzögerungen. Sie können alle Namen, die Sie für diese Variablen wollen, und es gibt viele gleichwertige Möglichkeiten, dass die Spezifikation geschrieben werden könnte. Vektor-ARMA-Prozesse können auch mit PROC MODEL geschätzt werden. Beispielsweise kann ein zwei-variables AR (1) - Verfahren für die Fehler der beiden endogenen Variablen Y1 und Y2 wie folgt spezifiziert werden: Konvergenzprobleme mit ARMA-Modellen ARMA-Modelle können schwer abzuschätzen sein. Wenn die Parameterschätzungen nicht innerhalb des entsprechenden Bereichs liegen, wachsen ein gleitender Durchschnittsrestbestand exponentiell. Die berechneten Residuen für spätere Beobachtungen können sehr groß sein oder überlaufen. Dies kann entweder geschehen, weil falsche Startwerte verwendet wurden oder weil die Iterationen von vernünftigen Werten entfernt wurden. Bei der Auswahl von Startwerten für ARMA-Parameter sollte die Pflege verwendet werden. Startwerte von 0,001 für ARMA-Parameter funktionieren in der Regel, wenn das Modell die Daten gut passt und das Problem gut konditioniert ist. Beachten Sie, dass ein MA-Modell oft durch ein höheres AR-Modell angenähert werden kann und umgekehrt. Dies kann zu einer hohen Kollinearität in gemischten ARMA-Modellen führen, was wiederum eine ernsthafte Konditionierung in den Berechnungen und Instabilitäten der Parameterschätzungen verursachen kann. Wenn Sie Konvergenzprobleme haben, während Sie ein Modell mit ARMA-Fehlerprozessen abschätzen, versuchen Sie es in Schritten zu schätzen. Zuerst verwenden Sie eine FIT-Anweisung, um nur die strukturellen Parameter mit den ARMA-Parametern auf Null (oder vernünftige vorherige Schätzungen falls vorhanden) abzuschätzen. Als nächstes verwenden Sie eine andere FIT-Anweisung, um die ARMA-Parameter nur mit den strukturellen Parameterwerten aus dem ersten Lauf zu schätzen. Da die Werte der Strukturparameter wahrscheinlich nahe an ihren endgültigen Schätzungen liegen, können die ARMA-Parameter-Schätzungen nun konvergieren. Schließlich verwenden Sie eine andere FIT-Anweisung, um simultane Schätzungen aller Parameter zu erzeugen. Da die Anfangswerte der Parameter nun wahrscheinlich ganz nahe bei ihren endgültigen gemeinsamen Schätzungen liegen, sollten die Schätzungen schnell konvergieren, wenn das Modell für die Daten geeignet ist. AR Anfangsbedingungen Die anfänglichen Verzögerungen der Fehlerausdrücke von AR (p) - Modellen können auf unterschiedliche Weise modelliert werden. Die autoregressiven Fehlerstartmethoden, die von SASETS-Prozeduren unterstützt werden, sind die folgenden: bedingte kleinste Quadrate (ARIMA - und MODELL-Prozeduren) bedingungslose kleinste Quadrate (AUTOREG-, ARIMA - und MODELL-Prozeduren) maximale Wahrscheinlichkeit (AUTOREG-, ARIMA - und MODELL-Prozeduren) Yule-Walker (AUTOREG Vorgehensweise) Hildreth-Lu, der die ersten P-Beobachtungen löscht (nur MODEL-Verfahren) Siehe Kapitel 8, Das AUTOREG-Verfahren für eine Erläuterung und Diskussion der Vorzüge verschiedener AR (p) Startmethoden. Die CLS-, ULS-, ML - und HL-Initialisierungen können von PROC MODEL durchgeführt werden. Bei AR (1) Fehlern können diese Initialisierungen wie in Tabelle 18.2 gezeigt hergestellt werden. Diese Methoden sind in großen Proben äquivalent. Tabelle 18.2 Initialisierungen von PROC MODEL: AR (1) FEHLER Die anfänglichen Verzögerungen der Fehlerterme von MA (q) Modellen können auch auf unterschiedliche Weise modelliert werden. Die folgenden gleitenden durchschnittlichen Fehler-Start-up-Paradigmen werden von den ARIMA - und MODEL-Prozeduren unterstützt: bedingungslose kleinste Quadrate bedingte kleinste Quadrate Die bedingte Methode der kleinsten Quadrate, um gleitende durchschnittliche Fehlerbegriffe zu schätzen, ist nicht optimal, da sie das Start-Problem ignoriert. Dies verringert die Effizienz der Schätzungen, obwohl sie selbständig bleiben. Die anfänglichen verzögerten Residuen, die sich vor dem Start der Daten erstrecken, werden als 0 angenommen, ihr unbedingter Erwartungswert. Dies führt zu einem Unterschied zwischen diesen Residuen und den verallgemeinerten kleinsten Quadraten-Resten für die gleitende Durchschnittskovarianz, die im Gegensatz zum autoregressiven Modell durch den Datensatz bestehen bleibt. Normalerweise konvergiert diese Differenz schnell auf 0, aber für fast nicht umwandelbare gleitende Mittelprozesse ist die Konvergenz ziemlich langsam. Um dieses Problem zu minimieren, sollten Sie genügend Daten haben, und die gleitenden durchschnittlichen Parameterschätzungen sollten innerhalb des invertierbaren Bereichs liegen. Dieses Problem kann auf Kosten des Schreibens eines komplexeren Programms korrigiert werden. Unbedingte kleinste Quadrate Schätzungen für die MA (1) Prozess kann durch die Angabe des Modells wie folgt produziert werden: Moving-Average-Fehler können schwer abzuschätzen. Sie sollten eine AR (p) - Animation an den gleitenden Mittelprozess anwenden. Ein gleitender Durchschnittsprozess kann in der Regel durch einen autoregressiven Prozess gut angenähert werden, wenn die Daten nicht geglättet oder differenziert wurden. Das AR-Makro Das SAS-Makro AR erzeugt Programmieranweisungen für PROC MODEL für autoregressive Modelle. Das AR-Makro ist Teil der SASETS-Software und es sind keine speziellen Optionen erforderlich, um das Makro zu verwenden. Der autoregressive Prozess kann auf die strukturellen Gleichungsfehler oder auf die endogene Reihe selbst angewendet werden. Das AR-Makro kann für die folgenden Autoregressionstypen verwendet werden: uneingeschränkte Vektorautoregression eingeschränkte Vektorautoregression Univariate Autoregression Um den Fehlerterm einer Gleichung als autoregressiven Prozess zu modellieren, verwenden Sie nach der Gleichung die folgende Aussage: Angenommen, Y ist ein Lineare Funktion von X1, X2 und einem AR (2) Fehler. Sie würden dieses Modell wie folgt schreiben: Die Anrufe nach AR müssen nach allen Gleichungen kommen, auf die der Prozess zutrifft. Der vorangehende Makroaufruf, AR (y, 2), erzeugt die in der LIST-Ausgabe in Abbildung 18.58 dargestellten Anweisungen. Abbildung 18.58 LIST Option Ausgang für ein AR (2) - Modell Die PRED-vordefinierten Variablen sind temporäre Programmvariablen, so dass die Verzögerungen der Residuen die korrekten Residuen sind und nicht die durch diese Gleichung neu definierten. Beachten Sie, dass dies den Aussagen entspricht, die explizit im Abschnitt Allgemeine Formular für ARMA-Modelle geschrieben sind. Sie können die autoregressiven Parameter auch bei ausgewählten Lags auf Null setzen. Wenn Sie z. B. autoregressive Parameter bei den Ziffern 1, 12 und 13 wünschen, können Sie die folgenden Aussagen verwenden: Diese Aussagen erzeugen die in Abbildung 18.59 dargestellte Ausgabe. Abbildung 18.59 LIST Option Ausgang für ein AR-Modell mit Lags bei 1, 12 und 13 Das MODEL Procedure Listing von Compiled Program Code Statement als Parsed PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. Y PRED. Y - y OLDPRED. y PRED. y yl1 ZLAG1 (y - perdy) yl12 ZLAG12 (y - perdy) yl13 ZLAG13 (y - perdy) RESID. y PRED. y - ACTUAL. y ERROR. Y PRED. y - y Es gibt Variationen der bedingten Methode der kleinsten Quadrate, je nachdem, ob Beobachtungen zu Beginn der Serie zum Aufwärmen des AR-Prozesses verwendet werden. Standardmäßig verwendet die AR-bedingte Methode der kleinsten Quadrate alle Beobachtungen und nimmt Nullen für die anfänglichen Verzögerungen autoregressiver Begriffe an. Durch die Verwendung der M-Option können Sie anfordern, dass AR die unbedingte Methode der kleinsten Quadrate (ULS) oder Maximum-Likelihood (ML) verwendet. Zum Beispiel finden die Diskussionen dieser Methoden im Abschnitt AR Anfangsbedingungen. Mit der Option MCLS n können Sie anfordern, dass die ersten n Beobachtungen verwendet werden, um Schätzungen der ursprünglichen autoregressiven Verzögerungen zu berechnen. In diesem Fall beginnt die Analyse mit der Beobachtung n 1. Zum Beispiel: Mit dem AR-Makro können Sie mit der Option TYPEV ein autoregressives Modell an die endogene Variable anstelle des Fehlerbegriffs anwenden. Wenn Sie zum Beispiel die fünf vergangenen Verzögerungen von Y der Gleichung im vorherigen Beispiel hinzufügen möchten, können Sie mit AR die Parameter und Verzögerungen verwenden, indem Sie die folgenden Anweisungen verwenden: Die vorherigen Anweisungen erzeugen die in Abbildung 18.60 dargestellte Ausgabe. Abbildung 18.60 LIST Option Ausgang für ein AR-Modell von Y Dieses Modell prognostiziert Y als lineare Kombination von X1, X2, einem Intercept und den Werten von Y in den letzten fünf Perioden. Unbeschränkte Vektor-Autoregression Um die Fehlerterme eines Satzes von Gleichungen als autoregressiver Autorektor zu modellieren, verwenden Sie nach den Gleichungen die folgende Form des AR-Makros: Der Prozeßname-Wert ist ein beliebiger Name, den Sie für AR verwenden, um Namen für den autoregressiven zu verwenden Parameter. Sie können das AR-Makro verwenden, um mehrere verschiedene AR-Prozesse für verschiedene Sätze von Gleichungen zu modellieren, indem Sie für jeden Satz unterschiedliche Prozessnamen verwenden. Der Prozessname stellt sicher, dass die verwendeten Variablennamen eindeutig sind. Verwenden Sie einen kurzen Prozessnamenwert für den Prozess, wenn Parameterschätzungen in einen Ausgabedatensatz geschrieben werden sollen. Das AR-Makro versucht, Parameternamen zu erstellen, die kleiner oder gleich acht Zeichen sind, aber dies ist durch die Länge des Prozessnamens begrenzt. Die als Präfix für die AR-Parameternamen verwendet wird. Der Variablenwert ist die Liste der endogenen Variablen für die Gleichungen. Angenommen, dass Fehler für die Gleichungen Y1, Y2 und Y3 durch einen autoregressiven Prozess zweiter Ordnung erzeugt werden. Sie können die folgenden Aussagen verwenden, die für Y1 und einen ähnlichen Code für Y2 und Y3 generieren: Für die Vektorprozesse kann nur die Methode der bedingten kleinsten Quadrate (MCLS oder MCLS n) verwendet werden. Sie können auch das gleiche Formular mit Einschränkungen verwenden, dass die Koeffizientenmatrix bei ausgewählten Lags 0 ist. Zum Beispiel geben die folgenden Aussagen einen Vektorprozess dritter Ordnung an die Gleichungsfehler mit allen Koeffizienten bei Verzögerung 2, die auf 0 beschränkt ist, und mit den Koeffizienten bei Verzögerungen 1 und 3 uneingeschränkt: Sie können die drei Serien Y1Y3 als Vektor autoregressiven Prozess modellieren In den Variablen statt in den Fehlern mit der Option TYPEV. Wenn du Y1Y3 als Funktion von vergangenen Werten von Y1Y3 und einigen exogenen Variablen oder Konstanten modellieren möchtest, kannst du mit AR die Aussagen für die Verzögerungsbedingungen erzeugen. Schreiben Sie für jede Variable eine Gleichung für den nichtautoregressiven Teil des Modells und rufen Sie dann AR mit der Option TYPEV auf. Zum Beispiel kann der nichtautoregressive Teil des Modells eine Funktion von exogenen Variablen sein, oder es können Abschnittsparameter sein. Wenn es keine exogenen Komponenten für das Vektor-Autoregression-Modell gibt, einschließlich keine Abschnitte, dann ordnen Sie jeder der Variablen Null zu. Es muss eine Zuordnung zu jeder der Variablen geben, bevor AR aufgerufen wird. Dieses Beispiel modelliert den Vektor Y (Y1 Y2 Y3) als lineare Funktion nur seines Wertes in den vorherigen zwei Perioden und einen weißen Rauschfehlervektor. Das Modell hat 18 (3 3 3 3) Parameter. Syntax des AR-Makros Es gibt zwei Fälle der Syntax des AR-Makros. Wenn keine Beschränkungen für einen Vektor-AR-Prozess erforderlich sind, gibt die Syntax des AR-Makros das allgemeine Formular ein Präfix für AR, das beim Erstellen von Namen von Variablen verwendet wird, die benötigt werden, um den AR-Prozess zu definieren. Wenn der Endolist nicht angegeben ist, wird die endogene Liste standardmäßig benannt. Die der Name der Gleichung sein muss, auf die der AR-Fehlerprozess angewendet werden soll. Der Name Wert darf 32 Zeichen nicht überschreiten. Ist die Reihenfolge des AR-Prozesses. Gibt die Liste der Gleichungen an, auf die der AR-Prozess angewendet werden soll. Wenn mehr als ein Name gegeben ist, wird ein uneingeschränkter Vektorprozess mit den strukturellen Resten aller Gleichungen erzeugt, die als Regressoren in jeder der Gleichungen enthalten sind. Wenn nicht angegeben, wird endolist standardmäßig benannt. Gibt die Liste der Verzögerungen an, an denen die AR-Begriffe hinzugefügt werden sollen. Die Koeffizienten der Terme, die nicht aufgeführt sind, werden auf 0 gesetzt. Alle aufgeführten Lags müssen kleiner oder gleich nlag sein. Und es muss keine Duplikate geben. Wenn nicht angegeben, wird die Laglist standardmäßig auf alle Verzögerungen 1 bis nlag gesetzt. Legt die zu implementierende Schätzmethode fest. Gültige Werte von M sind CLS (bedingte kleinste Quadrate Schätzungen), ULS (unbedingte kleinste Quadrate Schätzungen) und ML (Maximum Likelihood Schätzungen). MCLS ist die Voreinstellung. Nur MCLS ist erlaubt, wenn mehr als eine Gleichung angegeben ist. Die ULS - und ML-Methoden werden für AR-Modelle von AR nicht unterstützt. Dass der AR-Prozess auf die endogenen Variablen selbst anstatt auf die strukturellen Residuen der Gleichungen angewendet werden soll. Eingeschränkte Vektor-Autoregression Sie können steuern, welche Parameter in den Prozess aufgenommen werden, und beschränken auf 0 die Parameter, die Sie nicht enthalten. Zuerst verwenden Sie AR mit der Option DEFER, um die Variablenliste zu deklarieren und die Dimension des Prozesses zu definieren. Verwenden Sie dann zusätzliche AR-Aufrufe, um Begriffe für ausgewählte Gleichungen mit ausgewählten Variablen an ausgewählten Lags zu erzeugen. Zum Beispiel sind die erzeugten Fehlergleichungen wie folgt: Dieses Modell besagt, dass die Fehler für Y1 von den Fehlern von Y1 und Y2 (aber nicht Y3) an beiden Verzögerungen 1 und 2 abhängen und dass die Fehler für Y2 und Y3 davon abhängen Die vorherigen Fehler für alle drei Variablen, aber nur bei Verzögerung 1. AR-Makro-Syntax für eingeschränkte Vektor-AR Eine alternative Verwendung von AR erlaubt es, Einschränkungen für einen Vektor-AR-Prozess aufzuerlegen, indem man AR mehrmals aufruft, um verschiedene AR-Terme und Verzögerungen für verschiedene anzugeben Gleichungen. Der erste Aufruf hat das allgemeine Formular spezifiziert ein Präfix für AR, das beim Erstellen von Namen von Variablen verwendet wird, die benötigt werden, um den Vektor-AR-Prozess zu definieren. Gibt die Reihenfolge des AR-Prozesses an. Gibt die Liste der Gleichungen an, auf die der AR-Prozess angewendet werden soll. Gibt an, dass AR nicht den AR-Prozess generieren soll, sondern auf weitere Informationen warten muss, die in späteren AR-Aufrufen für denselben Namenswert angegeben sind. Die nachfolgenden Anrufe haben die allgemeine Form ist die gleiche wie im ersten Aufruf. Gibt die Liste der Gleichungen an, auf die die Spezifikationen dieses AR-Aufrufs angewendet werden sollen. Nur Namen, die im endolistischen Wert des ersten Aufrufs für den Namen Wert angegeben sind, können in der Liste der Gleichungen in der eqlist erscheinen. Spezifiziert die Liste der Gleichungen, deren verzögerte strukturelle Residuen als Regressoren in den Gleichungen in eqlist aufgenommen werden sollen. Nur Namen im Endolisten des ersten Aufrufs für den Namenswert können in varlist erscheinen. Wenn nicht angegeben, varlist standardmäßig endolist. Gibt die Liste der Verzögerungen an, an denen die AR-Begriffe hinzugefügt werden sollen. Die Koeffizienten der Terme, die nicht aufgeführt sind, werden auf 0 gesetzt. Alle aufgeführten Lags müssen kleiner oder gleich dem Wert von nlag sein. Und es muss keine Duplikate geben. Wenn nicht angegeben, wird die Laglist standardmäßig auf alle Verzögerungen 1 bis nlag gesetzt. Das MA-Makro Das SAS-Makro MA generiert Programmierungsanweisungen für PROC MODEL für gleitende Durchschnittsmodelle. Das MA-Makro ist Teil der SASETS-Software und es sind keine speziellen Optionen erforderlich, um das Makro zu verwenden. Der gleitende durchschnittliche Fehlerprozess kann auf die strukturellen Gleichungsfehler angewendet werden. Die Syntax des MA-Makros ist das gleiche wie das AR-Makro, außer es gibt kein TYPE-Argument. Wenn Sie die MA - und AR-Makros kombinieren, muss das MA-Makro dem AR-Makro folgen. Die folgenden SASIML-Anweisungen erzeugen einen ARMA (1, (1 3)) Fehlerprozess und speichern ihn im Datensatz MADAT2. Die folgenden PROC MODEL-Anweisungen werden verwendet, um die Parameter dieses Modells mit Hilfe der Maximum-Likelihood-Fehlerstruktur zu schätzen: Die Schätzungen der Parameter, die durch diesen Lauf erzeugt werden, sind in Abbildung 18.61 dargestellt. Abbildung 18.61 Schätzungen aus einem ARMA (1, (1 3)) Prozess Es gibt zwei Fälle der Syntax für das MA-Makro. Wenn Einschränkungen für einen Vektor-MA-Prozess nicht benötigt werden, gibt die Syntax des MA-Makros das allgemeine Formular ein Präfix für MA an, das beim Erstellen von Namen von Variablen verwendet wird, die benötigt werden, um den MA-Prozess zu definieren und ist der Standard-Endolist. Ist die Reihenfolge des MA-Prozesses. Gibt die Gleichungen an, auf die der MA-Prozess angewendet werden soll. Wenn mehr als ein Name angegeben ist, wird die CLS-Schätzung für den Vektorprozess verwendet. Gibt die Verzögerungen an, bei denen die MA-Bedingungen hinzugefügt werden sollen. Alle aufgeführten Lags müssen kleiner oder gleich nlag sein. Und es muss keine Duplikate geben. Wenn nicht angegeben, wird die Laglist standardmäßig auf alle Verzögerungen 1 bis nlag gesetzt. Legt die zu implementierende Schätzmethode fest. Gültige Werte von M sind CLS (bedingte kleinste Quadrate Schätzungen), ULS (unbedingte kleinste Quadrate Schätzungen) und ML (Maximum Likelihood Schätzungen). MCLS ist die Voreinstellung. Nur MCLS ist erlaubt, wenn im Endolisten mehr als eine Gleichung angegeben ist. MA Makro-Syntax für eingeschränkte Vektor-Moving-Average Eine alternative Verwendung von MA erlaubt es, Einschränkungen für einen Vektor-MA-Prozess aufzuerlegen, indem man MA mehrmals aufruft, um verschiedene MA-Terme anzugeben und für verschiedene Gleichungen zu verzögern. Der erste Aufruf hat das allgemeine Formular spezifiziert ein Präfix für MA, das beim Erstellen von Namen von Variablen verwendet wird, die benötigt werden, um den Vektor-MA-Prozess zu definieren. Gibt die Reihenfolge des MA-Prozesses an. Gibt die Liste der Gleichungen an, auf die der MA-Prozess angewendet werden soll. Gibt an, dass MA nicht den MA-Prozess generieren soll, sondern auf weitere Informationen warten muss, die in späteren MA-Aufrufen für denselben Namenswert angegeben sind. Die nachfolgenden Anrufe haben die allgemeine Form ist die gleiche wie im ersten Aufruf. Gibt die Liste der Gleichungen an, auf die die Spezifikationen dieses MA-Aufrufs angewendet werden sollen. Spezifiziert die Liste der Gleichungen, deren verzögerte strukturelle Residuen als Regressoren in den Gleichungen in eqlist aufgenommen werden sollen. Gibt die Liste der Verzögerungen an, bei denen die MA-Bedingungen hinzugefügt werden sollen.
No comments:
Post a Comment