Auf Taminos Blog gibt es gerade einen sehr interessanten Beitrag, der die Gefahren des Auswählens von Abschnitten aus einer Datenreihe deutlich macht. Üblicherweise kann ich die Signifikanz eines Trends, den ich aus einer Zeitreihe bestimme, berechnen. Dabei mache ich einen Hypothesentest, ob der Trendparameter gleich Null sein könnte. Die Differenz zweier normalverteilter statistischer Größen folgt einer t-Statistik. Mit dem t-Test kann ich also untersuchen, ob der gefundene Trendparameter mit einer gewissen Wahrscheinlichkeit gleich Null sein könnte. Übersteigt das Ergebnis des t-Tests einen gewissen Wert, der von der Zahl der Freiheitsgrade (Zahl der unabhängigen Werte) abhängig ist, wird die Hypothese zurückgewiesen, daß der Trendparameter mit der zugehörigen Wahrscheinlichkeit gleich Null sein könnte.
Das ganze setzt voraus, daß der Trendparameter tatsächlich aus einer Normalverteilung stammt. Wähle ich mir nun Daten aus einer Grundgesamtheit aus, indem ich zusätzliche Bedingungen stelle, sind meine Trendparameter aber nicht länger normalverteilt. Ich muß meinen t-Test entsprechend anpassen oder mit einer anderen Statistik arbeiten. In der Realität kann das folgendermaßen aussehen.
Ich habe eine Zeitreihe und stelle fest, daß ich für einen Teil der Daten einen Trend berechnen kann. Hätte ich für alle Daten den Trend berechnet, hätte ich ihn aus einer zufälligen Verteilung entnommen. Ich könnte mir zum Beispiel vorstellen, daß es 1000 Erden gibt. Das Klima auf jeder Erde ist gleich. Aber die Reihenfolge von Wetterereignissen ist auf jeder dieser Erden zufällig anders. Auf jeder dieser Erden kann in einer trendlosen Zeitreihe zufällig eine Folge von Jahren kommen, die zufällig einen scheinbaren Trend zeigen. Mein t-Test schließt ja nicht aus, daß ein signifikanter Trend doch nicht signifikant ist. Es ist nur extrem unwahrscheinlich. Schaue ich mir alle meine 1000 Erden an, sehe ich, daß mein scheinbarer Trend für diesen Zeitabschnitt nur auf einer Erde auftritt und auf allen anderen nicht. Ich kann die Wahrscheinlichkeit dafür erhöhen, daß ich einen Scheintrend sehe, wenn ich meine Zeitreihe an einem ausgezeichneten Punkt, zum Beispiel einem Maximum oder Minimum beginnen lasse. Wenn ich also eine Auswahl vornehme, stimmen die Kriterien nicht mehr, um einen normalen Signifikanztest anzuwenden.
Diese 1000 Erden simuliert Tamino, um dann den wahren Vergleichswert für einen t-Test zu bestimmen, wenn man sich den Zeitraum seiner Zeitreihe auswählt. Das heißt andererseits natürlich, selbst wenn ich einen Trend über einen solchen Hypothesentest als signifikant bestimme, gibt es eine endliche Wahrscheinlichkeit, daß er trotzdem nicht signifikant ist, sondern zufällig. Bei statistischen Aussagen muß ich also mit Verständnis dafür umgehen, was dahintersteckt.
Sonntag, 21. Februar 2010
Abonnieren
Kommentare zum Post (Atom)
Keine Kommentare:
Kommentar veröffentlichen