Gleitende Durchschnittliche Aggregation
Neil-lunn Ich wollte einen gleitenden Durchschnitt berechnen. So für 3-Monats-Intervalle I39d wollen einen Tag zu nehmen und durchschnittlich an diesem Tag mit den letzten 3 Monate Daten, und dann tun, dass durchschnittlich für jeden Tag für 50 Jahre die nächsten 50 Jahre. So denke ich, dass bestimmte Werte für Durchschnitte überschneiden würden. Wie würden Sie dies mit mapReduce anstatt es Sie tun können tun es mit dem Aggregationsrahmen. Ich glaube, Sie haben Recht, ich habe verschiedene Dokumente zu vergleichen. Danke ndash mc. Ich glaube nicht, dass die Aggregation Framework kann dies für mehrere Termine in der aktuellen Version (2.6), oder zumindest, kann dies ohne einige schwere Gymnastik tun. Der Grund dafür ist, dass die Aggregation Pipeline ein Dokument zu einem Zeitpunkt und nur ein Dokument verarbeitet, so dass es notwendig wäre, irgendwie ein Dokument für jeden Tag zu erstellen, der die relevanten Informationen der letzten 3 Monate enthält. Dies wäre als eine Gruppenstufe, die den Durchschnitt berechnen würde, was bedeutet, daß die vorhergehende Stufe etwa 90 Kopien von jedem Tage-Datensatz mit irgendeinem unterscheidenden Schlüssel erzeugt haben würde, der für die Gruppe verwendet werden kann. Also ich sehe nicht eine Möglichkeit, dies für mehr als ein Datum in einer einzigen Aggregation zu tun. Id glücklich sein, falsch zu sein und zu bearbeiten haben diese Antwort zu entfernen, wenn jemand findet einen Weg, es zu tun, auch wenn seine so kompliziert seine nicht praktisch. Ein PostgreSQL-PARTITION-Typ-Funktion würde die Arbeit hier vielleicht die Funktion wird eines Tages hinzugefügt werden. Beantwortet Aug 7 14 um 17:49 so dann you39d entweder Abfrage für Stücke von diesem und berechnen Sie den gleitenden Durchschnitt in einer Sprache (Ruby, Python, Knoten) oder führen Sie eine aggregierte Abfrage für jedes Intervall. Ist, dass wirklich die beste Lösung Doesn39t es nur das Gefühl, falsch ist es eine bessere Möglichkeit, dies mit Karte-reduzieren, dass ich kann nicht denken, ndash mc. Aug 7 14 at 18:41 Ich haven39t dachte über Karte-reduzieren. Generell versuche ich zu vermeiden, mit map-reduzieren, da es eine signifikante Performance-Strafe hat und ist nicht so sicher, da Sie kundenspezifische Code-Server-Seite ausgeführt werden. Ich versuche, etwas darüber nachzudenken, oder vielleicht jemand anderes kocht eine mr Lösung. Ndash wdberkeley Ich denke, dass ich eine Antwort für meine eigene Frage haben kann. Karte reduzieren würde es tun. Erste Verwendung emittieren, um jedes Dokument seinen Nachbarn zuzuordnen, dass es mit gemittelt werden soll, dann verwenden Sie reduzieren auf avg jedes Array. Und dass neue Array von Durchschnitten sollten die gleitenden Mittelwerte Plot Überstunden, da seine id wäre das neue Datum Intervall, dass Sie kümmern Ich glaube, ich brauchte zu verstehen, Karte-reduzieren besser. Zum Beispiel. Wenn wir wollten es im Gedächtnis (später können wir Sammlungen zu schaffen), schaut dieser Blick rightMoving Durchschnittlich ein gleitender Durchschnitt. Auch Rolling Average genannt. Rolling mean oder laufenden Durchschnitt. Wird verwendet, um den Mittelwert der Knoten innerhalb eines bestimmten Intervalls zu berechnen. Wenn die Intervallgrße auf drei gesetzt ist, wird der Durchschnitt unter Verwendung des aktuellen Knotens und der zwei vorhergehenden Knoten berechnet. Der Zweck, einen gleitenden Durchschnitt zu verwenden, besteht häufig darin, kurzfristige Schwankungen auszugleichen und langfristige Trends zu erkennen. THEN Wenn (Count () OVER (LastPeriods (10, Axis. X)) 10, Value, null) Der erste Teil des Ausdrucks wird berechnet Die zu vergleichenden Werte. Nach dem THEN-Schlüsselwort erfolgt die Berechnung auf den ausgewählten Knoten: der Mittelwert der Knoten innerhalb des angegebenen Intervalls. Im obigen Beispiel wird die Intervallgröße auf 10 gesetzt. Der letzte Teil des Ausdrucks (nach dem zweiten THEN) entfernt alle Werte für Knoten, die zu einem unvollständigen Intervall gehören (da das Kontrollkästchen "Unvollständige Intervalle ausschließen" aktiviert ist, siehe unten) ). Spaltenauswahl-Steuerelemente im Expanded-Modus: Hier wählen Sie die Aggregation Moving Average aus. Ermöglicht es Ihnen, einen anderen Anzeigenamen anzugeben, anstatt des standardmäßigen MOVING-Mittelwertes (Spaltenname). Ermöglicht die Angabe der Achse, über die die Knoten berechnet werden sollen. Nur kategoriale Achsen, die irgendeine Art von Gruppierung durchführen, können in der Dropdown-Liste angezeigt werden. Dies bedeutet, dass wenn Sie nur eine Gruppierung auf der X-Achse haben, dann ist dies die einzige Achse zur Verfügung, während, wenn Sie auch durch eine kategoriale Spalte gefärbt haben, dann die Farbe Achse auch verfügbar sein wird, und so weiter. Definiert die Größe des Fensters, um den durchschnittlichen Wert zu berechnen. Unvollständige Intervalle ausschließen Legt fest, ob Mittelwerte für Intervalle berechnet werden sollen, die Werte für einen oder mehrere Knoten im Intervall fehlen. Wenn das Kontrollkästchen deaktiviert ist, wird der Durchschnittswert mit diesen Werten berechnet, die nur verfügbar sind. Wenn das Kontrollkästchen aktiviert ist, bleiben die Knoten in unvollständigen Intervallen leer. Leere Werte ausblenden Erstellt eine ShowHide Items-Regel, die alle leeren Werte verbirgt. Klicken Sie auf das Eigenschaften-Symbol, um auf die Seite ShowHide Items des Dialogs Visualisierungseigenschaften zu gelangen, um die Regel zu bearbeiten oder zu entfernen. Aggregation, um den gleitenden Durchschnitt einer Histogramm-Aggregation zu berechnen 10002 Diese Aggregation berechnet den gleitenden Durchschnitt von Geschwistermetriken im Histogramm - (Histogramm-Datumshistogramm). Bewegungsdurchschnitte sind nützlich, wenn Zeitreihendaten lokal stationär sind und einen Mittelwert aufweisen, der sich im Laufe der Zeit langsam ändert. Saisonale Daten benötigen möglicherweise eine andere Analyse, sowie Daten, die bimodal, burstig oder enthält häufige extreme Werte (die nicht unbedingt Ausreißer). Die movavg-Aggregation unterstützt mehrere konfigurierbare Optionen: Fenstergröße Der Benutzer legt die Fenstergröße fest, für die er einen gleitenden Durchschnitt berechnen möchte. Z. B. Kann ein Benutzer ein 30-Tage-Schiebefenster über ein Histogramm von 90 Tagen insgesamt wünschen. Wenn derzeit nicht genügend Daten vorhanden sind, um das Fenster zu füllen, wird der gleitende Durchschnitt mit dem, was verfügbar ist, berechnet. Wenn ein Benutzer beispielsweise ein 30-Tage-Fenster auswählt, berechnet Tage 1-29 den gleitenden Durchschnitt mit 1-29 Tagen an Daten. Wir könnten das Hinzufügen weiterer Randrichtlinien untersuchen, die bestimmen, wie Lücken am Rand des gleitenden Durchschnitts zu behandeln sind. Gewichtungsart Derzeit unterstützt der Agg vier Gewichtungsarten: einfach. Ein einfacher (arithmetischer) Durchschnitt. Standard. linear. Ein linear gewichtetes Mittel, so dass Daten linear weniger wichtig werden, da sie im Fenster singleexp älter werden. Ein einziger exponentiell gewichteter Durchschnitt (aka EWMA oder Browns Simple Exp Smoothing), so dass Daten exponentiell weniger wichtig werden, da sie älter werden. Doubleexp. Double exponentiell gewichteter Durchschnitt (alias Holt-Winters). Verwendet zwei exponentielle Terme: erste glatte Daten exponentiell wie singleexp. Aber dann eine zweite Korrekturglättung zur Berücksichtigung eines Trends anwenden. Todo: Alpha und Beta aussetzen Alpha und beta sind Parameter, die das Verhalten von singleexp und doubleexp steuern. Alpha: steuert, wie weit der einzelne exponentielle Glättungsterm hinter den Wendepunkten im Mittel um 1 Alpha-Perioden zurückbleibt. Alpha 1 bedeutet, dass der Glättungsterm keinen Speicher (Periode von 1) aufweist und emuliert einen zufälligen Weg. Alpha 0 bedeutet, dass der Glättungsterm unendlich Speicher aufweist und den Mittelwert der Daten Beta berichtet: Nur in doubleexp verwendet. Analog zu alpha, sondern auf die Trendglättung anstatt auf die Datenglättung angewendet. Todo: Metric-Gewichtung untersuchen Seine manchmal nützlich, um eine Zeitdauer nicht durch seine Entfernung von der aktuellen Zeit, sondern durch einige Metrik, die in diesem Zeitabschnitt passiert Gewicht. Z. B. Gewicht nach dem Volumen der Transaktionen, die an diesem Tag passiert. Es sollte möglich sein, auf der Grundlage von Metriken innerhalb des Eimers Gewicht, aber es könnte kompliziert, wenn der Wert fehlt. Beispielanforderung Dies berechnet einen gleitenden Durchschnitt (Schiebefenster von drei Tagen) über die Summe der Preise an jedem Tag: Beispielantwort
Comments
Post a Comment