Lors du calcul d'une moyenne mobile courante, placer la moyenne dans la période de temps moyenne a un sens Dans l'exemple précédent, nous avons calculé la moyenne des 3 premières périodes et l'avons placé à côté de la période 3. Nous aurions pu placer la moyenne au milieu de la Intervalle de temps de trois périodes, c'est-à-dire, à côté de période 2. Cela fonctionne bien avec des périodes de temps impaires, mais pas aussi bien pour des périodes de temps même. Alors, où placer la première moyenne mobile lorsque M 4 Techniquement, la moyenne mobile tomberait à t 2,5, 3,5. Pour éviter ce problème, nous lisser les MA en utilisant M 2. Ainsi, nous lisser les valeurs lissées Si nous avons un nombre pair de termes, nous devons lisser les valeurs lissées Le tableau suivant montre les résultats en utilisant M 4.David, Oui, MapReduce est Destiné à fonctionner sur une grande quantité de données. Et l'idée est qu'en général, les fonctions de carte et de réduction ne devraient pas prendre en compte le nombre de cartographes ou le nombre de réducteurs qu'il ya, ce qui correspond à l'optimisation. Si vous pensez soigneusement à l'algorithme que j'ai posté, vous pouvez voir qu'il n'a pas d'importance quel mappeur obtient ce que les portions des données. Chaque enregistrement d'entrée sera disponible pour chaque opération de réduction qui en a besoin. Ndash Joe K Sep 18 12 at 22:30 Au mieux de ma compréhension de la moyenne mobile n'est pas bien des cartes au paradigme MapReduce car son calcul est essentiellement glisser la fenêtre sur les données triées, tandis que MR est le traitement des plages non intersectées de données triées. La solution que je vois est la suivante: a) Pour implémenter un partitionneur personnalisé pour pouvoir faire deux partitions différentes en deux exécutions. Dans chaque course, vos réducteurs obtiendront des gammes de données différentes et calculeront la moyenne mobile si cela est approprié. J'essaierai d'illustrer ceci: Dans la première série, les données pour les réducteurs devraient être: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 . Ici vous allez cacluate moyenne mobile pour certains Qs. Dans la prochaine exécution vos réducteurs devraient obtenir des données comme: R1: Q1. Q6 R2: Q6. Q10 R3: Q10..Q14 Et cacluler le reste des moyennes mobiles. Ensuite, vous aurez besoin d'agréger les résultats. Idée de partitionneur personnalisé qu'il aura deux modes de fonctionnement - chaque fois se divisant en gammes égales, mais avec un certain décalage. Dans un pseudocode, il ressemblera à ceci. Partition (keySHIFT) (MAXKEYnumOfPartitions) où: SHIFT sera extrait de la configuration. MAXKEY valeur maximale de la clé. Je suppose pour la simplicité qu'ils commencent par zéro. RecordReader, IMHO n'est pas une solution puisqu'elle est limitée à la division spécifique et ne peut pas glisser sur la frontière splits. Une autre solution consisterait à implémenter une logique personnalisée de fractionnement des données d'entrée (elle fait partie de InputFormat). Il peut être fait pour faire 2 diapositives différentes, semblable au partitionnement. Dans la deuxième colonne de ce tableau, une moyenne mobile de l'ordre 5 est affichée, fournissant une estimation du cycle tendanciel. La première valeur dans cette colonne est la moyenne des cinq premières observations (1989-1993), la deuxième valeur dans la colonne 5-MA est la moyenne des valeurs 1990-1994 et ainsi de suite. Chaque valeur dans la colonne 5-MA est la moyenne des observations sur la période quinquennale centrée sur l'année correspondante. Il n'y a aucune valeur pour les deux premières années ou les deux dernières années parce que nous n'avons pas deux observations de part et d'autre. Dans la formule ci-dessus, la colonne 5-MA contient les valeurs de hat avec k2. Pour voir à quoi ressemble l'estimation du cycle tendanciel, nous la traçons avec les données originales de la figure 6.7. Parcelle 40 elecsales, principale quotResidential ventes d'électricité, ylab quotGWhquot. Notez comment la tendance (en rouge) est plus lisse que les données d'origine et capture le mouvement principal de la série chronologique sans toutes les fluctuations mineures. La méthode de la moyenne mobile ne permet pas d'estimer T où t est proche des extrémités de la série, de sorte que la ligne rouge ne s'étend pas aux bords du graphe de part et d'autre. Plus tard, nous utiliserons des méthodes plus sophistiquées d'estimation du cycle tendanciel qui permettent des estimations près des points finaux. L'ordre de la moyenne mobile détermine la finesse de l'estimation du cycle tendanciel. En général, un ordre plus grand signifie une courbe plus lisse. Le graphique suivant montre l'effet de la modification de l'ordre de la moyenne mobile pour les données sur les ventes résidentielles d'électricité. Les moyennes mobiles simples comme celles-ci sont ordinairement d'ordre impair (par exemple 3, 5, 7, etc.). C'est ainsi qu'elles sont symétriques: dans une moyenne mobile d'ordre m2k1, il y a k observations antérieures, k observations ultérieures et l'observation du milieu Qui sont moyennés. Mais si m était pair, il ne serait plus symétrique. Moyennes mobiles des moyennes mobiles Il est possible d'appliquer une moyenne mobile à une moyenne mobile. Une raison de faire ceci est de faire une moyenne mobile d'ordre pair symétrique. Par exemple, nous pourrions prendre une moyenne mobile de l'ordre 4, puis appliquer une autre moyenne mobile de l'ordre 2 aux résultats. Dans le tableau 6.2, cela a été fait pour les premières années de la production trimestrielle australienne de bière. Bière2 lt - fenêtre 40 ausbeer, début 1992 41 ma4 ltm 40 bière2, ordre 4. centre FALSE 41 ma2x4 ltm 40 bière2, ordre 4. centre VRAI 41 La notation 2x4-MA dans la dernière colonne signifie un 4-MA Suivi d'un 2-MA. Les valeurs de la dernière colonne sont obtenues en prenant une moyenne mobile de l'ordre 2 des valeurs de la colonne précédente. Par exemple, les deux premières valeurs dans la colonne 4-MA sont 451,2 (443410420532) 4 et 448,8 (410420532433) 4. La première valeur dans la colonne 2 x 4-MA est la moyenne de ces deux: 450,0 (451,2448,8) 2. Quand un 2-MA suit une moyenne mobile d'ordre pair (comme 4), il est appelé une moyenne mobile centrée de l'ordre 4. C'est parce que les résultats sont maintenant symétriques. Pour voir que c'est le cas, on peut écrire le 2x4-MA de la façon suivante: begin hat amp frac Bigfrac (y y y y) frac (y y y y) Big frac fray frac14y frac14y frac14y frac18y. End C'est maintenant une moyenne pondérée des observations, mais elle est symétrique. D'autres combinaisons de moyennes mobiles sont également possibles. Par exemple, on utilise souvent une MA 3 x 3, qui consiste en une moyenne mobile d'ordre 3 suivie d'une autre moyenne mobile d'ordre 3. En général, un ordre pair MA doit être suivi d'un ordre pair MA pour le rendre symétrique. De même, un ordre impair MA doit être suivi d'un ordre impair MA. Estimation du cycle tendanciel avec les données saisonnières L'utilisation la plus courante des moyennes mobiles centrées consiste à estimer le cycle tendanciel à partir des données saisonnières. Considérons le cas 2 x 4-MA: frac fray frac14y frac14y frac14y frac18y. Lorsqu'il est appliqué aux données trimestrielles, chaque trimestre de l'année reçoit le même poids que le premier et le dernier terme s'appliquent au même trimestre d'une année consécutive. Par conséquent, les variations saisonnières seront moyennées et les valeurs résultantes du chapeau auront peu ou pas de variation saisonnière restante. On obtiendrait un effet analogue en utilisant un mélange 2 fois 8-MA ou 2 fois 12-MA. En général, une m-MA de 2 x m est équivalente à une moyenne mobile pondérée d'ordre m1 avec toutes les observations pesant 1m sauf pour le premier et le dernier termes qui prennent des poids 1 (2m). Donc, si la période saisonnière est pair et d'ordre m, utilisez une m-MA 2 fois pour estimer le cycle-tendance. Si la période saisonnière est impaire et d'ordre m, utilisez un m-MA pour estimer le cycle de tendance. En particulier, un 2 x 12-MA peut être utilisé pour estimer le cycle tendanciel des données mensuelles et un 7-MA peut être utilisé pour estimer le cycle tendanciel des données quotidiennes. D'autres choix pour l'ordre de la MA entraîneront habituellement des estimations du cycle de tendance étant contaminées par la saisonnalité dans les données. Exemple 6.2 Fabrication de matériel électrique La figure 6.9 montre une application de 2 x 12 mA appliquée à l'indice des ordres d'équipement électrique. Notez que la ligne lisse ne montre pas de saisonnalité, elle est presque identique au cycle de tendance illustré à la figure 6.2 qui a été estimé en utilisant une méthode beaucoup plus sophistiquée que les moyennes mobiles. Tout autre choix pour l'ordre de la moyenne mobile (à l'exception de 24, 36, etc.) aurait donné une ligne lisse qui montre certaines fluctuations saisonnières. Parcelle 40 elecequip, ylab QuotNouvelles commandes index. Col quotgrayquot, main Quot 41, 40 ma 40 elecequip, commande 12 41. col quotredquot 41 Moyennes mobiles pondérées Les combinaisons de moyennes mobiles se traduisent par des moyennes mobiles pondérées. Par exemple, la 2x4-MA discutée ci-dessus est équivalente à une pondérée 5-MA avec les poids donnés par frac, frac, frac, frac, frac. En général, un m-MA pondéré peut être écrit comme chapeau t somme k aj y, où k (m-1) 2 et les poids sont donnés par a, dots, ak. Il est important que les poids totalisent à un et qu'ils soient symétriques de sorte que aj a. Le m-MA simple est un cas particulier où tous les poids sont égaux à 1m. Un avantage majeur des moyennes mobiles pondérées est qu'elles donnent une estimation plus souple du cycle tendanciel. Au lieu des observations entrant et sortant du calcul au poids total, leurs poids sont augmentés lentement puis diminués lentement, ce qui donne une courbe plus lisse. Certains ensembles spécifiques de poids sont largement utilisés. Certaines d'entre elles figurent au tableau 6.3.
No comments:
Post a Comment