【EXCELデータ分析】「移動平均」で時系列データの傾向を変動要素の影響を排除して読み取る

時系列データが手元にあってその傾向を知りたいのだけれど、平日/休日とか、気温や天候とか、様々な変動要因があって折れ線グラフがじぐざぐして傾向がよくわからない。

そんな悩みをお持ちのあなた、移動平均を使えば一発で解決します。

今回はエクセルの分析ツールの機能を用いて、時系列データの傾向を変動要素の影響を取り除いて読み解く方法を書いていこうと思います。

 

移動平均で産業の成長性を眺めてみる

 

移動平均とは、時系列データがあったときに、一定の区間の平均をずらしながらとっていくものです。

時系列データから近い将来どういった変化をしていくか予測する際に、変動要素の影響を排除してデータを見ることができるため重宝する考え方です。

といっても分かりづらいと思うので、具体例を交えて見ていこうと思います。

 

例:あなたはこれから遊園地・テーマパークの業界に新規参入しようと考えています。

とはいえ、その産業についてまったく知識がありません。

そこでまず手始めに、この産業が成長産業なのか、衰退産業なのかを調査してみることにしました。

こんなケースを考えてみます。

政府統計から、遊園地・テーマパーク産業の月別の売上高のデータを入手し、2010~2017年の期間でどのように売上高が推移しているか折れ線グラフを作成してみると、以下のようになりました。

なんとなく、右肩上がりになっているのはわかるものの、月ごとの変動が大きいため、今増加の傾きは緩やかになっているのか、一定なのか、激しくなっているかといった細かいところが見えません。

できたらこのとげとげ(月ごとの変動)を排除して傾向をみたい、、、。

そこで移動平均です!

今回の遊園地の例では、グラフを見るとわかるように、一定の月で売上高の数値が飛び跳ねるように上がっています。

これはオンシーズンとオフシーズンがあるからですね。

このシーズンは1年(12ヶ月)で周期的に繰り返されるものです。

移動平均とは以下のように周期的な変化をする区間(今回は1年周期で数値が動くので12ヶ月)ごとの平均のことで、この推移を見ることで数字のむらを平らにして時系列変化を見ることができます。

2010/1~12月の平均(区間=12ヶ月)

2010/2~2011/1月の平均(区間=12ヶ月)

2010/3~2011/2月の平均(区間=12ヶ月)

・・・

2017/1~2017/12の平均(区間=12ヶ月)

これをやるとどうなるかというと、、、

 

このように、時系列の傾向がとげとげせずに見られます!(オレンジ色の線)

これを見ると、なるほどたしかに右肩上がりに売上高は上昇していて、成長産業であるなということがわかりますが、

それでかでなく、近年は成長の度合い(傾き)が停滞気味であることがよくわかります。

これはとげとげしたままでは見えてこなかった傾向ですね。

 

今回は月ごとの時系列データを見ていて、1年周期でオンシーズンオフシーズンが繰り返されるため、区間を12ヶ月にとって移動平均をとってみました。

しかし、例えば週ごとの推移を見たくて、休日と平日で変化が大きくてジグザグしてしまうようなケースは、7日周期で繰り返されるため、区間を7日で移動平均を取る必要があります。

こういた変動要因は規則的なものと不規則なものに分類されており、

規則的な変動要因=季節変動

不規則な変動要因=無作為変動

何ていうふうに呼ばれていたりします。

季節変動は、今回見た1年周期のオン/オフシーズンだったり、1週間単位の平日/休日の変化だったりが例として挙げられます。

一方無作為変動は、作物の収穫量に、例年より雨量が少ないことが影響した、というような気温や天候などの影響が例として挙げられます。

 

 

EXCELで移動平均を出してみる

 

表を作る

まずは通常の折れ線グラフを描けるような、時系列データセットを用意しましょう。

 

移動平均の出し方は2通り

①単純にAVERAGE関数で出す

移動平均の出し方は2通りありますが、まずは移動平均がどういうものかをよく理解するためにこのやり方でやってみることをおすすめします。

区間の分だけ選択して、平均を取ります。(今回は1年周期なので区間は12ヶ月になります)

あとは↓側にオートフィルで埋めていくだけです。

 

②分析ツールを使う

EXCELの分析ツール機能を使えば一瞬で移動平均を出すことが可能です。

データタブ>データ分析>移動平均>OK

そうすると以下の画面が表示されるので、空欄を埋めていきます。

入力範囲には、数値の範囲を入力します、(今回であれば売上高の箇所)

区間は、区間です。(今回は1年周期なので12(ヶ月))

出力に指定した箇所から下に移動平均が展開されるので、一番上の数字の行を指定しておくのがよいでしょう。

これでOKを押すと以下のように表示されます。

上から11ヶ月分が#N/Aとエラーが出てしまう理由はもうおわかりですよね?

移動平均は区間分の平均値だからです。今回は区間を12と指定しているので、上から11ヶ月分は平均を取る個数が足りていないのです。

 

おわり

というわけで、移動平均の解説でした。

これでとげとげしたグラフをじゃんじゃん平らにしてあげてください!

 

最後まで読んでいただきありがとうございました。

 

▼関連:移動平均からさらに発展

【EXCELデータ分析】季節調整で時系列データの傾向を読み取る。具体的な手順から説明!