データの向こうに見える世界

戦略コンサルとデータマイニング

入退会データ分析(1) 入退会者数の時系列推移②

みなさま、こんにちは!

短いですが、前回の続きです。

データ出力

整形データが出来たので、エクセルで使えるようにcsv形式で吐き出します。

## 1-3: データ出力
write.csv(flow.mat, "~/Desktop/yobiko_1_flow_mat.csv", quote=F)
write.csv(stock.mat, "~/Desktop/yobiko_1_stock_mat.csv", quote=F)

エクセルでグラフ化

最後にエクセルでグラフ化して終わりです。

▼フローベース

f:id:mochi1441:20170630222235p:plain

▼ストックベース

f:id:mochi1441:20170630222249p:plain

 フローベースのグラフを見ると、毎年4月頃と9月頃に入会者数(青線)のピークが立ち、その少し前に退会者数(オレンジ線)のピークが立っている事が分かります。

ここから、年度頭と夏休み終わり頃が商戦期で、学年切り替わりの直前に継続判断が行われている事が分かります。(予備校を想定しているので当たり前ですが笑)

また、2016年2月頃に何かイレギュラーな変化が起きている事が分かります。

ストックベースのグラフからは、徐々に在籍数を伸ばしている様子が伺え、2017年4月時点で約3,000人の在籍数になっている事が分かります。

 

というわけで、今回はここまで。

分析としては大した事はしていないですが、データが大規模になればなるほどこの程度の分析ですらエクセルで行うのは難しくなります。

データ整形だけでもRは威力を発揮してくれるので、データ分析が必要なビジネスパーソンの方々には是非とも知っておいて頂きたいと個人的には思っています。

 

それでは、次回以降も引き続きデータ分析していきますので、宜しくお願い致します。

 

以上