データの向こうに見える世界

戦略コンサルとデータマイニング

入退会データ分析(2) 教室別の累積入会者数推移

 みなさま、こんにちは。

 前回に続いて、今回は教室毎の累積入会者数の推移を可視化してみたいと思います。

  • データの読み込み
  • データ整形(1):教室毎の入会者数推移
    • 箱を用意する
    • 数値を入れていく
  • データ整形(2):カウント時期を揃える
    • 入会者が入ってから初めての4月に頭を揃える
    • 累積入会者数の推移を計算する
  • 累積入会者数の可視化
続きを読む

入退会データ分析(1) 入退会者数の時系列推移②

みなさま、こんにちは!

短いですが、前回の続きです。

  • データ出力
  • エクセルでグラフ化
続きを読む

入退会データ分析(1) 入退会者数の時系列推移①

みなさま、こんにちは。

前回記事に続き、今回は予備校の入退会者数の時系列推移を見ていきたいと思います。

基本的に、データ分析はビジネスの中で発生している何らかの課題に対して、仮説を検証していきながら進めるものですが、実際の現場でいきなり仮説検証のための分析に取り掛かる事はあまりありません。

これは、「そもそものデータに何らかの偏り(バイアス)がないか」「データ内部に欠損値・エラー値など分析に悪影響を及ぼすような欠陥がないか」等を確認するためであると共に、単純な集計を幾つか回す中でそのデータに対する理解を深める目的もあります。

そのため、最初は特に指向性を持つ事なく、様々な簡易集計やグラフ化を行ったりします。(感覚としてはデータと“遊ぶ”イメージ)

今回は、それに近い感覚で元データを整形して単純な集計を行います。

また、元データが18,460行程度しかないため、これくらいであれば全てエクセルで集計できてしまうのですが、より大規模なデータを扱うことも想定し今回はR*1を使ってデータ整形していきます。

僕自身、実際のコンサルのプロジェクトで、[①Rでデータを分析しやすい形に整形]→[②エクセルでグラフ化して資料作成]という手法をよく使います。*2

  • データ読み込み
  • 整形後データのイメージ
  • データ整形
    • (1) 素材データの生成
    • (2) 適用年月に合わせて整形
      • フローベースでデータ整形
      • ストックベースでデータ整形

*1:オープンソースフリーソフトウェアの統計解析向けのプログラミング言語。無料で使える上に先人達が様々なパッケージを公開してくれているため、お手軽に統計分析や機械学習を実装できて最高な言語です。大体何でもできます!

*2:エクセルでvlookupとか使いまくるとめちゃくちゃ重くなるのでRでの整形の方が速い。ただ、ビジュアル化に関してはやはりエクセルの方が綺麗だし楽です。

続きを読む

入退会データ分析(0) Introduction

みなさま、こんにちは!

今回から数回にわたって「入退会データ分析」をテーマに記事を書いていきたいと思います。

会員制のビジネスの場合、入退会に関するデータは必ず蓄積されています。

そういった入退会データの分析からどんな分析が出来て何が言えるのか、簡単にですがお伝えできればと思います。

 今回は本テーマ1回目ということで、使用するデータの概要を説明していきます。

続きを読む

Blog開設しました。

どうも、初めまして。いとぅと申します。

とある戦略コンサルティングファームにて、コンサルタントとして働いております。

日々、コンサルタントとして目の前のお客様を相手にするだけでなく、何か世の中に対して残していきたいと思いBlogを開設致しました。

大学時代にずっとプログラミング言語*1を触っていた経験*2から、“コンサル×データ分析”をテーマに自分なりに研究しつつ記事に残せていけたらと思っています。

 

今までのプロジェクト経験の中で、世の中の多くの企業が事業に関わる社内データを有効に活用できていない状況を目の当たりにしました。

特にビジネスサイドの担当者(マーケターなど)は文系卒も多く、まともにデータ分析をしないまま企業の意思決定をしている場面をよく見ます*3

そこにコンサルタントが入り、データから客観的な事実を導き出した上で諸々の提案をしていくわけですが、正直コンサルタントもデータ分析に使うのはエクセル・VBAが限界であることが多いです。*4

 

また、コンサル関連の書籍等でよく言われている通り、コンサルの頭の動かし方として「仮説ベース思考」*5が基本になっています。

これは、何が起きているかよく分からない&変化の激しい実際のビジネスの現場で、スピーディかつ正しそうな意思決定を行うために非常に有効な頭の使い方だと思います。

しかし、ここまでビジネスに関して取得できるデータの量も種類も大幅に増えてきた中で、従来のコンサル的アプローチ*6では近い将来限界が来るのではないかと感じています。

所謂「ビッグデータ分析」ではありませんが、無理に仮説を立てて分析するだけではなく、素直にデータに向き合う中で右脳的な発見をして行くというアプローチもより重要になってきているように感じます。*7

機械学習をはじめとして、そのための分析手法がどんどん発展していく中で、いかにそういった分析手法を実際のビジネスに役立てていけるかが今後の鍵になって来ると思います。

当然、「データ」を駆使できる企業が勝ち残っていく世界になる中で、戦略コンサルも徐々に変わっていかなければならないと思います。*8

 

このBlogを通して、どのように「データマイニング」を実際のビジネスに活かしていけるのか、自分なりに研究していければ良いなと思っています。

みなさま、何卒宜しくお願い致します。

 

以上

*1:主に統計言語(Rなど)

*2:大学時代は時系列解析を中心とした大規模データ分析がメインの研究対象でした。具体的には、過去の株価推移データから数理モデルを導き、そのモデルをベースにした自動トレードアルゴリズムの開発・研究をしていました。

*3:もちろん、文系卒でデータ解析に土地勘のある方もいらっしゃいますが、そうでない方が一定数いるのも確かです。

*4:お客さんから数GBのデータを貰ってあたふたすることも多々...

*5:その時点で考えられる仮の結論(=仮説)を置いた上で考える思考方法。ビジネスに関する各種分析も、仮説を置いた上でアタリを付けてから分析を行います。

*6:ロジカルに仮説・ファクトを積み重ねて行く「左脳的」なアプローチ

*7:コンサル的に言えば、「論理・思考の飛躍」に近しいものだと捉えています。

*8:個人的には、10年後・20年後にはプログラミングも出来ないor最低でもどういうものか理解していないコンサルは戦えなくなっているのではないかと思います。