POST

 

column.01

 

機械学習を活用したデータ分析
 
その1.機械学習のメリット

みなさん、こんにちは。株式会社スマートウィルのコンサルタント、松島です。

2018年の初回のコラムとして 「機械学習」 をテーマに書かせていただきます。

今回は機械学習のメリットに焦点を当て、次回はその2として機械学習を活用したデータ分析による顧客コミュニケーションの高度化について考え、さらに弊社スマートウィルの機械学習を活用したサービスも紹介させていただきます。

「機械学習」、と言えば、企業の方の反応はたいてい2種類に分かれます。

1つは、「機械学習? AI?・・・よく分からないけど、何かすごいことが出来そう」、というポジティブな反応です。

もう1つは、「機械学習って人的な分析とどう違うの? AIブームに乗っかろうとしているだけで、特殊な分析ができるわけじゃないでしょ?」 とか、「実践的な分析が出来るの?」 というネガティブな反応です。

AIブームが少し落ち着いてきた昨今、前者の反応よりも 「人的な分析とどう違うの?」 というご意見をいただくことが増えてきましたので、その観点から、機械学習のメリットを考えてみたいと思います。

確かに、Deep Learningなどの一部の高度な手法を除き、機械学習で使うアルゴリズムは統計解析ソフトを使えば人的にも可能なものも多いです。私が担当していた機械学習のプロジェクトで活用したのもロジスティック回帰というベーシックなアルゴリズムで、人的な解析も可能なものでした。

ただし、同じアルゴリズムを使う場合でも、機械学習を活用するとメリットがあるのです。それは大別すると次の4つです。

1.精緻な分析ができる

特に分析対象データのボリューム(レコード数)が多いケースでは、データの学習・モデル作成・モデルの検証というステップを踏むことで精緻な分析をすることができます。

2.大量の変数を扱うのが得意

解析ソフトを使って人的な分析を行なう場合、分析対象の変数(データ項目)が多いと、物理的に分析ができない、ということはなくても、データ処理に非常に手間も時間もかかるため、現実的には扱う変数の種類・数には限界があります。しかし、機械学習の場合は、膨大な数の変数を扱うことができます。

3.しかも早い

ハードウェア環境にもよりますが、機械学習ではデータの解析・処理が圧倒的に早いです。また、クラウド環境で機械学習を回すのであれば、ハードウェア環境にそれほど依存することなく、迅速な解析が可能です。

4.さらに、マシンは文句を言わない!

私はコンサルタントですので、解析作業は弊社のデータサイエンティスト(DS)に依頼するのですが、DSに作業を依頼する際、実は結構気を使います。自分が出来ない作業を依頼するので、その難易度やかかる時間が想定できないことも多く、作業の期限を切りづらいのです。ですが、多忙なDSの都合に合わせているとデータがなかなか上がって来ないことになるので、こちらも気を遣いながらなんとか早く作業してもらえるようにお願いするのですが、DSから次のようなことを言われることもあるわけです。

業務依頼はちゃんと上を通してくださいとか今は仕事が立て込んでるからすぐには出来ませんよとかこの前出したデータじゃダメなんですかまた出し直す必要があるんですかとかそんなに大量の変数を回すのは無理ですよ変数を絞ってくださいとかわたしは今日カレシとごはん食べに行くから残業は出来ませんよとかあなたの依頼はいつも急ですよね・・・とか。

(ちなみに、弊社内ではコンサルタントとDSの間で上記のような会話はないはずです(苦笑))

でも、機械学習ならどんな大量の変数を食わせても文句ひとつ言わず一瞬で解析してくれます。それに、マシンは残業も厭わないので気配りも不要です。
さらに、GUI(画面上にアイコンやメニューで操作対象や選択項目を表示し、それをマウスなどで操作できるグラフィカル・ユーザー・インターフェイス)を実装している機械学習のソフトは人的に回す統計解析ソフトよりも操作が簡単なものも出てきており、DSではない私でもシンプルな分析なら自分で出来てしまうのです。

と、最後の方は若干脱線気味でしたが、機械学習のメリットとして挙げた 「大量の変数を扱うのが得意」、「しかも早い」 という点についてもう少し詳しく触れてみたいと思います。

大量の変数を、一度に、かつスピーディに分析することが出来れば、どんなメリットがあるのか?・・・

弊社には小売業のクライアント様が比較的多くいらっしゃることもあり、小売業を例に考えてみましょう。

私も以前アパレルのチェーンストアを展開する企業のマーケティング部門で働いていたことがあるのですが、その企業では、「マーケティング部は 『顧客データ』 はしっかり見ているが 『商品データ』 はあまり見ていない、商品部は 『商品データ』はしっかり見ているが 『顧客データ』 はほとんど見ていない」、という現象が起こっていました。それに気づいたマーケティング部の私は商品データもしっかりチェック・分析するようにしたのですが、顧客と商品を紐付けた分析は出来ていませんでした。

なぜなら、その企業は 「顧客管理システム」 と 「商品管理システム」 が別個に存在し、顧客データと商品データを紐付ける仕組みも、分析できる環境もツールもなかったからです。

このような現象は、今でも多くの企業で起こっているのではないでしょうか?

そして、そのような状態だと、「データ分析⇒ターゲット抽出⇒顧客コミュニケーション」 はどうなるのでしょうか?

伝統的な手法であるRFM分析(*1)を行なって顧客セグメントを作成し、それに基づき、季節性やプロモーションの内容、売上目標などを考慮してセグメント条件や対象ボリュームを調整してターゲットを抽出する、そんなやり方をされておられる企業様も多いと思います。 *1 RFM分析についてはこちら

もちろん、上記の方法でも精緻にやれば適正なターゲットを抽出することは可能です。

ただし・・・その方法には欠点があります。

それは、RFM分析は 「顧客データ」 のみの分析で 「商品データ」 は対象としていない、ということです。

つまり、RFM分析だけだと、顧客の 「ニーズの強さ」 は分かるけれど、購買商品が分からない、ということであり、購買商品が分からないと、どんなニーズがあるのか分かりませんし、どんなニーズがありそうなのかという仮説を立てることさえ出来ません。


 

では、なぜそんな現象に陥ってしまうのでしょうか?

それは、多くの企業は、私が以前勤めていた企業と同様に、「膨大な数の顧客データ」と「膨大な数の商品データ」を紐付けて分析する仕組みを持っておらず、分析できるソフトもないし、人材もいないからです。

それなりの規模の小売業だと、データベースに登録されている顧客数は累積で数百万単位になるでしょうし、商品数は、例えばアパレル企業の場合だと、商品の大分類で数十、中分類で数百、商品・アイテム単位だと数千から数万、それ以上、というケースが多いと思います。

弊社はクライアント企業様のデータを顧客軸のみならず商品軸と掛け合わせた分析も多数手がけてきましたが、商品数が膨大な場合は、作業的にもデータの処理時間的にも、やはり負荷が高いタスクになっていました。

しかし、そんな状況を一気にブレークスルーしてくれるのが機械学習であると私は考えています。

数百万もの顧客データに膨大な数に及ぶ商品データが紐づいた大量データを一瞬で解析してしまう、それも、単純なクロス集計ではなく、多様な手法を駆使して高度な・精緻な解析を行なうことができる・・・ それが機械学習なのです。

では、機械学習による分析をすれば、どのような顧客コミュニケーションが可能になるのか?

それは 「機械学習を活用したデータ分析 その2」 として次回のコラムで紹介させていただきます。

寒い日が続きますが、みなさま、くれぐれもご自愛ください。

 
 


機械学習についてやその他のお問い合わせはこちら または、contact@smartwill.co.jpまでメールにてご連絡ください!