相関ルール

  • 今回は,SASを使って,CRM03a.xls(要パスワード)のデータを用いて,相関ルール分析を行います.
  • 相関ルールは,バスケット分析とも呼ばれ,ある事象とある事象がよく同時に起こるということを発見する手法です.Aの商品を購入する観光客がBの商品も購入する,といった分析をする際に使われます.

参考サイト

データの読み込み

  • SASを起動し,「ファイル」→「データのインポート」を選択し,「標準データソース」にチェックがあり「下の一覧からデータソースを選択してください」にMicrosoft Excel 97, 2000または2002ブックが選らば得れているのを確認したら,「次へ」をクリック.
  • 「参照」ボタンを押して,CRM01a.xlsを選びます.「次へ」をクリックし,SASの出力先として,「ライブラリ」にWORKを選び,「メンバー」には自分で適当に書き込みます(ここでは,crm01dとします).
  • プログラムステートメントを作成するファイル名を指定し(ここでは,crm01dとします),「完了」をクリックします.
  • 「エクスプローラ」にWorkのコンテンツとしてデータがあるかどうか確認してください.

分析を行う

  • 「ソリューション」→「データ解析」→「エンタープライズマイナー」を選びます.
  • 「ダイヤグラム」に名前をつけ,ダイヤグラムワークスペースに「入力データソース」をドラッグ&ドロップします.
  • 入力データをダブルクリックし,「変数」タグから「id」の役割を「id」に,「PLACE1」の役割を「target」にそれぞれ変更します.
    • 各変数の「役割」のところで右クリックし,「役割の設定」を選ぶと,役割を選択できます.
  • エンタープライズマイナーのアイコンから,「アソシエーション」をドラッグ&ドドロップします.
  • 入力データとアソシエーションとを結びます.
  • アソシエーションをダブルクリックし,「変数」タグにおいてidとtargetが設定されているかを確認します.
  • 以上の設定が終わったら,アソシエーションを右クリックして「実行」を選びます.

結果の読み方

  • 分析が終了すると,結果が表示されます.
  • 相関ルールの評価基準は以下の三つです.
    • 信頼度(Confidence)
      • 相関の強さ.Xに続けてYが起こる割合のパーセント表示.
    • 支持度(Support)
      • データベース全体で、その組み合わせが起こる割合.
    • リフト値(Lift)
      • 信頼度を期待信頼度(条件なしの信頼度)で割った値.リフト値は,Xが起こったという条件によるYが起こる尤度の増加を示す.
  • 「表示」→「グラフ」を選択すると,結果が可視化されて表示されます.

演習問題

CRMマニュアル


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2006-07-07 (金) 17:14:02 (4878d)