R言語マニュアル3:相関係数を求める

注意事項

  • 自分のノートパソコンが無線ランにつながっているかどうか,確認してください.つながっていない場合は,マニュアルで必要なファイルを各自のPCにコピーします.

今回の演習の目標

  • 家賃と敷地面積に関するデータを用いて,相関係数を求める
  • 散布図の復習

データの読み込み

  • RとRコマンダーを立ち上げてください.
  • データをここからダウンロードしてください(ユーザ名とパスワードが必要です).
  • Rコマンダーで,ダウンロードしたデータを読み込んでください.ここでは,ダウンロードしたデータ名と同じ,「house」というデータ名で,データセットを入力します.
  • 読み込んだデータを表示すると,以下のようになります.
     left

散布図の表示

  • まずは,家賃と敷地面積に関する散布図を表示してみましょう.
  • ここでは,x変数に占有面積,y変数に家賃を選択します.(箱ひげ図,最小事情直線,平滑線に関するチェックをはずします)
     left

  • すると,以下のような散布図が作成されます.
     left

基本統計量の算出

  • 次に,各変数の基本統計量として,平均・標準偏差などを求めましょう.「統計量」→「要約」→「数値による要約」で,各変数の平均と標準偏差を算出します.
  • 以下のような結果が,Rコマンダー上に表示されます.
  • 敷地面積
    • 平均
      > mean(house$専有面積, na.rm=TRUE)
      [1] 40.24
    • 標準偏差
      > sd(house$専有面積, na.rm=TRUE)
      [1] 23.53891
  • 家賃
    • 平均
      > mean(house$賃料, na.rm=TRUE)
      [1] 7.73
    • 標準偏差
      > sd(house$賃料, na.rm=TRUE)
      [1] 2.765683

相関係数を算出する

  • 相関係数を算出するには,「統計量」→「要約」→「相関行列」を選んでください.
     left

  • 「変数(2つ以上選択)」については,それぞれ敷地面積と家賃を選んでください.二つの変数を同時に選ぶには,シフト(Shift)キー又はコントロール(Ctrl)キーを押しながら,マウスで変数を選択してください.「ピアソンの積率相関」にチェックされていることを確認して,OKとしてください.
     left

  • 以下のような結果が,Rコマンダー上に表示されます.ここで,0.9093676 が専有面積と家賃の相関係数を意味します.
    > cor(house[,c("専有面積","賃料")], use="complete.obs")
             専有面積      賃料
    専有面積 1.0000000 0.9093676
    賃料     0.9093676 1.0000000



トップ   編集 凍結解除 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2006-03-14 (火) 23:49:11 (5024d)