R言語マニュアル2:基本統計量の扱いとグラフ作成

注意事項

  • 自分のノートパソコンが無線ランにつながっているかどうか,確認してください.つながっていない場合は,マニュアルで必要なファイルを各自のPCにコピーします.

今回の演習の目標

  • 今回の演習では,SFC生が一日にメールをしている時間と,インターネットをしている時間に関する,過去のアンケート調査データを使った分析を行います.
  • Rにデータ(テキスト形式)をインポートする.
  • インポートしたデータを使って,ヒストグラムを表示する.
  • 平均,標準偏差,四分位数を計算する.
  • 散布図を表示する.

Rの起動

  • まずはRを立ち上げましょう.「スタート」メニュー→「すべてのプログラム」→「R」→「R-2.2.1」を選んでください.
     left

  • Rの画面が立ち上がります.
     left

  • 次にRcmdrを表示さましょう.「パッケージ」から「パッケージの読み込み」を選びます.
     left

  • リストの中から,「Rcmdr」を選びます.
     left

  • すると,Rコマンダーの画面が現れます.
     left

データの読み込み

  • まずは,一日のメール利用時間に関するデータをダウンロードして分析してみましょう.
  • ここをクリックして,データをダウンロードしてください.
  • ダウンロード先は,デスクトップでかまいません.
     left

  • 次に,ダウンロードしたデータを,Rコマンダーで読み込みます.Rコマンダーの画面から,「データ」→「データのインポート」→「テキストファイルから..」を選んでください.
     left

  • 次の画面上で,「データセットを入力」に「sfc1」と入力し,「フィールドの区切り記号」の「コンマ」にチェック(●)をつけ,OKをクリックしてください.
     left

  • 「ファイルを開く」画面でファイルを指定して,「開く」をクリックしてください.ここでは,「sfc1.csv」です.
     left

  • 「開く」をクリックしても,上の画面がなお表示されている場合は,「キャンセル」をクリックして,この画面を閉じてください.
  • 「データセット」にsfc1と表示されていれば( left),上手くデータがインポートされています.そうでない場合は,再度データのインポートをしてください.
  •  leftをクリックすると,インポートしたデータが表示されます.
     left

  • ここで,「性別」の項目は,0が男性,1が女性を意味します.また,学部は0が総合政策,1が環境情報を意味します.曜日の列の数字は,一日のメール利用時間(分)を意味します.

ヒストグラムを表示する

  • 曜日別のメール利用時間を,ヒストグラムを使って表示してみましょう.
  • 「グラフ」→「ヒストグラム」を選択します.
     left

  • ここでは,例えば月曜日のメール利用時間をヒストグラム化します.以下の画面で,「変数(一つを選択)」で「月曜日」を選択します.「軸の尺度」は「頻度の計算」にチェック(●)をつけ,OKとします.
     left

  • グラフは,「Rgui」画面に表示されます.グラフが他の画面の後ろに隠れているかもしれませんので,確認してください.
     left

  • ヒストグラムの階級区分を変更したり,度数を相対度数(パーセント)表示にすることも可能です.例えば,「火曜日」のデータを相対度数(パーセント)表示するには,以下のように指定します.
     left

  • すると,以下のようなグラフが作成されます.
     left

平均・標準偏差・四分位数を求める

  • ある変数についての平均や標準偏差,四分位数を計算するときには,「統計量」→「要約」→「数値による要約」を選びます.
     left

  • 要約を計算したい変数を一つ選びます.また,計算したい統計量をクリックします.四分位数を計算する場合,分位点を「0,.25,.5,.75,1」のままにします.以上を確認して,OKとします.
     left

  • すると,Rコマンダーの下の画面に,計算結果が出力されます.
     left

  • 出力結果は,以下の内容を意味します.
    • 平均
      mean(sfc1$月曜日, na.rm=TRUE) ~
      [1] 26.98529 
    • 標準偏差
      sd(sfc1$月曜日, na.rm=TRUE)~
      [1] 28.65778<
    • 四分位偏差
      quantile(sfc1$月曜日, c( 0,.25,.5,.75,1 ), na.rm=TRUE)~
      0%  25%  50%  75% 100% ~
       0   10   20   30  190 <

散布図を表示する

  • 散布図を作成するには,「グラフ」→「散布図」を選びます.
     left

  • 例として,土曜日と日曜日のメール利用時間の散布図を作ってみましょう.「x変数」と「y変数」に,それぞれ土曜日と日曜日を選び,最初は,「周辺箱ひげ図」・「最小2乗直線」・「平滑線」のチェックボタンをはずして,OKとします.
     left

  • すると,以下のような散布図が作成されます.
     left

データの一部を抽出する

  • 今までは,すべての学年・学部・性別(これを,個人属性と言います)のデータのみを使って分析をしてきました.
  • 特定の学年・学部・性別(つまり,特定の個人属性をもつ)の特徴を分析するには,個人属性に応じて,データを抽出し,抽出したデータを使って分析することができます.
  • 特定の属性を抽出するには,Rコマンダーの「データ」→「アクティブデータセット」→「アクティブデータセットの部分集合を抽出」を選びます.
     left

  • 総合政策学部の学生を選びたい場合,「変数」から学部を選び,「部分集合の表現」を「'学部'==0」とします(ここで,'は半角).また,新しいデータセットを作るため,「新しいデータセットの名前」を入力します.ここでは,「sfc1_sougou」とします.
    • 学部:総合政策=0,環境情報=1
    • 学年:1学年=1,2学年=2,3学年=3,4学年=4
    • 性別:男性=0,女性=1
       left

  • 新しくデータセットを作ると, leftとなります.データセットが複数ある場合は,青地の部分をクリックすると,以下のような画面が現れるので,データセットを選択することができます.
     left

  • このようにして,個人属性別に新しいデータセットを作成し,基本統計量を比較してみましょう.

グラフを保存・コピーする

  • レポートを作成する際には,作成したグラフをファイルに取り込む必要があります.
  • グラフをファイルに取り込むには,グラフを画像ファイルとして保存する方法と,画像ファイルとしてコピーしてそのままレポートファイルに貼り付ける方法とがあります.
  • Rコマンダー上で,「グラフ」→「グラフをファイルに保存」→「ビットマップとして」を選びます.
     left

  • 「グラフィックファイルのタイプ」を選びます.ここでは,JPEGファイルを選びます.
     left

  • ファイルの保存先を選びます.ここでは,デスクトップに保存することにします.
     left

  • すると,以下のようなグラフが保存されます.
     left

  • Rgui上に作成されたグラフを,直接コピーしてワードなどに貼り付けることができます.グラフ上で右クリックして,「メタファイルにコピー」・「ビットマップにコピー」を選ぶと,グラフがコピーされて,そのままワードなどに貼り付けることができます.「メタファイルに保存」・「ポストスクリプトに保存」を選ぶと,画像ファイルとして保存することができ,あとでグラフの画像をレポートに取り込むこともできます.
     left



トップ   編集 凍結解除 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2014-07-31 (木) 02:32:37 (1180d)