R言語マニュアル2(補足):基本統計量の扱いとグラフ作成

注意事項

  • 自分のノートパソコンが無線ランにつながっているかどうか,確認してください.つながっていない場合は,マニュアルで必要なファイルを各自のPCにコピーします.

今回の演習の目標

  • 今回の演習では,SFC生が一日にメールをしている時間と,インターネットをしている時間に関する,過去のアンケート調査データを使った分析を行います.
  • Rにデータ(テキスト形式)をインポートする.
  • インポートしたデータを使って,ヒストグラムを表示する.
  • 平均,標準偏差,四分位数を計算する.
  • 散布図を表示する.

Rの起動

  • まずはRを立ち上げましょう.「スタート」メニュー→「すべてのプログラム」→「R」→「R-2.2.1」を選んでください.
     left

  • Rの画面が立ち上がります.
     left

データの読み込み

  • まずは,一日のメール利用時間に関するデータをダウンロードして分析してみましょう.
  • ここをクリックして,データをダウンロードしてください.
  • ダウンロード先は,「C:\Program Files\R\R-2.2.1」を指定してください.
  • 次に,ダウンロードしたデータを,Rのコマンドラインで読み込みます.read.tableというコマンドを使います.
sfc1 <- read.table("sfc1.csv",sep=",",header=T) 
  • read.table("ファイル名",sep="区切り記号",header=T)は,区切り記号(,)のファイル(sfc1.csv)を読み込み,先頭行をヘッダーとして読み込む(header=T)ことを意味します.sfc1 <- read.table(..)とすることで,読み込んだデータをsfc1というオブジェクトに保存することを意味します.
  • 読み込んだデータを表示するには,コマンドラインでそのまま「sfc1」とデータ名を入力するか,RGuiの「編集」→「データエディタ」を選び,ボックスの中に「sfc1」とデータ名を入力すると,表形式でデータが表示されます.
  • ここで,「性別」の項目は,0が男性,1が女性を意味します.また,学部は0が総合政策,1が環境情報を意味します.曜日の列の数字は,一日のメール利用時間(分)を意味します.

ヒストグラムを表示する

  • 曜日別のメール利用時間を,ヒストグラムを使って表示してみましょう.ここでは,例えば火曜日のメール利用時間をヒストグラム化します.
hist(sfc1$火曜日, scale="frequency", col="darkgray")
  • 「hist(データ名$列名, scale="縦軸の尺度", col="色名")」がヒストグラムを作成するコマンドです.scaleをfrequencyにすると度数,percentにすると相対度数で分布が表示されます.

 left

 left

平均・標準偏差・四分位数を求める

  • 平均はmean(データ名$列名)で計算されます.
    mean(sfc1$月曜日) 
    [1] 26.98529 
  • 標準偏差はsd(データ名$列名)で計算されます・
    sd(sfc1$月曜日)
    [1] 28.65778
  • 四分位偏差は
    quantile(sfc1$月曜日, c( 0,.25,.5,.75,1 ))
    0%  25%  50%  75% 100% 
     0   10   20   30  190 

散布図を表示する

  • 散布図を作成するには,plot(縦軸の列名~横軸の列名, data=データ名)コマンドを使います.
    plot(金曜日~火曜日, data=sfc1)
  • すると,以下のような散布図が作成されます.
     left

データの一部を抽出する

  • 今までは,すべての学年・学部・性別(これを,個人属性と言います)のデータのみを使って分析をしてきました.
  • 特定の学年・学部・性別(つまり,特定の個人属性をもつ)の特徴を分析するには,個人属性に応じて,データを抽出し,抽出したデータを使って分析することができます.
  • データの部分集合を切り出すには,subset(データ名, subset="列名"条件式)コマンドを使います.
    • 条件式は,==,>=,=<,>,< を使います.
  • 総合政策学部の学生を選びたい場合,以下のようにします.ここでは「sfc1_sougou」とします.
    sfc_sougou <- subset(sfc1, subset="学部"==0)
    • 学部:総合政策=0,環境情報=1
    • 学年:1学年=1,2学年=2,3学年=3,4学年=4
    • 性別:男性=0,女性=1
  • このようにして,個人属性別に新しいデータセットを作成し,基本統計量を比較してみましょう.

グラフを保存・コピーする

  • レポートを作成する際には,作成したグラフをファイルに取り込む必要があります.
  • グラフをファイルに取り込むには,グラフを画像ファイルとして保存する方法と,画像ファイルとしてコピーしてそのままレポートファイルに貼り付ける方法とがあります.
  • Rgui上に作成されたグラフを,直接コピーしてワードなどに貼り付けることができます.グラフ上で右クリックして,「メタファイルにコピー」・「ビットマップにコピー」を選ぶと,グラフがコピーされて,そのままワードなどに貼り付けることができます.「メタファイルに保存」・「ポストスクリプトに保存」を選ぶと,画像ファイルとして保存することができ,あとでグラフの画像をレポートに取り込むこともできます.
     left



トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2006-05-16 (火) 15:17:49 (4930d)