トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

G-languageGAE基本操作

G-languageGAE基本操作

Step 0 -準備-

KNOBを使うかG-language Project公式ウェブページからパッケージをダウンロードしてきてインストールする。

Step 1 -G-language System の起動

例えばカレントディレクトリにある "bsub.gbk" というデータファイル(Bacillus subtilis のコンプリートゲノム)を読み込む場合、テキストエディタに以下の二行を書き込むだけで準備は完了する。

use G;
$gb = new G("bsub");

このPerlスクリプト(ファイル名を test.pl とする)を実行すれば、G-language System が起動する。

perl test.pl  [ENTER]

出力例:

            __/__/__/__/__/__/__/__/__/__/__/__/__/

                    G-language System

             Version: 1.6.10 

             Copyright (C) 2001-2007 G-language Project
             Institute of Advanced Biosciences,
             Keio University, JAPAN

                http://www.g-language.org/

            __/__/__/__/__/__/__/__/__/__/__/__/__/


Accession Number: AL009126

 Length of Sequence :   4214814
          A Content :   1187757 (28.18%)
          T Content :   1192867 (28.30%)
          G Content :    915023 (21.71%)
          C Content :    919167 (21.81%)
             Others :         0 (0.00%)
         AT Content :    56.48%
         GC Content :    43.52%

Step 2 -標準関数の使用例(1) : 遺伝子全体でのコドン使用頻度の解析

B. subtilis ゲノム全体のコドン使用頻度を解析する場合、Step 1で作成したPerlスクリプトに、codon_usage()関数を使用する一行を書き足す。($gb を引数として渡す)

 use G;
 $gb = new G("bsub");
 codon_usage($gb);

上記スクリプトを実行すると、コドン使用頻度がディスプレイに出力されるとともに、コドンテーブルが表示される。

Step 3 -標準関数の使用例(2) : 遺伝子毎のコドン使用頻度の解析

codon_usage()関数は、以下のオプションを持つ。

option description
-CDSid コドン使用頻度を計算するCDSのIDを指定。デフォルトは全遺伝子で計算する。
-output 出力先を指定。'stdout'はディスプレイ出力、'f'はファイル出力。デフォルトは 'stdout'。
-filename 出力ファイル名を指定。デフォルトは 'codon_usage.csv'。

オプションは

codon_usage($gb, -output=>'f', -filename=>'bsub_CodonUsage.csv');

のように、"-" をオプション名の頭に付け、"=>" で値と結ぶ。

特定の遺伝子のコドン使用頻度を計算したい場合、Step 1 で作成したスクリプトを以下のように書き換える。('CDS113'は、伸長因子をコードする遺伝子tufAに対応している)

 use G;
 $gb = new G("bsub");
 codon_usage($gb, -CDSid=>'CDS113');

このスクリプトを実行すると、tufA 遺伝子のコドン使用頻度がディスプレイに出力される。

Step 4 -より高度な解析のために

G-language System はゲノム解析関数だけでなく、ゲノムデータベースを扱い易くするためのプラットフォームを提供する。そのプラットフォームとは、$gb というG-language System のインスタンスから呼び出せる関数であり、遺伝子毎の処理、開始コドン・終止コドン周辺の処理、イントロン・エキソン処理など多岐に渡る。

例えば、$gb->cds() は、$gb に格納されている全CDSを配列で返す。step 3で作成したtufA遺伝子のコドン使用頻度解析のためのスクリプトは、$gb->cds() を使って以下のように書き換えても同じ結果が得られる。

use G;
$gb = new G("bsub");

foreach $cds ($gb->cds()){
    if($gb->{$cds}->{gene} =~ /tufA/){
	codon_usage($gb, -CDSid=>$cds);
    }
}