!!!G-languageGAE基本操作 !!!Step 0 -準備- [KNOB|http://knob.sourceforge.jp/ja/]を使うか[G-language Project公式ウェブページ|http://www.g-language.org/]からパッケージをダウンロードしてきてインストールする。 !!!Step 1 -G-language System の起動 例えばカレントディレクトリにある "bsub.gbk" というデータファイル(Bacillus subtilis のコンプリートゲノム)を読み込む場合、テキストエディタに以下の二行を書き込むだけで準備は完了する。 use G; $gb = new G("bsub"); このPerlスクリプト(ファイル名を test.pl とする)を実行すれば、G-language System が起動する。 perl test.pl [ENTER] 出力例: __/__/__/__/__/__/__/__/__/__/__/__/__/ G-language System Version: 1.6.10 Copyright (C) 2001-2007 G-language Project Institute of Advanced Biosciences, Keio University, JAPAN http://www.g-language.org/ __/__/__/__/__/__/__/__/__/__/__/__/__/ Accession Number: AL009126 Length of Sequence : 4214814 A Content : 1187757 (28.18%) T Content : 1192867 (28.30%) G Content : 915023 (21.71%) C Content : 919167 (21.81%) Others : 0 (0.00%) AT Content : 56.48% GC Content : 43.52% !!!Step 2 -標準関数の使用例(1) : 遺伝子全体でのコドン使用頻度の解析 B. subtilis ゲノム全体のコドン使用頻度を解析する場合、Step 1で作成したPerlスクリプトに、codon_usage()関数を使用する一行を書き足す。($gb を引数として渡す) use G; $gb = new G("bsub"); codon_usage($gb); 上記スクリプトを実行すると、コドン使用頻度がディスプレイに出力されるとともに、コドンテーブルが表示される。 !!!Step 3 -標準関数の使用例(2) : 遺伝子毎のコドン使用頻度の解析 codon_usage()関数は、以下のオプションを持つ。 ,option,description ,-CDSid,コドン使用頻度を計算するCDSのIDを指定。デフォルトは全遺伝子で計算する。 ,-output,出力先を指定。'stdout'はディスプレイ出力、'f'はファイル出力。デフォルトは 'stdout'。 ,-filename,出力ファイル名を指定。デフォルトは 'codon_usage.csv'。 オプションは codon_usage($gb, -output=>'f', -filename=>'bsub_CodonUsage.csv'); のように、"-" をオプション名の頭に付け、"=>" で値と結ぶ。 特定の遺伝子のコドン使用頻度を計算したい場合、Step 1 で作成したスクリプトを以下のように書き換える。('CDS113'は、伸長因子をコードする遺伝子tufAに対応している) use G; $gb = new G("bsub"); codon_usage($gb, -CDSid=>'CDS113'); このスクリプトを実行すると、tufA 遺伝子のコドン使用頻度がディスプレイに出力される。 !!!Step 4 -より高度な解析のために G-language System はゲノム解析関数だけでなく、ゲノムデータベースを扱い易くするためのプラットフォームを提供する。そのプラットフォームとは、$gb というG-language System のインスタンスから呼び出せる関数であり、遺伝子毎の処理、開始コドン・終止コドン周辺の処理、イントロン・エキソン処理など多岐に渡る。 例えば、$gb->cds() は、$gb に格納されている全CDSを配列で返す。step 3で作成したtufA遺伝子のコドン使用頻度解析のためのスクリプトは、$gb->cds() を使って以下のように書き換えても同じ結果が得られる。 use G; $gb = new G("bsub"); foreach $cds ($gb->cds()){ if($gb->{$cds}->{gene} =~ /tufA/){ codon_usage($gb, -CDSid=>$cds); } }