Genomon-fusionでは解析までに5つのコマンドを実行します.
Links inside this page:
Putting FASTQ Files in The Target Directory
Command1. Preprocess
Command2. Map Short Reads to The Tracscript Sequences of UCSC known genes via Bowtie
Command3. Map Each Un-aligned Reads to hg19 via Blat
Command4. Join The Alignment Information
Command5. List up The Candidates of Fusion Genes
FASTQファイルを配置しましょう.
解析するFASTQファイルを RNAseq/data/input/${任意のディレクトリ名} に配置します.
ペアエンドのFASTQファイルの名前を それぞれ『sequence1.txt』『sequence2.txt』に変更してください.
下記の図のように配置してください.下記はgenomon というユーザが Sample1ディレクトリにFASTQファイルを配置した例です.
# 例です.Sample01を解析対象のサンプル名にしたりしてください. [genomon@ngw01 Sample1]$ pwd /home/genomon/RNAseq/data/input/Sample1 # ディレクトリの中身を表示してみます. [genomon@ngw01 Sample1]$ ls -ltr total 24680000 -rw-r----- 1 hgc0361 12340000 Jul 6 13:57 sequence1.txt # ペアエンドの1stリード -rw-r----- 1 hgc0361 12340000 Jul 6 13:57 sequence2.txt # ペアエンドの2ndリード
FASTQファイルを並列処理のために分割します。
オプションでFASTQファイルのQuality Scoreが Solexaフォーマット の場合 Sangerフォーマットに変換が可能です.Quality Score の話がいまひとつの方はこちらのwiki を参照してください.
# RNAseq/script/command_mapping bash my_mapRNA_preprocess.sh [options] <input dir> <output dir> <tag> [<rna.env>] # [option] # -a アダプタ配列を削除します。 # -s Quality Scoreを Solexaフォーマット から Sangerフォーマットに変換します. # # 引数1 INPUTディレクトリ 前のステップでFASTQファイルを配置したディレクトリを指定してください. # 引数2 OUTPUTディレクトリ RNAseq/data/output/${任意のディレクトリ名} とするのがわかりやすくて良いでしょう. # # 引数3 TAG ジョブのKey値となります.他のジョブとかぶらないような値を設定してください. # 引数4(任意)引数なしの場合は,conf/rna.envがデフォルトで呼ばれます. # デフォルト以外の設定ファイルを読み込ませたいときは指定してください.
/home/genomon に RNAseq ディレクトリがある場合
# オプションなし./home/genomon/RNAseq/secript/command_mapping ディレクトリで実施した場合 bash my_mapRNA_preprocess.sh /home/genomon/RNAseq/data/input/Sample1 /home/genomon/RNAseq/data/output/Sample1 Sample1_0706 # Solexa→Sangerに変更する場合 bash my_mapRNA_preprocess.sh -s /home/genomon/RNAseq/data/input/Sample1 /home/genomon/RNAseq/data/output/Sample1 Sample1_0706 # 絶対パスでも指定できます.オプションなしの例 bash /home/genomon/RNAseq/script/command_mapping/my_mapRNA_preprocess.sh /home/genomon/RNAseq/data/input/Sample1 /home/genomon/RNAseq/data/output/Sample1 Sample1_0706
qsubでジョブを起動したらjobIdが画面に表示されるのでメモしておきましょう.後でログを見るときに必要です. ジョブ結果の確認方法は こちら をご覧ください.
# RNAseq/script/command_mapping bash my_mapRNA_bowtie.sh <output dir> <tag> [<rna.env>] # 引数1 OUTPUTディレクトリ 項番1.preprocess で指定したのと同じディレクトリを設定してください. # 引数2 TAG ジョブのKey値となります.他のジョブとかぶらないような値を設定してください. # 引数3(任意)引数なしの場合は,conf/rna.envがデフォルトで呼ばれます. # デフォルト以外の設定ファイルを読み込ませたいときは指定してください.
/home/genomon に RNAseq ディレクトリがある場合
# /home/genomon/RNAseq/secript/command_mapping ディレクトリで実施した場合 bash my_mapRNA_bowtie.sh /home/genomon/RNAseq/data/output/Sample1 Sample1_0706 # 絶対パスでも指定できます. bash /home/genomon/RNAseq/script/command_mapping/my_mapRNA_bowtie.sh /home/genomon/RNAseq/data/output/Sample1 Sample1_0706
qsubでジョブを起動したらjobIdが画面に表示されるのでメモしておきましょう.ジョブが成功したか結果を確認する際に必要です.
ジョブ結果の確認方法は こちら をご覧ください.
# RNAseq/script/command_mapping bash my_mapRNA_blat.sh <output dir> <tag> [<rna.env>] # 引数1 OUTPUTディレクトリ 項番1.preprocess で指定したのと同じディレクトリを設定してください. # 引数2 TAG ジョブのKey値となります.他のジョブとかぶらないような値を設定してください. # 引数3(任意)引数なしの場合は,conf/rna.envがデフォルトで呼ばれます. # デフォルト以外の設定ファイルを読み込ませたいときは指定してください.
/home/genomon に RNAseq ディレクトリがある場合
# /home/genomon/RNAseq/secript/command_mapping ディレクトリで実施した場合 bash my_mapRNA_blat.sh /home/genomon/RNAseq/data/output/Sample1 Sample1_0706 # 絶対パスでも指定できます. bash /home/genomon/RNAseq/script/command_mapping/my_mapRNA_blat.sh /home/genomon/RNAseq/data/output/Sample1 Sample1_0706
qsubでジョブを起動したらjobIdが画面に表示されるのでメモしておきましょう.ジョブが成功したか結果を確認する際に必要です.
ジョブ結果の確認方法は こちら をご覧ください.
# RNAseq/script/command_mapping bash my_mapRNA_merge.sh <output dir> <tag> [<rna.env>] # 引数1 OUTPUTディレクトリ 項番1.preprocess で指定したのと同じディレクトリを設定してください. # 引数2 TAG ジョブのKey値となります.他のジョブとかぶらないような値を設定してください. # 引数3(任意)引数なしの場合は,conf/rna.envがデフォルトで呼ばれます. # デフォルト以外の設定ファイルを読み込ませたいときは指定してください.
/home/genomon に RNAseq ディレクトリがある場合
# /home/genomon/RNAseq/secript/command_mapping ディレクトリで実施した場合 bash my_mapRNA_merge.sh /home/genomon/RNAseq/data/output/Sample1 Sample1_0706 # 絶対パスでも指定できます. bash /home/genomon/RNAseq/script/command_mapping/my_mapRNA_merge.sh /home/genomon/RNAseq/data/output/Sample1 Sample1_0706
qsubでジョブを起動したらjobIdが画面に表示されるのでメモしておきましょう.ジョブが成功したか結果を確認する際に必要です.
ジョブ結果の確認方法は こちら をご覧ください.
# RNAseq/script/command_fusion bash detectFusion.sh <output dir> <tag> [<rna.env>] # 引数1 OUTPUTディレクトリ 項番1.preprocess で指定したのと同じディレクトリを設定してください. # 引数2 TAG ジョブのKey値となります.他のジョブとかぶらないような値を設定してください. # 引数3(任意)引数なしの場合は,conf/rna.envがデフォルトで呼ばれます. # デフォルト以外の設定ファイルを読み込ませたいときは指定してください.
/home/genomon に RNAseq ディレクトリがある場合
# /home/genomon/RNAseq/secript/command_fusion ディレクトリで実施した場合 bash detectFusion.sh /home/genomon/RNAseq/data/output/Sample1 Sample1_0706 # 絶対パスでも指定できます. bash /home/genomon/RNAseq/script/command_fusion/detectFusion.sh /home/genomon/RNAseq/data/output/Sample1 Sample1_0706
qsubでジョブを起動したらjobIdが画面に表示されるのでメモしておきましょう.ジョブが成功したか結果を確認する際に必要です.
ジョブ結果の確認方法は こちら をご覧ください.