How to Use Genomon-fusion


Genomon-fusionでは解析までに5つのコマンドを実行します.

Command-module

Putting FASTQ Files in The Target Directory


FASTQファイルを配置しましょう.

解析するFASTQファイルを RNAseq/data/input/${任意のディレクトリ名} に配置します.
ペアエンドのFASTQファイルの名前を それぞれ『sequence1.txt』『sequence2.txt』に変更してください.

下記の図のように配置してください.下記はgenomon というユーザが Sample1ディレクトリにFASTQファイルを配置した例です.

				# 例です.Sample01を解析対象のサンプル名にしたりしてください.
				[genomon@ngw01 Sample1]$ pwd
				/home/genomon/RNAseq/data/input/Sample1
				
				# ディレクトリの中身を表示してみます.
				[genomon@ngw01 Sample1]$ ls -ltr
				total 24680000
				-rw-r----- 1 hgc0361 12340000 Jul  6 13:57 sequence1.txt  # ペアエンドの1stリード
				-rw-r----- 1 hgc0361 12340000 Jul  6 13:57 sequence2.txt  # ペアエンドの2ndリード
			

1. Preprocess


FASTQファイルを並列処理のために分割します。
オプションでFASTQファイルのQuality Scoreが Solexaフォーマット の場合 Sangerフォーマットに変換が可能です.Quality Score の話がいまひとつの方はこちらのwiki を参照してください.

			# RNAseq/script/command_mapping
			bash my_mapRNA_preprocess.sh [options] <input dir> <output dir> <tag> [<rna.env>]
			
			# [option]
			# -a アダプタ配列を削除します。
			# -s Quality Scoreを Solexaフォーマット から Sangerフォーマットに変換します.
			# 
			# 引数1 INPUTディレクトリ  前のステップでFASTQファイルを配置したディレクトリを指定してください.
			# 引数2 OUTPUTディレクトリ RNAseq/data/output/${任意のディレクトリ名} とするのがわかりやすくて良いでしょう.
			#         
			# 引数3 TAG  ジョブのKey値となります.他のジョブとかぶらないような値を設定してください.
			# 引数4(任意)引数なしの場合は,conf/rna.envがデフォルトで呼ばれます.
			#         デフォルト以外の設定ファイルを読み込ませたいときは指定してください.
		

/home/genomon に RNAseq ディレクトリがある場合

		# オプションなし./home/genomon/RNAseq/secript/command_mapping ディレクトリで実施した場合
		bash my_mapRNA_preprocess.sh /home/genomon/RNAseq/data/input/Sample1 /home/genomon/RNAseq/data/output/Sample1 Sample1_0706
		# Solexa→Sangerに変更する場合
		bash my_mapRNA_preprocess.sh -s /home/genomon/RNAseq/data/input/Sample1 /home/genomon/RNAseq/data/output/Sample1 Sample1_0706

		# 絶対パスでも指定できます.オプションなしの例
		bash /home/genomon/RNAseq/script/command_mapping/my_mapRNA_preprocess.sh /home/genomon/RNAseq/data/input/Sample1 /home/genomon/RNAseq/data/output/Sample1 Sample1_0706
		

qsubでジョブを起動したらjobIdが画面に表示されるのでメモしておきましょう.後でログを見るときに必要です. ジョブ結果の確認方法は こちら をご覧ください.

2. Map Short Reads to The Tracscript Sequences of UCSC known genes via Bowtie


Bowtieによるマッピングを実施します.
			# RNAseq/script/command_mapping
			bash my_mapRNA_bowtie.sh <output dir> <tag> [<rna.env>]
			
			# 引数1 OUTPUTディレクトリ 項番1.preprocess で指定したのと同じディレクトリを設定してください.
			# 引数2 TAG  ジョブのKey値となります.他のジョブとかぶらないような値を設定してください.
			# 引数3(任意)引数なしの場合は,conf/rna.envがデフォルトで呼ばれます.
			#         デフォルト以外の設定ファイルを読み込ませたいときは指定してください.
			

/home/genomon に RNAseq ディレクトリがある場合

		# /home/genomon/RNAseq/secript/command_mapping ディレクトリで実施した場合
		bash my_mapRNA_bowtie.sh /home/genomon/RNAseq/data/output/Sample1 Sample1_0706
		
		# 絶対パスでも指定できます.
		bash /home/genomon/RNAseq/script/command_mapping/my_mapRNA_bowtie.sh /home/genomon/RNAseq/data/output/Sample1 Sample1_0706
		

qsubでジョブを起動したらjobIdが画面に表示されるのでメモしておきましょう.ジョブが成功したか結果を確認する際に必要です.
ジョブ結果の確認方法は こちら をご覧ください.

3. Map Each Un-aligned Reads to hg19 via Blat


Blatによるマッピングを実施します.Bowtieでマッピングできなかったリードに対して再マッピングを行います.
			# RNAseq/script/command_mapping
			bash my_mapRNA_blat.sh <output dir> <tag> [<rna.env>]
			
			# 引数1 OUTPUTディレクトリ 項番1.preprocess で指定したのと同じディレクトリを設定してください.
			# 引数2 TAG  ジョブのKey値となります.他のジョブとかぶらないような値を設定してください.
			# 引数3(任意)引数なしの場合は,conf/rna.envがデフォルトで呼ばれます.
			#         デフォルト以外の設定ファイルを読み込ませたいときは指定してください.
		

/home/genomon に RNAseq ディレクトリがある場合

		# /home/genomon/RNAseq/secript/command_mapping ディレクトリで実施した場合
		bash my_mapRNA_blat.sh /home/genomon/RNAseq/data/output/Sample1 Sample1_0706
		
		# 絶対パスでも指定できます.
		bash /home/genomon/RNAseq/script/command_mapping/my_mapRNA_blat.sh /home/genomon/RNAseq/data/output/Sample1 Sample1_0706
		

qsubでジョブを起動したらjobIdが画面に表示されるのでメモしておきましょう.ジョブが成功したか結果を確認する際に必要です.
ジョブ結果の確認方法は こちら をご覧ください.

4. Join The Alignment Information


Bowtie のマッピング結果と Blat のマッピング結果をmergeします.
			# RNAseq/script/command_mapping
			bash my_mapRNA_merge.sh <output dir> <tag> [<rna.env>]
			
			# 引数1 OUTPUTディレクトリ 項番1.preprocess で指定したのと同じディレクトリを設定してください.
			# 引数2 TAG  ジョブのKey値となります.他のジョブとかぶらないような値を設定してください.
			# 引数3(任意)引数なしの場合は,conf/rna.envがデフォルトで呼ばれます.
			#         デフォルト以外の設定ファイルを読み込ませたいときは指定してください.
		

/home/genomon に RNAseq ディレクトリがある場合

		# /home/genomon/RNAseq/secript/command_mapping ディレクトリで実施した場合
		bash my_mapRNA_merge.sh /home/genomon/RNAseq/data/output/Sample1 Sample1_0706
		
		# 絶対パスでも指定できます.
		bash /home/genomon/RNAseq/script/command_mapping/my_mapRNA_merge.sh /home/genomon/RNAseq/data/output/Sample1 Sample1_0706
		

qsubでジョブを起動したらjobIdが画面に表示されるのでメモしておきましょう.ジョブが成功したか結果を確認する際に必要です.
ジョブ結果の確認方法は こちら をご覧ください.

5. List up The Candidates of Fusion Genes


候補となる Fusion Gene を検出します.
			# RNAseq/script/command_fusion
			bash detectFusion.sh <output dir> <tag> [<rna.env>]
			
			# 引数1 OUTPUTディレクトリ 項番1.preprocess で指定したのと同じディレクトリを設定してください.
			# 引数2 TAG  ジョブのKey値となります.他のジョブとかぶらないような値を設定してください.
			# 引数3(任意)引数なしの場合は,conf/rna.envがデフォルトで呼ばれます.
			#         デフォルト以外の設定ファイルを読み込ませたいときは指定してください.
		

/home/genomon に RNAseq ディレクトリがある場合

		# /home/genomon/RNAseq/secript/command_fusion ディレクトリで実施した場合
		bash detectFusion.sh /home/genomon/RNAseq/data/output/Sample1 Sample1_0706
		
		# 絶対パスでも指定できます.
		bash /home/genomon/RNAseq/script/command_fusion/detectFusion.sh /home/genomon/RNAseq/data/output/Sample1 Sample1_0706
		

qsubでジョブを起動したらjobIdが画面に表示されるのでメモしておきましょう.ジョブが成功したか結果を確認する際に必要です.
ジョブ結果の確認方法は こちら をご覧ください.

^ Go to Top