*生物情報科学 第7回 [#gc930db4] (このページは準備中です。特に、レポート課題は変更するかもしれないので、授業中の指示があるまで提出しないでください。) **コロナウイルスの系統樹を描いてみよう。 [#k7173e7f] 今回は配列のアライメントから系統樹の作成までをWindows上で動くMEGA5を用いて実習する。&br; +コロナウイルスのsmall membrane protein遺伝子(以下、E遺伝子)のサンプル配列 &ref(E-protein.fasta); を取得する。 具体的にはリンクを右クリックして、メニューから「名前を付けてリンク先を保存」を選ぶ。&br; &ref(01_hozon.png); +保存先を聞いてくるので、linuxhomeに移動し、丸で示した「新しいフォルダ」をクリックして新しいフォルダを作成し、「corona」という名前にする。&br; &ref(02_makedir.png);&br; &ref(03_dirname.png);&br; +coronaフォルダに移動して、E-protein.fastaという名前でサンプル配列を保存する。&br; &ref(04_hozon_place.png); +MEGA5 を起動して、サンプル配列のアライメントを行う。&br; MEGA5を起動して、「File」→「Open A File/Session」から、E-protein.fastaを選択する。&br; &ref(11_open_fasta.png); +何をしたいか聞いてくるので、「Align」を選択する。&br; &ref(13_mode_select.png); +Alignモードでファイルを開いたあと、 「Alignment」→「Align by Muscle」を選ぶ。&br; &ref(14_align_exp.png); +Nothing selected for alignment. Select all? と聞いてくるので「OK」を選択する。&br; &ref(15_confirm.png); +すると、以下のようにパラメーターを聞いてくるが、そのまま「Compute」ボタンを押してアライメントを開始する。&br; &ref(16_exex_align.png); +計算が終わったら、「Data」→「Export Alignment」→「MEGA Format」 を選択して、MEGA形式でデータを出力する。&br; &ref(17_export_alignment.png); +本講義では、 E-protein.meg という名前でデータを保存する。&br; &ref(18_save_align.png); +タイトルの入力を催されるが、無視して OK を押してよい。&br; &ref(19_input_title.png); +タンパク質をコードする塩基配列かどうか聞いてくる。 本配列はタンパク質コード領域なので「Yes」を選択する。&br; &ref(20_protein_coding.png); +アライメントが終了したので、「Data」→「Exit AlnExplorer」を選択して Alignment Explorer を終了する。&br; &ref(21_exit_exp.png); +アライメントセッションを保存するかどうか聞いてくるが、 今回は保存せずに終了したいので「いいえ」を選択する。&br; &ref(22_confirm.png); +先ほど出力したMEGA形式のデータを開く。&br; 保存先のフォルダから E-protein.meg を選択してダブルクリックする。 &br; &ref(23_open_mega_file.png); &ref(23_open_mega_file.png);&br; ''まずはBootstrap検定なしの系統樹を作成する。''&br; +MEGAが起動したら、 「Analysis」→「Phylogeny」→ 「Construct/Test Neighbor-Joining Tree ...」を選択する。&br; &ref(24_make_NJ_tree.png); +Would you like to use the currently active data? (ファイル名) と聞いてくるので、ファイル名を確認して「Yes」ボタンを押す。&br; &ref(25_confirm.png); +パラメーターを聞いてくるので、「Test of Phylogeny」が「None」になっていることを確認して「Compute」ボタンを押し、計算を開始する。&br; &ref(26_without_bootstrap_options.png); +しばらく待つと系統樹ができあがる。&br; &ref(27_tree.png); &ref(27_tree.png);&br; ''次に、Bootstrap検定をしてみる。''&br; +16からの操作を再び行い、系統樹作成のパラメーターを聞いてくる箇所で、「Test of Phylogeny」に「Bootstrap method」を選ぶ。 「'''No of Bootstrap Replications'''」が500になっていることを確認して 「Compute」ボタンを押す。&br; &ref(26_bootstrap_options.png); +しばらく待つと系統樹ができあがる。&br; &ref(27_bootstrap_tree.png); **構築したコロナウイルスの系統樹にSARSウイルスのデータを追加して、その系統樹を描いてみよう。 [#s39deffc] -SARSウイルスの配列 &ref(sars_E-protein.fasta); をダウンロードし、先程ダウンロードしたデータにこのデータを加えて系統樹を作成せよ。&br; -SARS配列を追加するには、MEGA の Alignment Explorer から追加する方法もあるが、 ワードパッド、TeraPad などのテキストエディタで fasta 形式のファイルを開いて加工するのが簡単である。&br; -SARS ウイルスはどの株と最も近縁であるか、このことは何を意味するのか考察せよ。 考察と系統樹をレポートとして提出せよ。&br; '''レポート課題は変更するかもしれないので、授業で指示があるまで提出しないこと。'''