第7回の変更点

追加された行はこの色です。
削除された行はこの色です。
第7回へ行く。
第7回の差分を削除
*生物情報科学　第7回 [#gc930db4]

**コロナウイルスの系統樹を描いてみよう。 [#k7173e7f]

今回は配列のアライメントから系統樹の作成までをWindows上で動くMEGA6を用いて実習する。

MEGA6は http://www.megasoftware.net/ から無償でダウンロードできる分子進化遺伝学解析用ソフトウェアである。情報教育用計算機システムにはインストール済であるが、自宅や研究室のパソコンにも必要ならインストールするとよい。&br;

+コロナウイルスのsmall membrane protein遺伝子（以下、E遺伝子）のサンプル配列 &ref(E-protein.fasta); を取得する。
具体的にはリンクを右クリックして、メニューから「名前を付けてリンク先を保存」を選ぶ。&br;
&ref(01_hozon.png);&br;&br;
+保存先を聞いてくるので、linuxhomeに移動し、丸で示した「新しいフォルダ」をクリックして新しいフォルダを作成し、「corona」という名前にする。&br;
&ref(02_makedir.png);&br;
&ref(03_dirname.png);&br;&br;
+coronaフォルダに移動して、E-protein.fastaという名前でサンプル配列を保存する。&br;
&ref(04_hozon_place.png);&br;&br;
+MEGA5 を起動して、サンプル配列のアライメントを行う。&br;
MEGA5を起動して、「File」→「Open A File/Session」から、E-protein.fastaを選択する。&br;
&ref(11_open_fasta.png);&br;&br;
+何をしたいか聞いてくるので、「Align」を選択する。&br;
&ref(13_mode_select.png);&br;&br;
+入力した配列をタンパク質に翻訳する。
具体的には、「Translated Protein Sequences」タブをクリックする。&br;
(ここで使用している配列は全長がタンパク質コード領域のため、このような操作をしても問題はないが、非コード領域を含む配列を翻訳するときにはコード領域をしてやる必要がある)&br;
&ref(14_translate.png);&br;&br;
+Genetic Code について聞いてくるが、ここではそのまま「Yes」をクリックする。&br;
&ref(15_confirm.png);&br;&br;
+「Alignment」→「Align by Muscle」を選ぶ。&br;
&ref(16_align.png);&br;&br;
+Nothing selected for alignment. Select all? 
と聞いてくるので「OK」を選択する。&br;
&ref(17_confirm.png);&br;&br;
+すると、以下のようにパラメーターを聞いてくるが、そのまま「Compute」ボタンを押してアライメントを開始する。&br;
&ref(18_params.png);&br;&br;
+計算が終わったら、「Data」→「Export Alignment」→「MEGA Format」
を選択して、MEGA形式でデータを出力する。&br;
&ref(19_save.png);&br;&br;
+本講義では、 E-protein_translated.meg という名前でデータを保存する。&br;
&ref(20_specify_name.png);&br;&br;
+タイトルの入力を催されるが、無視して OK を押してよい。&br;
&ref(21_title.png);&br;&br;
+アライメントが終了したので、「Data」→「Exit AlnExplorer」を選択して
Alignment Explorer を終了する。&br;
&ref(22_exit.png);&br;&br;
+アライメントセッションを保存するかどうか聞いてくるが、
今回は保存せずに終了したいので「いいえ」を選択する。&br;
&ref(23_confirm.png);&br;&br;
+先ほど出力したMEGA形式のデータを開く。&br;
保存先のフォルダから E-protein_translated.meg を選択してダブルクリックする。 &br;
&ref(24_open.png);&br;&br;
''まずはBootstrap検定なしの系統樹を作成する。''&br;
+MEGAが起動したら、 「Analysis」→「Phylogeny」→ 「Construct/Test Neighbor-Joining Tree ...」を選択する。&br;
&ref(25_makePhylogeny.png);&br;&br;
+Would you like to use the currently active data? (ファイル名) 
と聞いてくるので、ファイル名を確認して「Yes」ボタンを押す。&br;
&ref(26_confirm.png);&br;&br;
+パラメーターを聞いてくるので、「Test of Phylogeny」が「None」になっていることを確認して「Compute」ボタンを押し、計算を開始する。&br;
&ref(27_params.png);&br;&br;
+しばらく待つと系統樹ができあがる。&br;
&ref(28_tree.png);&br;&br;
''次に、Bootstrap検定をしてみる。''&br;
+16からの操作を再び行い、系統樹作成のパラメーターを聞いてくる箇所で、「Test of Phylogeny」に「Bootstrap method」を選ぶ。
「'''No of Bootstrap Replications'''」が500になっていることを確認して
「Compute」ボタンを押す。&br;
&ref(29_params_bootstrap.png);&br;&br;
+しばらく待つと系統樹ができあがる。&br;
&ref(30_tree_bootstrap.png);

**課題：構築したコロナウイルスの系統樹にSARSウイルスのデータを追加して、その系統樹を描く [#s39deffc]

-SARSウイルスの配列 &ref(sars_E-protein.fasta); をダウンロードし、先程ダウンロードしたデータにこのデータを加えて系統樹を作成せよ。&br;
--SARS配列を追加するには、MEGA の Alignment Explorer から追加する方法もあるが、 TeraPad などのテキストエディタで fasta 形式のファイルを開いて加工するのが簡単である。&br;
-SARS ウイルスはどの株と最も近縁であるか、このことは何を意味するのか考察せよ。
&br;
-さらに、SARSウイルスの配列（上記）をクエリーとしてNCBI BLASTにて検索を行い（下記の注記参照）、''ヒトのSARSウイルス以外で''もっとも近い配列は何であるか（どの動植物由来の何ウイルスであるか）を調べよ。&br;

レポートには系統樹の図と系統樹作成に使用したアライメント（MEGA形式でよい）を含むこと。

%%''※レポート課題は変更するかもしれないので、授業で指示があるまで提出しないこと。''%%
''※レポート課題は変更するかもしれないので、授業で指示があるまで提出しないこと。''

（BLAST検索実行時の注記）BLAST実行の際、画面下方の"Algorithm parameters"をクリックすると出てくる詳細なパラメーター設定のうち"Max target sequences"を500程度に増やすとよい。

（追記）系統樹の図は、「Image」メニューからPDFなどで保存できる。
第7回 の変更点

第7回の変更点