#author("2021-05-31T13:08:01+00:00;2021-05-31T12:53:10+00:00","default:admin","admin") #author("2021-05-31T13:10:09+00:00;2021-05-31T12:53:10+00:00","default:admin","admin") [[2021/5/26]] * 第6回(2021/05/26)補足 [#p77689b4] MacにRubyをインストールする方法と、インストールせずにGoogle Colabという環境でウェブブラウザ上からRubyを使う方法について解説する。 ** MacにRubyをインストール [#k34f0267] + Xcode を Mac App Store からインストール。 + Command Line Tools for Xcode を以下のようにダウンロードしてインストール。 ++ Xcodeを起動する。起動画面にXcodeのバージョンが表示されるのでメモしておく。 ++ Xcodeのメニューの Xcode => Open Developer Tool => More Developer Tools をクリック。 ++ Command Line Toolsの一覧が表示されるので、メモしたXcodeのバージョンに対応したCommand Line Toolsをダウンロード ++ ダウンロードしたファイルをダブルクリックしてインストール + https://brew.sh/index_ja の手順に従って HomeBrew をインストールする。 + Terminal.app を起動して、 brew install ruby@2.7 のコマンドを入力して、Rubyバージョン2.7.*をインストールする。 その後、gem install bio としてBioRubyをインストールする等はWindowsと同じ。 ** Google Colab でRubyを実行 [#o4869b82] パソコンの環境の問題でRubyのインストールが上手くいかない場合は、Googleの環境を利用できる。ただし、その場合はファイルの読み書きが困難(不可能ではないが複雑)のため、画面に表示するよう改造した下記のスクリプトを使用する。 - Googleアカウント(Gmailのアカウント)が必要となる。持っていないか、既存のアカウントを使い回したくなければ新規作成すること。 - ウェブブラウザとしてGoogle Chromeを使用すること。(FireFoxなどでも使えないことはないが推奨はChrome。) + https://qiita.com/ngotogenome/items/d95a7a66c63e26b23de7 の記事を参考に、Google Colab上でRubyを実行する環境を整える。(簡単実行編だけでOK。編集なども特に不要。) + 下記のスクリプトを全行丸ごと最下行の入力窓にコピー&ペーストして、左側の右三角ボタンを押すか、Shift+Enterを押して実行させる。 + 下記のスクリプトのidsの部分(配列のIDの部分)をテキストエディタで各自変更した後、全行丸ごと最下行の入力窓にコピー&ペーストして、左側の右三角ボタンを押すか、Shift+Enterを押して実行させる。 gem 'bio' require 'bio' ids = [ [ "NM_001100.2", "Homo sapiens ACTA1" ], [ "BC016045.1", "Homo sapiens ACTB" ], [ "NM_001614.2", "Homo sapiens ACTG1" ], [ "NM_001615.2", "Homo sapiens ACTG2" ], [ "NM_001613.1", "Homo sapiens ACTA2" ], [ "BC014877.1", "Mus musculus Acta1" ], [ "BC023248.1", "Mus musculus Actg1" ], [ "BC045406.1", "Danio rerio acta1" ], [ "AF057040.1", "Danio rerio beta-actin" ], [ "D87740.1", "Oryzias latipes OlMA1" ], [ "D89627.1", "Oryzias latipes OlCA1" ], [ "K00667.1", "Drosophila melanogaster actin" ], [ "L00026.1", "Saccharomyces cerevisiae actin" ], [ "D49830.1", "Pneumocystis carinii actin" ], [ "U37281.1", "Arabidopsis thaliana actin-2" ], [ "AB047313.1", "Oryza sativa Japonica Group actin" ], ] w = $stdout ncbi = Bio::NCBI::REST.new ids.each do |a| id = a[0] desc = a[1] # fetch the sequence from NCBI txt = ncbi.efetch(id, {"db"=>"nucleotide", "rettype"=>"gb"}) #puts txt # parse the GenBank formatted text gb = Bio::GenBank.new(txt) #$stderr.print gb.acc_version, " ", gb.definition, "\n" # pick up the first CDS region cds = gb.features.find { |f| f.feature == "CDS" } #$stderr.print "CDS ", cds.position.inspect, "\n" # get the sequence s = gb.naseq.splicing(cds.position) # output FASTA-formatted text w.print s.to_fasta(desc, 70) end nil 実行すると画面に出力されるので、出力された結果をテキストエディタにコピー&ペーストして名前を付けて保存する。 なお、いちどブラウザを閉じた後で再度実行したい場合は、Google Colabへのノートブックのアップロードから手順を繰り返す必要がある。アップロード時にファイル名重複を指摘された場合は、Google Drive上の既存のファイルのファイル名を変更するか、パソコン上でファイル名を変更してからアップロードする。