#author("2021-05-31T13:08:01+00:00;2021-05-31T12:53:10+00:00","default:admin","admin")
#author("2021-05-31T13:10:09+00:00;2021-05-31T12:53:10+00:00","default:admin","admin")
[[2021/5/26]]

* 第6回(2021/05/26)補足 [#p77689b4]

MacにRubyをインストールする方法と、インストールせずにGoogle Colabという環境でウェブブラウザ上からRubyを使う方法について解説する。

** MacにRubyをインストール [#k34f0267]

+ Xcode を Mac App Store からインストール。
+ Command Line Tools for Xcode を以下のようにダウンロードしてインストール。
++ Xcodeを起動する。起動画面にXcodeのバージョンが表示されるのでメモしておく。
++ Xcodeのメニューの Xcode => Open Developer Tool => More Developer Tools をクリック。
++ Command Line Toolsの一覧が表示されるので、メモしたXcodeのバージョンに対応したCommand Line Toolsをダウンロード
++ ダウンロードしたファイルをダブルクリックしてインストール
+ https://brew.sh/index_ja の手順に従って HomeBrew をインストールする。
+ Terminal.app を起動して、
 brew install ruby@2.7
のコマンドを入力して、Rubyバージョン2.7.*をインストールする。

その後、gem install bio としてBioRubyをインストールする等はWindowsと同じ。


** Google Colab でRubyを実行 [#o4869b82]

パソコンの環境の問題でRubyのインストールが上手くいかない場合は、Googleの環境を利用できる。ただし、その場合はファイルの読み書きが困難(不可能ではないが複雑)のため、画面に表示するよう改造した下記のスクリプトを使用する。

- Googleアカウント(Gmailのアカウント)が必要となる。持っていないか、既存のアカウントを使い回したくなければ新規作成すること。
- ウェブブラウザとしてGoogle Chromeを使用すること。(FireFoxなどでも使えないことはないが推奨はChrome。)

+ https://qiita.com/ngotogenome/items/d95a7a66c63e26b23de7 の記事を参考に、Google Colab上でRubyを実行する環境を整える。(簡単実行編だけでOK。編集なども特に不要。)
+ 下記のスクリプトを全行丸ごと最下行の入力窓にコピー&ペーストして、左側の右三角ボタンを押すか、Shift+Enterを押して実行させる。
+ 下記のスクリプトのidsの部分(配列のIDの部分)をテキストエディタで各自変更した後、全行丸ごと最下行の入力窓にコピー&ペーストして、左側の右三角ボタンを押すか、Shift+Enterを押して実行させる。
 gem 'bio'
 require 'bio'
 
 ids = [
  [ "NM_001100.2", "Homo sapiens ACTA1" ],
  [ "BC016045.1",  "Homo sapiens ACTB" ],
  [ "NM_001614.2", "Homo sapiens ACTG1" ],
  [ "NM_001615.2", "Homo sapiens ACTG2" ],
  [ "NM_001613.1", "Homo sapiens ACTA2" ],
  [ "BC014877.1",  "Mus musculus Acta1" ],
  [ "BC023248.1",  "Mus musculus Actg1" ],
  [ "BC045406.1",  "Danio rerio acta1" ],
  [ "AF057040.1",  "Danio rerio beta-actin" ],
  [ "D87740.1",    "Oryzias latipes OlMA1" ],
  [ "D89627.1",    "Oryzias latipes OlCA1" ],
  [ "K00667.1",    "Drosophila melanogaster actin" ],
  [ "L00026.1",    "Saccharomyces cerevisiae actin" ],
  [ "D49830.1",    "Pneumocystis carinii actin" ],
  [ "U37281.1",    "Arabidopsis thaliana actin-2" ],
  [ "AB047313.1",  "Oryza sativa Japonica Group actin" ],
 ]
 
 w = $stdout
 
 ncbi = Bio::NCBI::REST.new
 
 ids.each do |a|
  id = a[0]
  desc = a[1]
 
  # fetch the sequence from NCBI
  txt = ncbi.efetch(id, {"db"=>"nucleotide", "rettype"=>"gb"})
  #puts txt
 
  # parse the GenBank formatted text
  gb = Bio::GenBank.new(txt)
  #$stderr.print gb.acc_version, " ", gb.definition, "\n"
 
  # pick up the first CDS region
  cds = gb.features.find { |f| f.feature == "CDS" }
  #$stderr.print "CDS ", cds.position.inspect, "\n"
 
  # get the sequence
  s = gb.naseq.splicing(cds.position)
 
  # output FASTA-formatted text
  w.print s.to_fasta(desc, 70)
 end
 
 nil

実行すると画面に出力されるので、出力された結果をテキストエディタにコピー&ペーストして名前を付けて保存する。

なお、いちどブラウザを閉じた後で再度実行したい場合は、Google Colabへのノートブックのアップロードから手順を繰り返す必要がある。アップロード時にファイル名重複を指摘された場合は、Google Drive上の既存のファイルのファイル名を変更するか、パソコン上でファイル名を変更してからアップロードする。

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS