スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

「DeepLearning もくもくハッカソン 〜家に帰るまでがハッカソンです〜」に参加しました1

5月23-34日開催の
「DeepLearning もくもくハッカソン 〜家に帰るまでがハッカソンです〜」
に参加しました。

今回の目標は、
1. AWS上のRstudioでh2oを走らせること。
2. 手持ちの化学物質構造データを使って、
機器分析における保持時間を予測することの2点です。

まず1についてやったことをまとめます。
AWSのアカウントを作成した後、
"おそらく最速でRStudio Serverを利用開始する方法"に従い、
"RStudio Server Amazon Machine Image (AMI)" のAMIを使用すれば、
AWSから簡単にRstudio serverを使えるようになります。
このAMIはUbuntu 14.04ベースのようです。
また、このAMIにはrstan, rjagsが入ってるので、
そっちの人にもメリットが有ると思います。

セキュリティーグループの設定で、
SSHに加えてHTTPを設定しておくと、
パブリックDNSをブラウザにコピペするだけで
Rstudioにログインできるのでらくちんです。

続けてh2oを導入していくわけですが、
h2oを動かすためにはJavaを入れておかないといけないので、
AWS上のUbuntuに接続してJavaをインストールします。

h2o公式曰く、Java Development Kit 1.7以降を推奨とのことなので、
以下のサイトを参照して導入しました。

UbuntuにOracle JDK8をインストール

ここまでくればあとはh2oを導入して動かすだけ。
RstudioAMIはDropboxと簡単に連携できるので、
データの受け渡しも簡単です。
ついでにDropbox内のフォルダを作業ディレクトリにしておくと
便利だと思います。(一度接続を切ったら再度設定する必要あり)

以下はRstudio AMI内でのコードになりますが、
ほとんどh2o公式のinstall方法および、Rstudio AMIの説明そのままです。


導入の参考になれば幸いです。
目標2については一段落したらまとめようと思います。
スポンサーサイト

コメントの投稿

非公開コメント

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。