スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

第九回「続・わかりやすいパターン認識」読書会

去る6月9日にドワンゴ様で、
第九回「続・わかりやすいパターン認識」読書会を開催しました。
会場をご提供いただき、本当にありがとうございました!
また、参加者のみなさま、発表者のみなさま発表者のみなさま、
ご参加いただきありがとうございました。

今回は第9章「混合分布のパラメータ推定」が範囲で、
発表者は@Hiro_macchanさん、
@yamakatuさんでした。

式変形についても丁寧に解説いただいたお陰で、
理解が進んできました。
かなりEMアルゴリズムとの関係については
重視している印象ですね。
この手の本をしっかり読んだ経験が少ないのでなんともですが、
こういう解説は一般的なんでしょうか…。

また、LTとして@kshara2009さんが、
p値はダメなのか? (BASPの仮説検定禁止令を読む)
を発表してくださいました。

ちゃんと考えがあって仮説検定を禁止したんだ、ということが
はっきり示してあって興味深い内容でした。
ベイズ的な手法はちょっとマシだけど、
無情報事前分布はあんまり良くないんじゃないの?という空気も感じました。

次回は6月30日です。
またよろしくお願いいたします。

第8回「続・わかりやすいパターン認識」読書会

去る5月26日にドワンゴ様で、
第八回「続・わかりやすいパターン認識」読書会を開催しました。
会場をご提供いただき、本当にありがとうございました!
また、参加者のみなさま、発表者のみなさま発表者のみなさま、
ご参加いただきありがとうございました。

今回は8章: 隠れマルコフモデルが範囲で、
発表者は@fuji_fujimoniさんでした。
重い章にもかかわらず、お引き受けいただきありがとうございました。
式展開の流れなどが難しくなってきましたが、
流れを整理していただいたき助かりました。

また、本文にはいくつか問題点があったようですが、
これらの点については@shuyoさんがブログにまとめてくださいました。

「続・わかりやすいパターン認識」の8章「隠れマルコフモデル」の問題点 2つ

この辺りについては恥ずかしながら主催者が
全く抑えられていない部分だったので、
しっかり理解できるように復習したいと思います。

また、LTとして@maboさんが、
"隠れマルコフによる株価の状態" について発表してくださいました。
アルゴリズムを実装してトイモデルを動かしてみた、とのこと。
そちらの能力についてもやりたいと思ってるだけではなく、
本格的にやらねばとは思うのですが…。

また、アルゴリズムのプログラムはそんなに複雑ではないけれど、
理論の背景はこんなに難しかったのか、
という内容のコメントが印象的でした。

実際に復習として8.6以降の内容を計算してみましたが、
確かにそれまでの内容と比べると取っ付き易い感じでした。
背景も理解できるように頑張りたいですね…。

次回は明後日、6月9日です。
またよろしくお願いいたします。

「DeepLearning もくもくハッカソン 〜家に帰るまでがハッカソンです〜」に参加しました2

発表が無事終了したので目標2をまとめます。

目標2は2手持ちの化学物質構造データを使って、
機器分析における保持時間を予測することでした。

発表スライドは以下に

素性の良い異性体の情報を使ったとはいえ、
思ってたより良い結果が得られました。

なぜよい結果だったのか、そもそも何か間違ってないかは
何かしらの手段で今後検証しないとな、と思ってます。
質問でもありましたが、過学習ではないのかという点については
個人的にも気になるところです。

今回の学びとしては、
Deep learningだからといって層が深いモデルから試したり、
いろんな条件を最初から入れると良くないな、ということです。
最初は単純なモデルから試さないと良い結果にならないのは、
どのモデルでも共通ですね…。

今回のハッカソンに参加して丸2日h2oやAWSに触れ、
操作になれることができたので力がついた気がします。

このような機会をいただき、
主催者のyamakatuさん、
会場をご提供いただいたドワンゴ様、
スポンサーになっていただいたAWS様、
ありがとうございました。

「DeepLearning もくもくハッカソン 〜家に帰るまでがハッカソンです〜」に参加しました1

5月23-34日開催の
「DeepLearning もくもくハッカソン 〜家に帰るまでがハッカソンです〜」
に参加しました。

今回の目標は、
1. AWS上のRstudioでh2oを走らせること。
2. 手持ちの化学物質構造データを使って、
機器分析における保持時間を予測することの2点です。

まず1についてやったことをまとめます。
AWSのアカウントを作成した後、
"おそらく最速でRStudio Serverを利用開始する方法"に従い、
"RStudio Server Amazon Machine Image (AMI)" のAMIを使用すれば、
AWSから簡単にRstudio serverを使えるようになります。
このAMIはUbuntu 14.04ベースのようです。
また、このAMIにはrstan, rjagsが入ってるので、
そっちの人にもメリットが有ると思います。

セキュリティーグループの設定で、
SSHに加えてHTTPを設定しておくと、
パブリックDNSをブラウザにコピペするだけで
Rstudioにログインできるのでらくちんです。

続けてh2oを導入していくわけですが、
h2oを動かすためにはJavaを入れておかないといけないので、
AWS上のUbuntuに接続してJavaをインストールします。

h2o公式曰く、Java Development Kit 1.7以降を推奨とのことなので、
以下のサイトを参照して導入しました。

UbuntuにOracle JDK8をインストール

ここまでくればあとはh2oを導入して動かすだけ。
RstudioAMIはDropboxと簡単に連携できるので、
データの受け渡しも簡単です。
ついでにDropbox内のフォルダを作業ディレクトリにしておくと
便利だと思います。(一度接続を切ったら再度設定する必要あり)

以下はRstudio AMI内でのコードになりますが、
ほとんどh2o公式のinstall方法および、Rstudio AMIの説明そのままです。


導入の参考になれば幸いです。
目標2については一段落したらまとめようと思います。

第7回「続・わかりやすいパターン認識」読書会

去る5月12日にドワンゴ様で、
第七回「続・わかりやすいパターン認識」読書会を開催しました。
会場をご提供いただき、本当にありがとうございました!
また、台風で足元が悪い中ご参加いただき、
みなさま本当にありがとうございました。

今回の範囲は7章: マルコフモデルで、発表者は@tanimocchiさんでした。

これまでは試行の独立性が保証された場合についての話題でしたが、
今回、次回とそれまでの過程から影響をうける場合の手法です。

読む前は数式の意味合いについてはかなり曖昧な状態でしたが、
遷移確率行列についての解説や、
過去の発表とつなげた説明を頂いたおかげで、
だいぶ見通しが良くなってきました。

次回は26日、8章 隠れマルコフモデルです!
よろしくお願いいたします。
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。