スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

#ぞくパタ 12-15回(最終回)

忙しさを理由にすっかり放置してしまいましたが、
読書会はは少しづつ進み、めでたく完走することが出来ました。

12章以降はノンパラベイズの数理(@sfchaosさん)やディリクレ過程混合モデルによるクラスタリング(@aich_08_さん、@yamakatuさん)などの難しい内容が続きました。特にディリクレ過程やウィシャート分布あたりではとても苦戦したので、数学をもうちょっとちゃんとやらないとだめだなと言う思いが強くなりましたね…。13回には、理論と実装の橋渡の部分となる内容で、@shuyoさんにノンパラベイズ実装のコツについてLTでご発表いただきました。数式のとおりにプログラムを書いても、すぐに処理できる桁数を上回ってしまうため、logを上手く使ってコントロールする必要があるなど、実践的な内容だったと思います。

@aich_08_さんのスライド


また、最終回には私が共クラスタリングについて発表させていただきました。私自身は共クラスタリングと言う名前を聞いたのがこの本で見たのが最初だったこともあり、まずは本で紹介されている無限混合モデルは後回しにして、共クラスタリングとは、から入っていくことにしました。後半の数式周りは理解が怪しいですが、共クラスタリングを実際に動かしてみたことは良い経験になったと思います。


今回でぞくパタ読書会は終了ですが、読書会そのものは継続していくようなので、また何らかの形で関わっていきたいと思います。発表の中で数式がゴリゴリ出てくるところについてどうやって喋るといいのかを学ぶことが当初の課題かなと思っています。

最後になりましたが、会場を提供して下さったドワンゴ様、
難しい内容にも関わらず発表を引き受けて下さった発表者のみなさま、
読書会にご参加いただいたみなさま、本当にありがとうございました。

何かの機会にはまたよろしくお願いいたします。

第11回「続・わかりやすいパターン認識」読書会を開催しました #ぞくパタ

去る7月14日にドワンゴ様で、
第11回「続・わかりやすいパターン認識」読書会を開催しました。
ドワンゴ様、会場をご提供いただき、本当にありがとうございました!
また、参加者のみなさま、発表者のみなさま、
ご参加いただきありがとうございました。

今回は第11章「第11章「ノンパラメトリックベイズモデル」が範囲で、
前半11:4節までを@teramonagiさんに発表していただきました。

クラスタ構造のモデリングをしよう、ということで、
データをどのように分割するのかについての基礎的な手法を
ご紹介いただきました。
ホップの壺や中華料理店過程について、
図と数式を組み合わせてもらったおかげで、
非常にわかりやすかったです。

また、中華料理店過程、ピットマン・ヨー過程については
Rでの実行例を示していただき、数式とプログラムを見比べながら
理解を進めることができました。
ありがとうございます!

また、質問としてあげられた、クラスタ数が増えるにつれ、
クラスタ1つあたりの大きさがだんだん小さくなって行くように見えるが、
均等に別れるべきデータの場合はどうなるのか?については、
@shuyoさんがフォローしてくださったので、ぜひ見に行きましょう!

「続・わかりやすいパターン認識」11章「ノンパラメトリックベイズ」の「クラスタリングの事前確率」について

次回は8月18日。
ノンパラベイズ後半戦です。
先行して予習を始めていますが、
11:6の難易度はかなりきつめです。
ちゃんと予習して、何とかついて行きたいと思います...

TokyoR 48で発表しました

昨日のTokyoR 48で発表してきました。

@dichikaさんの提唱する、Data science for meの精神に則り、
自分のデータを公開するぞ!ということで分野的に身近な装置で
自分の尿を化学分析したデータを公開しました。


当該データは以下URLで公開しています。
https://gist.github.com/siero5335/c7323407efb2b0b20b55

発表に際し、どうしてしまったんだ、変態になってしまったなど、
さまざまな褒め言葉をいただき嬉しかったです(こなみ



また、@dichikaさんがこのデータを簡単に取得できるようにしてくれました。
ありがとうございました!

第九回「続・わかりやすいパターン認識」読書会

去る6月9日にドワンゴ様で、
第九回「続・わかりやすいパターン認識」読書会を開催しました。
会場をご提供いただき、本当にありがとうございました!
また、参加者のみなさま、発表者のみなさま発表者のみなさま、
ご参加いただきありがとうございました。

今回は第9章「混合分布のパラメータ推定」が範囲で、
発表者は@Hiro_macchanさん、
@yamakatuさんでした。

式変形についても丁寧に解説いただいたお陰で、
理解が進んできました。
かなりEMアルゴリズムとの関係については
重視している印象ですね。
この手の本をしっかり読んだ経験が少ないのでなんともですが、
こういう解説は一般的なんでしょうか…。

また、LTとして@kshara2009さんが、
p値はダメなのか? (BASPの仮説検定禁止令を読む)
を発表してくださいました。

ちゃんと考えがあって仮説検定を禁止したんだ、ということが
はっきり示してあって興味深い内容でした。
ベイズ的な手法はちょっとマシだけど、
無情報事前分布はあんまり良くないんじゃないの?という空気も感じました。

次回は6月30日です。
またよろしくお願いいたします。

第8回「続・わかりやすいパターン認識」読書会

去る5月26日にドワンゴ様で、
第八回「続・わかりやすいパターン認識」読書会を開催しました。
会場をご提供いただき、本当にありがとうございました!
また、参加者のみなさま、発表者のみなさま発表者のみなさま、
ご参加いただきありがとうございました。

今回は8章: 隠れマルコフモデルが範囲で、
発表者は@fuji_fujimoniさんでした。
重い章にもかかわらず、お引き受けいただきありがとうございました。
式展開の流れなどが難しくなってきましたが、
流れを整理していただいたき助かりました。

また、本文にはいくつか問題点があったようですが、
これらの点については@shuyoさんがブログにまとめてくださいました。

「続・わかりやすいパターン認識」の8章「隠れマルコフモデル」の問題点 2つ

この辺りについては恥ずかしながら主催者が
全く抑えられていない部分だったので、
しっかり理解できるように復習したいと思います。

また、LTとして@maboさんが、
"隠れマルコフによる株価の状態" について発表してくださいました。
アルゴリズムを実装してトイモデルを動かしてみた、とのこと。
そちらの能力についてもやりたいと思ってるだけではなく、
本格的にやらねばとは思うのですが…。

また、アルゴリズムのプログラムはそんなに複雑ではないけれど、
理論の背景はこんなに難しかったのか、
という内容のコメントが印象的でした。

実際に復習として8.6以降の内容を計算してみましたが、
確かにそれまでの内容と比べると取っ付き易い感じでした。
背景も理解できるように頑張りたいですね…。

次回は明後日、6月9日です。
またよろしくお願いいたします。
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。