2009/05/06

[R][勉強会]データマイニング勉強会「やっちろ.R」

参加してきましたっ!

 

やっちろ.R

「やっちろ」とは熊本県第二の都市「八代市」を指しますが今回は会場が熊本市内でした(笑)

tsukuba.R主催のsyou6162さんをお招きしてのデータマイニング勉強会!

 

写真

写真は会場の案内板と熊本市街(下通り)

 

発表資料及び感想

 

感想

正直な感想。

統計、データマイニング、RなどについてよりもRという言語自体に興味を持ちました。コードを見ていてLispを連想したからです><syou6162さんに聞いてみたところRのソース自体がかなりLispっぽいとのこと。C言語なのに。少し見せていただいたところcarとかcdrがたくさん書いてあったのでフイタwCなのに><

あれはなんなんでしょうか・・・。

高階関数もかなり手軽に自然にかけそうでした。Rとは関係ないけどemacsの使いこなしっぷりに嫉妬。良い意味で。

 

大量のデータって、そろっているだけでとても価値のあるのもなのだということを知りました。「集合知プログラミング」とか以前から読んでみたかったのですが、なおさら読みたくなりました。

 

その他

  • 関数名をタイプすることで関数のソースが読めるのはとても良い機能だなぁ
  • [] ← これ「ブラケット」って読むんだ!
  • データが標準で準備されてるのも良いなぁと
    • 特化しているからこそのメリット(?)
  • strはstringではないstrはstructure
    • 文化の違いを感じた
  • Rについての話を聞いているとLisp及びSQLとRが、頭の中でどうしてもリンクしてしまいました

 

発表

竹森さん

・Scliab(サイラボ)
    ・グラフの作成
    ・行列演算
    ・データの加工
・加速度センサーを使った研究
    ・パターンマッチ
    ・データマイニング
    ・加速度センサを一日中付けてもらって行動解析
    ・1秒間に20回記録して解析
・決定木学習
・Weka
    ・データを渡すだけでデータマイニングしてくれる(?)

 

syou6162さん

・R
    ・言語
        ・R
        ・Ruby
        ・C++
    ・世界はRを中心に回ってる
        ・RもC++もRのサポート
・きっかけはRuby
・Rはぐぐりツライ
    ・Rでの検索の方法
        ・Rに聞け
            ・?hoge(関数名)
                ・?plotなど
            ・help("hoge")
            ・example(hoge)
                ・example(example)
            ・関数名をタイプすると関数のソースが表示される
・総称関数
・本
    ・The R Tips
    ・Rの基礎とプログラミング技法
    ・Rプログラミングマニュアル
        ・などなど
・データ構造
    ・ベクトルが中心
        ・Rのベクタはインデックスが1から始まる
        ・[] ← これ「ブラケット」って読むんだ!
        ・Rは行列演算が充実している
    ・データフレーム
    ・リスト
・データ構造を教えてくれる関数
・Rにはデータがついてる!
    ・最初にデータを準備するのが一番面倒だったりするがRだとすぐに遊べる
・回帰分析をRでやってみる
・strはstringではないstrはstructure
・カラム数がパないデータは次元圧縮できたりする
・Rらしいコード
    ・apply family
        ・Lispのapplyみたなもの
        ・Lispっぽい
・ファイルIOやDBとの連携も可

syou6162さんの発表を聞いて考えたこと及び質問

・Rでは使用頻度の高いデータ構造なり処理なりが簡単で短いシンタックスで記述できるようになっているようだ
・ドメイン特化 ⇒ DSL的
・リストの連想配列的な使用方法が明示的というか直感的でよさそう
・DBに対するSQLのような関心領域に特化した言語なのだなーと思いました。
・IOとかは?
・CSVやXMLなどについて→ある程度標準でサポート(?)
・個人的には頭の中でSQLとかなりリンクします
・Rubyのメソッドチェーンみたいなこともできそう
・開発環境は何?→emacs。IDEもある(でも小学生まで)
・Summary関数(総称関数)
    ・型によって挙動が違う
・高階関数的な、Rubyのブロック的な、処理に処理を渡すようなことが簡単にかけている。
        ・OOでいう多態性?
        ・マルチプルディスパッチ?
        ・オーバーロード?
・憶えないといけないことが多そうで少し怯む印象(気のせい?)
・クロージャ的なものも簡潔にサポートしているっぽい
・無名関数も
・emacsってこんな風にウィンドウ切れたりするんだ(3ペインみたいな)
・このシンタックスハイライトはどうやってるの?

 

井上先生(九州大学)

    ・授業のC言語の課題をRedmineで処理(!?)
        ・250人の生徒に毎週4つの課題を出しているため手動ではとても処理できない
    ・情報爆発
    ・ソーシャル図鑑
    ・仮想書架
    ・画像検索
    ・特定健診
        ・ハイリスクマネジメント
        ・ポピュレーションマネジメント
        ・教師データと決定木
            ・教師データ
    ・隠れマルコフ
    ・ベイズ理論
    ・アイリスのデータ
    ・テキストマイニング

・教師データについて
    ・パターンマッチングにおける比較対象ソースデータ(?)

取り急ぎこんな感じ。



Rの基礎とプログラミング技法Rプログラミングマニュアル (新・数理工学ライブラリ 情報工学)Rデータ自由自在



2 件のコメント:

  1. お疲れ様でしたー。懇親会は最後のほうばたばたとしてしまった申しわけなかったです><

    まだ聞けなかったところとかがありましたら、トラバ飛ばしてもらったらエントリ書いてトラバ飛ばし返しますよー

    返信削除
  2. 先日はお疲れ様でしたー。
    トラバ送り忘れたうっかりさんですどもー!
    (しかもそのまま放置)

    メモを見返すと、ほとんど既に懇親会までに教えていただいた内容でした^^;
    思い出したらすぐにでもトラバしますw

    返信削除