2010「データ解析環境Rの整備と利用」

2010「データ解析環境Rの整備と利用」 のプログラム「国内ユーザによる報告(Rユーザー会)」に参加。

プログラム:
11月27日(土) 9:50 – 17:30

09:50-10:00 開会挨拶および諸連絡
10:00-10:30 鈴木 了太(株式会社ef-prime)Rによるデータ解析ツールの新提案
10:30-11:00 長島 健悟(城西大学)Rパッケージの開発・登録とメンテナンス
11:00-11:30 青木 繁伸(群馬大学)統計学・データ解析におけるRの活用
11:30-11:40  岡田 昌史(筑波大学)『Rパッケージ本』プロジェクトのご紹介

11:40-13:00   昼食

13:00-13:30 村井 潤一郎(文京学院大学)心理統計教育におけるRの利用
13:30-14:00 里 洋平(Tokyo.R)地域コミュニティ「x.R」の活動とJapan.R
14:00-14:30 牧山 文彦(データキューブ株式会社)今更ながらのrcom/DCOM解説
14:30-15:00 合崎 英男(農村工学研究所)RExcelによるデータ解析
15:00-15:30 休憩
15:30-16:00 奥村 晴彦(三重大学)TeX+Rによる美文書・美グラフ作成
16:00-16:30 山本 義郎(東海大学)Rによるデータの視覚化について
16:30:-17:00 谷村 晋(兵庫医科大学)Rを用いたデータ分析における再現性の保証
17:00-17:30 討論


09:50-10:00 開会挨拶および諸連絡

去年は昨年よりたくさんの人に集まってくださり、、、みたいな話。

10:00-10:30 鈴木 了太(株式会社ef-prime)Rによるデータ解析ツールの新提案

以下の2製品(クライアントアプリ)の紹介
R AnalyticFlow(分析過程をフローチャートで可視化)
Natto

R とクライアントアプリとのブリッジには JRI を利用している。

10:30-11:00 長島 健悟(城西大学)Rパッケージの開発・登録とメンテナンス
Windows環境でのパッケージングの話。
最後のほうは、メッセージの多言語化の話もある。

QA:ヘルプの多言語化はできるのか?
“.Rd” ファイルを表示しているだけなので、このファイルを変えれば(例:日本語に)日本語で表示される。

11:00-11:30 青木 繁伸(群馬大学)統計学・データ解析におけるRの活用
群馬大学の青木先生
教材向けグラフの作成

模造紙、OHP、パワポと授業向けグラフ資料は変遷をたどってきた。
R でパラパラ漫画を作成する方法。
大量の画像PDFファイルを用意し、めくることでインタラクティブに見える。

animation : Demonstrate Animations in Statistics” パッケージを利用していたような、、、

リファレンスとして非常に役のたつ Rによる統計解析 の著者でもある。
本からの印象よりも一回り以上ご年配の方だった。(1950年生まれ)

11:30-11:40  岡田 昌史(筑波大学)『Rパッケージ本』プロジェクトのご紹介

入門本と実務のギャップを埋めるべく、その筋の専門家の方に、日常利用しているパッケージを紹介してもらう。
(Cookbook 的な本?)
来年前半にリリース予定。
50パッケージ x 8ページ/パッケージ の予定。

11:40-13:00   昼食

13:00-13:30 村井 潤一郎(文京学院大学)心理統計教育におけるRの利用

「Rによるやさしい統計学」の著者の一人。(僕が最初によんだ R の本)

大学では SAS と SPSS の利用が多い。
文京学院大学では SAS を利用している。
SAS は SPSS よりも CUI よりのシステム。
文京学院大学の心理統計教育では、学部低学年のころから、古典的なUNIX環境の実習が多い(ワークステーション、コマンドライン操作、VI、手書きHTMLなど)
学部の教育を SAS から R へ切り替えるのは、学部内、学生、との調整も必要なため、ある程度自由の利く 大学院教育で R を導入してみた Learned Lessonsの紹介。

R は逐一命令しないといけないので、裏であれこれやってくれるソフト(Excelなど)に比べて、融通がきき、プロセスが見えやすいのが利点。

Q&A

企業の求人は R ではなく SAS(SPSS)で募集が来る。
企業側が R で募集をかけるべきなのか、学生側が R が使えることをアピールすべきなのか、というような意見があった。

13:30-14:00 里 洋平(Tokyo.R)地域コミュニティ「x.R」の活動とJapan.R

学界とは別のプログラミング系地域コミュニティの紹介。

Google などの台頭のおかげで、「統計」が重要視されるようになり、統計を専門としてきた人間としては非常にうれしい風潮というようなコメントがあった。
また、R ユーザーの裾野を増やす意味で、サテライトで 講習会を増やすなどはいいのでは、という意見もあった。

14:00-14:30 牧山 文彦(データキューブ株式会社)今更ながらのrcom/DCOM解説

Windows の COM を利用する rcom/DCOM の解説。
オーストリアの Statconn という企業が開発している。(RExcel も同じ会社)

Windows に強く依存したパッケージだが、発表者は根っからのマカー

“ExcelでR自由自在” は日本で非常に売れており、著者たちは喜んでいる。
ExcelでR自由自在

14:30-15:00 合崎 英男(農村工学研究所)RExcelによるデータ解析

主催者の一人である中谷先生の後輩
今日の発表のなかで、一番カタイ発表だった。
4年前から RExcel を使っている。
VBA の経験があればすぐに使える。

統計数理研究所が刊行しているエストレーラという雑誌で RExcel に関する連載を数か月前から担当している。

15:00-15:30 休憩

15:30-16:00 奥村 晴彦(三重大学)TeX+Rによる美文書・美グラフ作成

TeX で有名な奥村先生
R で作成したグラフを TeX にうまく溶け込ませる方法。

三重大学の学生は優秀なので、コマンドライン操作に苦労することはないが、英語は苦手。

PDF にはフォントを埋め込むこと。
RGB(原色)は避けること
モノクロ -> gray
カラー -> CMYK を利用
pgfsweave を利用するのが最近のはやり

Sweave 関連のリンク

次の本では、飾り気はないが、主張のあるグラフの作成する方法について、解説されている。

“The Visual Display of Quantitative Information” by Edward R. Tufte がよい。

16:00-16:30 山本 義郎(東海大学)Rによるデータの視覚化について

視覚化ライブラリーの紹介

インタラクティブにグラフが動く iplots が印象に残った。

16:30:-17:00 谷村 晋(兵庫医科大学)Rを用いたデータ分析における再現性の保証

cacher(author : Roger D. Peng) による分散処理システムを利用したテスト再現性の実現。

  • プログラム
  • データセット

を共有して、別環境でも実行できるようにす、データ処理の偽造・ねつ造を防ぐ?
中央サーバに登録する際、ハッシュ値をチェックしている。
ハッシュ値が異なる = データが異なる、とみなす。

制限事項
初回登録時のデータが恣意的に操作されていた場合、システムは検知できない。
テストのなかで乱数の生成を行うと、再現性を担保できない。決まったシードを与えるなどする必要がある。
テスト結果が同じかどうかの判定は、オブジェクトどうしの比較で対処。print 結果、グラフなどは対象外。

補足

Roger D. Peng は次の本の著者でもある。 “Statistical Methods for Environmental Epidemiology with R”

SRPM : Shared Reproducibility Package Management という別の reproducibility 関連のパッケージも公開している。

Reproducibility” は今回の研究集会のなかで何回か登場していた。

Tagged with: ,
Posted in R, report

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

Archives
%d bloggers like this: