「ClubDB2 第146回 : 達人が語る こんなデータベース設計はヤダ!」に参加

Club DB2 のナイト・サークル「第146回 達人が語る こんなデータベース設計はヤダ!」に参加してきた(LT が終わったタイミングでギリギリ到着)。Club DB2におじゃまするのは昨年9月の Watson 以来。 発表者 ミック http://www.geocities.jp/mickindex/ SQL のリレーショナルモデルを学ぶなら上でミックさんの「達人に学ぶ SQL徹底指南書」(↓)が難易度・価格的に一番お手頃ではないかと思う。 アジェンダ リレーショナルデータベースの設計技法については、理論化されているようでいて、あまり現場ではきちんとした指針が存在しません。 そのため、多くのバッドノウハウやグレーノウハウが繰り返し生み出されています。本日は、そのようなアンチパターンを一堂に集めてみたいと思います。 ダメな物理設計 テーブルはファイルじゃねえんだよ サイジングでCPUしか見ない奴一歩前へ出ろ いまだにメモリをケチるなんてどんだけ時代遅れですか 32bit OSはオワコン ダメな論理設計 垂直分割と水平分割は本当に悪いのか なぜ結合するSQLは怖いのか 正規化を崩す判断はいつするべきなのか ループという名の呪い 発表資料 http://d.hatena.ne.jp/mickmack/20120714/ 雑感 Mick さんはエンタープライズ方面に振れたDBアーキテクトで、アプリケーション系開発が主体の自分とは守備範囲が大きく異なる。 初めてお目に掛かるが、かなりお若い。 自分が普段意識することのない、物理設計方面の話を聞けたのはよかった。 ネットワーク(帯域とか)の話題がほとんど出なかったのは意外。 以下は雑多な備忘録。 ============================= データベース設計 以下の3つで構成される  物理設計(サーバ、ストレージ、アーキテクチャ、サイジング)  論理設計(ER図、モデリング、処理方式)  実装設計 今回は#1のストレージ・サイジングと#2の処理方式がテーマ。 手続き型の呪い 手続き型プログラミングの延長でSQLにとどまっている人が多く、脱皮しないと、いつまでもリレーショナルモデル本来の集合指向をいかした SQL を書けない。 DBサーバとサイジング サーバサイジングは CPU メモリ ネットワーク ストレージContinue reading “「ClubDB2 第146回 : 達人が語る こんなデータベース設計はヤダ!」に参加”

「ClubDB2 Watson:クイズ番組に挑戦した質問応答システム」に参加

過去に何度か参加したClub DB2 勉強会で IBM が開発した質疑応答システム”Watson” の開発話を聞けるということで、定時退職(少しフライング)して19時前になんとか渋谷のIBMイノベーション・センターへ。 好奇心旺盛な参加者が30人程度?集まり、質問が活発に飛び交い、なかなか面白かった。(発表者との距離感が非常によかった) 機械学習・統計・分散処理・NLPのテッキーな解説も聞きたかった気もするが、それはまたどこかで。 次の3つの動画を見れば、参加した気分になれるはず。特にプロジェクトの中心人物による1つ目の解説がおすすめ。 案内の概要 https://www.ibm.com/developerworks/wikis/display/clubdb2/131 2011年2月、米国のクイズ番組において、IBMのコンピューターと人間のチャンピオンとの対戦が実現し、コンピューターが勝利をおさめました。これは、IBMリサーチ(基礎研究部門)の「グランド・チャレンジ」と呼ばれる、成功の保証が無いような技術的に難しい課題への取り組みの一環です。 この講演では対戦の模様の一部をご覧いただき、IBMリサーチが解決した技術的な課題、システムで採用された自然言語処理技術と情報源、そしてグランド・チャレンジの意義と、その成功の秘訣について解説します。 IBM基礎研究所について IBM は技術的に成功するかどうか分からない挑戦(グランド・チャレンジ)に過去に取り組んでおり、Kasparov を負かしたチェスコンピュータのの Deep Blue もこの一つ。 Watson はクイズ番組”Jeopardy!” で人間に勝利すべく開発された質問応答システム プロジェクトは2006年から開始され、5年後の2011年2月に Jeopardy! 最強の人間チャンピオン Ken Jennings と Brad Rutter に勝利を収めた。 世界に9つあるIBM基礎研究所のうちWatson(US)、Haifa(イスラエル)、China、Tokyo(日本)の4つの研究所が Watson の開発に参加。 スピーカーの金山氏は東京からは参加した2名のうちの1名、実質的に手足を動かしている唯一のメンバーであり、自然言語処理が専門。 Watson はIBMの創業者から名前を持ってきているのでかなり気合のはいったプロジェクト。 プロジェクトの参加メンバーは立候補制ではなく、研究員の得意分野によって選抜された。 USの研究所では、20数人の研究者が専属で従事 Jeopardy! について Jeopardy!(ジョパディ!)はアメリカで中断をはさみつつも50年近く続く人気クイズ番組で夕方に放送されている。(アメリカは退社時間が早い) 質問”What is shoe?”の答えが”4-letter word for the iron fitting on the hoof ofContinue reading “「ClubDB2 Watson:クイズ番組に挑戦した質問応答システム」に参加”

第1回 MongoDB JP & CouchDB JP 合同勉強会 in Tokyo 参加

12月12日(日)に開催された「第1回 MongoDB JP & CouchDB JP 合同勉強会 in Tokyo」に参加。 atnd http://atnd.org/events/10377 他の報告 http://d.hatena.ne.jp/doryokujin/20101213/1292201919 http://gihyo.jp/news/report/2010/12/2101 スケジュール 時間 発表者 タイトル 14:00  14:15 @doryokujin MongoDB JPからのメッセージ 14:15  15:00 @doryokujin MongoDBを用いたソーシャルアプリのログ解析 15:10  15:50 @snamura Ameba Pico におけるMongoDB運用事例 15:55  16:10 @yssk22 CouchDB JPからのメッセージ 16:10  16:50 @yssk22 BigCouch の話 17:00  17:20 @basuke [LT]:ECサイトでのMongoDB導入事例 17:25 Continue reading “第1回 MongoDB JP & CouchDB JP 合同勉強会 in Tokyo 参加”

2010「データ解析環境Rの整備と利用」

2010「データ解析環境Rの整備と利用」 のプログラム「国内ユーザによる報告(Rユーザー会)」に参加。 プログラム: 11月27日(土) 9:50 – 17:30 09:50-10:00 開会挨拶および諸連絡 10:00-10:30 鈴木 了太(株式会社ef-prime)Rによるデータ解析ツールの新提案 10:30-11:00 長島 健悟(城西大学)Rパッケージの開発・登録とメンテナンス 11:00-11:30 青木 繁伸(群馬大学)統計学・データ解析におけるRの活用 11:30-11:40  岡田 昌史(筑波大学)『Rパッケージ本』プロジェクトのご紹介 11:40-13:00   昼食 13:00-13:30 村井 潤一郎(文京学院大学)心理統計教育におけるRの利用 13:30-14:00 里 洋平(Tokyo.R)地域コミュニティ「x.R」の活動とJapan.R 14:00-14:30 牧山 文彦(データキューブ株式会社)今更ながらのrcom/DCOM解説 14:30-15:00 合崎 英男(農村工学研究所)RExcelによるデータ解析 15:00-15:30 休憩 15:30-16:00 奥村 晴彦(三重大学)TeX+Rによる美文書・美グラフ作成 16:00-16:30 山本 義郎(東海大学)Rによるデータの視覚化について 16:30:-17:00 谷村 晋(兵庫医科大学)Rを用いたデータ分析における再現性の保証 17:00-17:30 討論 09:50-10:00 開会挨拶および諸連絡 去年は昨年よりたくさんの人に集まってくださり、、、みたいな話。 10:00-10:30 鈴木 了太(株式会社ef-prime)Rによるデータ解析ツールの新提案 以下の2製品(クライアントアプリ)の紹介 R AnalyticFlow(分析過程をフローチャートで可視化) Natto R とクライアントアプリとのブリッジには JRI を利用している。 10:30-11:00 長島 健悟(城西大学)Rパッケージの開発・登録とメンテナンス Windows環境でのパッケージングの話。 最後のほうは、メッセージの多言語化の話もある。 作者自身のスライド 作者自身のブログ QA:ヘルプの多言語化はできるのか?Continue reading “2010「データ解析環境Rの整備と利用」”

Prospects and Challenges for CRAN at ISM

14:10-15:10 Prospects and Challenges for CRAN  — with a glance on 64-bit Windows binaries by Uwe Ligges Prof. Uwe Ligges (Technische Universitat Dortmund, Germany) R のパッケージ登録・管理にまつわる話。 R パッケージのレポジトリ * cran * bioconductor * Omega Hat * R-Forge パッケージが更新されるたびに、依存パッケージに影響がでていないか、テストする必要がある。 依存関係は次の2種類がある。 * 他のパッケージを依存している * 他のパッケージから依存されている 中でも、次の2つのパッケージは多くのパッケージから依存されている。 MASS survival 依存テストでエラーがあると、メール通知される。 CRAN Package Check Results (WEBのテスト結果画面) 2008 年までは、多くの依存関係があるパッケージも、こけることはなかった。原因不明 近年は、エラーになるパッケージが多い。Continue reading “Prospects and Challenges for CRAN at ISM”

Tutorial of ggplot2 by Hadley Wickham at ISM

大学共同利用機関法人 情報・システム研究機構 統計数理研究所(The Institute of Statistical Mathematics)で開催された R のグラフィックパッケージggplot2 の作者本人によるチュートリアルに参加。 Speaker Prof. Hadley Wickham (Rice University, USA) Prof. Uwe Ligges (Technische Universitat Dortmund, Germany) Program 25 November (Thu) 10:30 – 17:00 10:30-12:00 Tutorial of ggplot2 (1) by Hadley Wickham 12:00-13:00 Lunch 13:00-14:00 Tutorial of ggplot2 (2) by Hadley Wickham 14:10-15:10 Prospects and Challenges for CRAN –Continue reading “Tutorial of ggplot2 by Hadley Wickham at ISM”