■広告

ページランク

■最近のコメント
■最近のトラックバック

■最近の記事
■月別アーカイブ
■ブログランキング
■ブログ検索

■ブロとも申請フォーム
■リンク
■RSSフィード
Ads by Google
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。


スポンサー広告 | --:--:--
目次
社会人になりほとんど更新できなくなりました.
自分の備忘録として記録しています。
(質問、訂正依頼、歓迎いたします)

更新(08/3/6)
「Rでテキストマイニング」追加しました

サイト内検索はこちら
Google
 
目次
 0.Rの性質 (文字化け対処あり) 
 1.参考文献
 2.データの入れ方
 3.データの要約
  4.データの視覚化
 5.回帰分析
 6. 変数選択
 7.プログラム
 8.シミュレーション
 9.因子分析
10.ネットワーク分析
11.カーネルSVM
12.使える関数
13.Rでテキストマイニング
14.その他


目次 | 17:58:12 | Trackback(0) | Comments(2)
R関係の本(08/04/30更新)
引越+入社で更新が滞っていました.

R関係の本が2冊出ていたので追加いたします.
2008年の下の二冊です.
他にも邦書であったら,教えてくださると助かります.

年号順に並べました。
(洋)は洋書です。

《2002年》
(洋)An Introduction to R


《2003年》
Rによる統計解析の基礎 (Computer in Education and Research)
(洋)R Reference Manual - Base Package


《2004年》
工学のためのデータサイエンス入門―フリーな統計環境Rを用いたデータ解析 (工学のための数学)
The R Book―データ解析環境Rの活用事例集
(洋)Using R for Introductory Statistics
(洋)Statistical Analysis And Data Display: An Intermediate Course With Examples In S-Plus, R, And SAS (Springer Texts in Statistics)
(洋)Linear Models With R (Texts in Statistical Science)


《2005年》
データ解析環境「R」―定番フリーソフトの基本操作からグラフィックス、統計解析まで (I・O BOOKS)
はじめてのS‐PLUS/R言語プログラミング―例題で学ぶS‐PLUS/R言語の基本
フレッシュマンから大学院生までのデータ解析・R言語
The R Tips―データ解析環境Rの基本技・グラフィックス活用集
(洋)R Graphics (Computer Science and Data Analysis)
(洋)Extending the Linear Model With R: Generalized Linear, Mixed Effects and Nonparametric Regression Models (Texts in Statistical Science)


《2006年》
R/S‐PLUSによる統計解析入門
Rによる統計入門
Rの基礎とプログラミング技法


《2007年》
Rプログラミングマニュアル (新・数理工学ライブラリ (情報工学=1))
Rで学ぶクラスタ解析
統計解析環境Rによるバイオインフォマティクスデータ解析−Bioconductorを用いたゲノムスケールのデータマイニング−〔CD-ROM付〕
Rによるデータサイエンス - データ解析の基礎から最新手法まで
Rで学ぶデータマイニング (1)
Rで学ぶデータマイニング 2 (2)
RとRコマンダーではじめる多変量解析
R Commanderハンドブック―A Basic-Statistics GUI for R
Rによる医療統計学
RとS-PLUSによる多変量解析
Rによる保健医療データ解析演習 (Computer in Education and Research)
RとBioconductorを用いたバイオインフォマティクス
(洋)Bayesian Computation with R (Use R)
(洋)An R And S-plus Companion To Multivariate Analysis (Springer Texts in Statistics)
(洋)The R Book
(洋)Statistical Computing With R (Computer Science and Data Analysis)


《2008年》
Rによるやさしい統計学
Rで学ぶ経営工学の手法
(洋)A First Course in Statistical Programming With R
(洋) Multivariate Data Visualization with R
Rプログラミング&グラフィックス
統計学:Rを用いた入門書





参考文献 | 21:32:51 | Trackback(1) | Comments(0)
Rでテキストマイニング データ化〜共起性(コサイン距離)の算出まで
Rテキストマイニングのようなことをやるのであれば,
言葉を集めてきた後に,
その言葉をどうデータ化するかというのは結構大変です.

そこで,今回はarulesというライブラリを使って,
言葉を0-1のデータに変換する作業を紹介します.

arulesというのは,
相関ルールでパッケージですが,その応用です.
(相関ルール:買い物カゴに,どういった商品の組み合わせが多いか)


例えば、
どこかの掲示板に以下のように書き込みがあったとします.

Aさん:今日,統計の授業でRを習ったよ.
Bさん:SやRは便利で使いやすい統計パッケージだよね.
Cさん:Rほどグラフィックに優れているものはないよ.
Dさん:S?R?って何?

まずは,茶筌か何かで品詞分解して,
動詞,名詞,形容詞だけ残します.

("今日","統計","授業","R","習う")
("S","R","便利","使いやすい","統計","パッケージ")
("R","グラフィック","優れる")
("S","R","何")


この例では、

【入力】
library(arules)
test<-list(
c("今日","統計","授業","R","習う"),
c("S","R","便利","使いやすい","統計","パッケージ"),
c("R","グラフィック","優れる"),
c("S","何","R"))
test.transaction<-as(test,"transactions")
test.matrix<-as(test.transaction,"matrix")
test.matrix

【出力】
test_matrix

(クリックすると大きくなります)

さらに,先日作成したコサイン距離の関数を使うと,
cosine.function(test.matrix)<br>
結果:
コサイン距離算出結果

(クリックすると大きくなります)
コサイン距離は1に近いほど共起性(類似度)が高いので,
例えばコサイン距離が0.71となっている,
SとR,Rと統計は関連が強いのかなといえます.



テキストマイニング | 10:49:12 | Trackback(0) | Comments(0)
面白いサイト
たまには、Rとか関係ないものを紹介。

きっとRが好きな人は、
こういうWeb上で色々とできるのが好きだと思うので。

こんな感じの面白サイトを集めています。
他に面白いのがあったら教えて下さい。

瀧定名古屋
つい最近まで、知らなかった企業ですが、
こうやって面白いサイト作ってると、ブランドイメージも上がります。
リンクに進んで、下に出てくる好きな色のボタン押しましょう。


SEEDS OF BEUTY
資生堂のサイト。
エコトノハ的な感じ。

カリフォルニア酪農組合
リンク先の下に表示されたLAUNCH FULLSCREEN
をクリックして下さい。

NOKIA
まず、言語選択があるので
Englishを選んで,FULL INTROへ進む。


エコトノハ
たぶん、この中でこれが一番有名。
そして、面白サイト収集のきっかけになったサイトでもある。




その他 | 16:26:22 | Trackback(0) | Comments(0)
Rの解説書・参考文献 まとめ

このブログにおいて、参考文献の拡充をずっと放置していたので、
ここで、一挙に参考文献のまとめをします。
日本語の本は、網羅できているかと思いますが、
洋書はまだまだありますが、ここでは気になったものだけ
日本語の本でまだこれあるよ、とか
洋書でこれがいいよという情報お待ちしています。

なんというか、2007年はかなりの豊作ですね
そしてその勢いは2008年も続いていそうです。
洋書に関しては、元々S言語の本がたくさんあるので、それで対処できるかもしれません。

これから、卒論を書こうという人は幸せですね。

この中で、気になるのは、Rコマンダー関係と
2008年の「Rで学ぶ経営工学の手法」です
この本はたまたま大学の本屋で見つけたのですが、
数理計画とか品質管理関係が書いてあって驚きました。

洋書でいえば、ベイズ関係のとか、
R Reference Manualは非常に気になるところです。


年号順に並べました。
(洋)は洋書です。

《2002年》
(洋)An Introduction to R


《2003年》
Rによる統計解析の基礎 (Computer in Education and Research)
(洋)R Reference Manual - Base Package


《2004年》
工学のためのデータサイエンス入門―フリーな統計環境Rを用いたデータ解析 (工学のための数学)
The R Book―データ解析環境Rの活用事例集
(洋)Using R for Introductory Statistics
(洋)Statistical Analysis And Data Display: An Intermediate Course With Examples In S-Plus, R, And SAS (Springer Texts in Statistics)
(洋)Linear Models With R (Texts in Statistical Science)


《2005年》
データ解析環境「R」―定番フリーソフトの基本操作からグラフィックス、統計解析まで (I・O BOOKS)
はじめてのS‐PLUS/R言語プログラミング―例題で学ぶS‐PLUS/R言語の基本
フレッシュマンから大学院生までのデータ解析・R言語
The R Tips―データ解析環境Rの基本技・グラフィックス活用集
(洋)R Graphics (Computer Science and Data Analysis)
(洋)Extending the Linear Model With R: Generalized Linear, Mixed Effects and Nonparametric Regression Models (Texts in Statistical Science)


《2006年》
R/S‐PLUSによる統計解析入門
Rによる統計入門
Rの基礎とプログラミング技法


《2007年》
Rプログラミングマニュアル (新・数理工学ライブラリ (情報工学=1))
Rで学ぶクラスタ解析
統計解析環境Rによるバイオインフォマティクスデータ解析−Bioconductorを用いたゲノムスケールのデータマイニング−〔CD-ROM付〕
Rによるデータサイエンス - データ解析の基礎から最新手法まで
Rで学ぶデータマイニング (1)
Rで学ぶデータマイニング 2 (2)
RとRコマンダーではじめる多変量解析
R Commanderハンドブック―A Basic-Statistics GUI for R
Rによる医療統計学
RとS-PLUSによる多変量解析
Rによる保健医療データ解析演習 (Computer in Education and Research)
RとBioconductorを用いたバイオインフォマティクス
(洋)Bayesian Computation with R (Use R)
(洋)An R And S-plus Companion To Multivariate Analysis (Springer Texts in Statistics)
(洋)The R Book
(洋)Statistical Computing With R (Computer Science and Data Analysis)


《2008年》
Rによるやさしい統計学
Rで学ぶ経営工学の手法
(洋)A First Course in Statistical Programming With R
(洋) Multivariate Data Visualization with R



参考文献 | 22:35:30 | Trackback(2) | Comments(2)
次のページ

FC2Ad

FC2ブログ