■google

■最近のコメント
■最近のトラックバック
■最近の記事
■月別アーカイブ
■ブログランキング
■ブログ検索

■ブロとも申請フォーム
■リンク
■RSSフィード
スポンサーサイト
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。


スポンサー広告 | --:--:--
単回帰分析
まずは、
やっぱり単回帰分析から。
使用するデータは
以下のコマンドで得られる車のデータ。

>library(rpart)
>data(car.test.frame)


目的変数に燃費、説明変数に重量として単回
帰分析を例に挙げる。

>result<-lm(Mileage~Weight)
>summary(result)


lmが回帰のコマンドです。
lm(目的変数~説明変数)

もし、重回帰なら、
説明変数のところを
説明変数1+説明変数2+・・・
というように
"+"でつないでください。

summaryは回帰の結果の
要約です。

その結果は、
summary

(クリックすると大きくなります)

用語の日本語訳は、
Residuals:残差
Estimate:係数
Std.error:標準誤差
t value:t値
Pr:有意確率
Multiple R-Squared:決定係数
Ajusted R-Squared:修正済み決定係数

これを解釈して・・・
決定係数 0.72
回帰式
Y=48.3(24.43)-0.0082(-12.89 )X +ε
ただし()内はt値、
εは誤差項(独立性,等分散性,正規性を仮定)

という感じ。

決定係数72%なので説明力のあるモデル
と言えます。

回帰式を描画するには、
>plot(Weight,Mileage)
>abline(result)


回帰


さて、ここまで
誤差項に独立性,等分散性,正規性
という仮定をおいてきました。

回帰式が出来た後に
必ず確認しましょう。

視覚的に確認するには、
残差プロットと
正規QQプロットが良く使われます。

残差プロット
plot(resid(result))
残差プロット
(クリックで大きくなります)

これは均一になっているかを見ます。
どうでしょうか。
少し2次関数に見えるかもしれませんが、
均一と言えそうです。

正規Q-Qプロット
qqnorm(resid(result))
qqline(resid(result))

QQ

(クリックで大きくなります)
直線に近いほど、
正規分布に従っています。
今回はそう言えそうですね。


残差プロットと
QQプロットで
回帰診断を行いましたが、
このとき、残差の仮定に
沿わないときは、
層別の必要や
何か異常値を含んでいます。
そういうときは、
元データに戻って
じっくり見てみましょう。

例えば、車のデータでは
プレミアムの付いた高級車が
あるかもしれません。

Rではユーザに優しく、
そういったデータは
プロットしたときに
データの番号が表示されています。
(今回のQQプロットのように)


スポンサーサイト


回帰分析 | 22:46:22 | Trackback(0) | Comments(0)
コメントの投稿

管理者にだけ表示を許可する

FC2Ad

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。