18章 modelrを使ったモデルの基本
18.0 ライブラリの読み込み
library("tidyverse")
library("modelr")18.1 はじめに
18.2 シンプルなモデル
練習問題1 線形モデルの1つの欠点は、計算過程に平方項があるので、異常値に敏感なこと。以下のシミュレーションデータに線形モデルを当てはめて、結果を視覚化しなさい。
sim1a <- tibble(
x = rep(1:10, each = 3),
y = x * 1.5 + 6 + rt(length(x), df = 2)
)
sim1a
# A tibble: 30 x 2
x y
<int> <dbl>
1 1 10.8
2 1 8.13
3 1 9.07
4 2 8.41
5 2 8.79
6 2 6.35
7 3 11.0
8 3 10.9
9 3 9.66
10 4 16.1
# … with 20 more rows


練習問題2 線形モデルをよりロバストにする1つの方法は、mean-absolute distanceを使用できます。
練習問題3 数値最適化を実行する上での1つの課題は、局所最小値を見つけることが保証されているだけということ。このように3パラメータモデルを最適化することの問題は何か?
18.3 モデルを可視化する
練習問題1 直線lm()に合わせるのではなく、滑らかな曲線loess()を使用できる。sim1を使用して、モデルの近似、グリッドの生成、予測、および視覚化のプロセスを繰り返し、比較しなさい。
lm()に合わせるのではなく、滑らかな曲線loess()を使用できる。sim1を使用して、モデルの近似、グリッドの生成、予測、および視覚化のプロセスを繰り返し、比較しなさい。


練習問題2 add_predictions()、gather_predictions()、spread_predictions()はどう違うのか?
add_predictions()、gather_predictions()、spread_predictions()はどう違うのか?練習問題3 geom_ref_line()はどのパッケージから使えるのか?残差プロットにリファレンスラインを引くことはなぜ、有効で重要なのか?
geom_ref_line()はどのパッケージから使えるのか?残差プロットにリファレンスラインを引くことはなぜ、有効で重要なのか?
練習問題4 absolute residualsの多角形を見たいのはなぜか。実際の残差を見るのと比較して、何が良くて、何が悪いのか?

18.4 式とモデルファミリー
練習問題1 データsim2を使い、切片を使わないモデルを使用するという分析を繰り返すとどうなるか。モデル方程式、予測はどうなるか?
sim2を使い、切片を使わないモデルを使用するという分析を繰り返すとどうなるか。モデル方程式、予測はどうなるか?練習問題2 フィットするモデルに対して生成された方程式を探索するためにmodel_matrix()を使用する。交互作用を表す表現式は何か。
model_matrix()を使用する。交互作用を表す表現式は何か。練習問題3 基本原理を使用して、次の2つのモデルの式を関数に変換しなさい。
練習問題4 sim4のデータで、mod1、mod2のどれが良いモデルか。説明しなさい。
sim4のデータで、mod1、mod2のどれが良いモデルか。説明しなさい。

18.5 欠損値
18.6 その他のモデルファミリー
最終更新