20章 purrrとbroomによる多数のモデル
20.0 ライブラリの読み込み
library("modelr")
library("tidyverse")
library("gapminder")20.1 はじめに
20.2 gapminder
練習問題1 線形傾向は、全体的な傾向に対してやや単純すぎる。2次多項式はもっとうまくフィットさせれるか。2次方程式の係数はどのように解釈できるか。
gapminder %>% head()
# A tibble: 6 x 6
country continent year lifeExp pop gdpPercap
<fct> <fct> <int> <dbl> <int> <dbl>
1 Afghanistan Asia 1952 28.8 8425333 779.
2 Afghanistan Asia 1957 30.3 9240934 821.
3 Afghanistan Asia 1962 32.0 10267083 853.
4 Afghanistan Asia 1967 34.0 11537966 836.
5 Afghanistan Asia 1972 36.1 13079460 740.
6 Afghanistan Asia 1977 38.4 14880372 786.
練習問題2 大陸ごとのR2の分布を視覚化する方法を調べなさい。{ggbeeswarm}パッケージを試していなさい。


練習問題3 最後のプロットを作成するには、2つのステップが必要だった。国ごとに1行のデータフレームを作成し、それを元のデータセットにセミジョインした。代わりにunnest()を使用すれば、この結合を回避できる。
unnest()を使用すれば、この結合を回避できる。
20.3 リスト列
20.4 リスト列の作成
練習問題1 インプットにアトミックベクトルを取り、そしてリストを返す思いつく限りの関数を書きなさい。
練習問題2 複数の値を返すquantile()のような便利な集計関数をブレインストーミングしなさい。
quantile()のような便利な集計関数をブレインストーミングしなさい。練習問題3 次のデータフレームには何が欠けているか?その欠けているピースをquantile()はどうやって返すのか?
quantile()はどうやって返すのか?練習問題4 このコードは何をするのか?なぜそれが役に立つのか。
20.5 リスト列の単純化
練習問題1 リスト列からアトミックベクトル列を作成するのにlengths()が便利なのはなぜか?
lengths()が便利なのはなぜか?練習問題2 データフレームの最も一般的なベクトルの型をあげなさい。リストとの違いは何か?
20.6 broomで整理データを作る
最終更新