9章 tidyrによるデータの整理
9.0 ライブラリーの読み込み
library("tidyverse")9.1 はじめに
9.2 整理データ
練習問題1 例に上げた表について、変数と観測値がどのように組織されているか答えなさい。
table1
# A tibble: 6 x 4
country year cases population
<chr> <int> <int> <int>
1 Afghanistan 1999 745 19987071
2 Afghanistan 2000 2666 20595360
3 Brazil 1999 37737 172006362
4 Brazil 2000 80488 174504898
5 China 1999 212258 1272915272
6 China 2000 213766 1280428583練習問題2 table2とtable4a+table4bについてrateを計算しなさい。下記、4つの操作を実行する必要がある。どの表現が最も簡単で、どれが一番難しいか?
table2とtable4a+table4bについてrateを計算しなさい。下記、4つの操作を実行する必要がある。どの表現が最も簡単で、どれが一番難しいか?練習問題3 table1の代わりにtable2を使用して、casesの時系列プロットを再作成しなさい。
table1の代わりにtable2を使用して、casesの時系列プロットを再作成しなさい。
9.3 広げたり集めたり
練習問題1 gather()とspread()はなぜ対象ではないのか。
gather()とspread()はなぜ対象ではないのか。練習問題2 このコードが失敗するのはなぜですか?
練習問題3 なぜこのtibbleを広げると失敗するのでしょうか。
tibbleを広げると失敗するのでしょうか。練習問題4 このtibbleを整理しなさい。
tibbleを整理しなさい。9.4 分割と接合
練習問題1 separate()のextraとfillは何をするのでしょうか。
separate()のextraとfillは何をするのでしょうか。練習問題2 unite()とseparate()には、引数removeがあります。それは何をするためのものか?
unite()とseparate()には、引数removeがあります。それは何をするためのものか?練習問題3 separate()とextract()を比較しなさい。
separate()とextract()を比較しなさい。9.5 欠損値
練習問題1 fill引数をspread()やcomplete()で比較しなさい。
fill引数をspread()やcomplete()で比較しなさい。練習問題2 fill()の.dirctionは何をするのか。
fill()の.dirctionは何をするのか。9.6 ケーススタディ
練習問題1 このケーススタディでは欠損値をna.rm = TRUEで削除したが、これは妥当か。
na.rm = TRUEで削除したが、これは妥当か。練習問題2 mutate(key = str_replace(key, "newrel", "new_rel")を無視するとどうなるのか。
mutate(key = str_replace(key, "newrel", "new_rel")を無視するとどうなるのか。練習問題3 iso2、iso3がcountryと重複していたが、これを確認しなさい。
iso2、iso3がcountryと重複していたが、これを確認しなさい。練習問題4 各国、年、性別について結核の総症例数を計算し、可視化しなさい。


9.7 非整理データ
最終更新