這份作業利用 2018 年台北市市長選舉的得票資料,以及內政部的台北市村里人口統計,希望能夠讓你熟悉操作空間資料的流程。
其中,台北市村里人口統計裡面的 h_cnt
代表「戶數」,
p_cnt
代表「人數」, m_cnt
代表「男性人數」,
f_cnt
代表「女性人數」。
### 這邊不要動
library(tidyverse)
library(sf)
<- read_csv("data/AS06/df_mayor_tpe.csv")
df_mayor_tpe <-
sf_tpe st_read(dsn = "data/AS06/109年12月行政區人口統計_村里_臺北市_SHP/", layer = "109年12月行政區人口統計_村里", quiet = T) %>%
mutate(across(where(is.character), ~iconv(., from = "BIG5", to = "UTF8"))) %>%
rename_with(~str_to_lower(.), everything()) %>%
mutate(across(where(is.double), ~if_else(is.na(.),as.double(0),.))) %>%
st_set_crs(3826) %>% st_transform(4326) %>% filter(str_detect(county, "臺北市")) %>%
mutate(village = if_else(str_detect(village,"糖"),"糖廍里",village)) %>%
select(-matches("_id"), -info_time)
### 給你看資料長這樣
%>% head(5)
df_mayor_tpe %>% head(5) sf_tpe
#> # A tibble: 5 × 6
#> county town 姓名 號次 得票數 得票率
#> <chr> <chr> <chr> <dbl> <dbl> <dbl>
#> 1 臺北市 松山區 柯文哲 4 42315 0.396
#> 2 臺北市 信義區 柯文哲 4 47620 0.389
#> 3 臺北市 大安區 柯文哲 4 60940 0.385
#> 4 臺北市 中山區 柯文哲 4 50582 0.415
#> 5 臺北市 中正區 柯文哲 4 33748 0.416
#> Simple feature collection with 5 features and 7 fields
#> Geometry type: MULTIPOLYGON
#> Dimension: XY
#> Bounding box: xmin: 121.553 ymin: 24.96396 xmax: 121.5797 ymax: 24.98448
#> Geodetic CRS: WGS 84
#> county town village h_cnt p_cnt m_cnt f_cnt geometry
#> 1 臺北市 文山區 樟新里 2199 5697 2682 3015 MULTIPOLYGON (((121.5595 24...
#> 2 臺北市 文山區 老泉里 362 923 485 438 MULTIPOLYGON (((121.5715 24...
#> 3 臺北市 文山區 樟腳里 2108 5674 2735 2939 MULTIPOLYGON (((121.5691 24...
#> 4 臺北市 文山區 樟文里 2374 6311 3048 3263 MULTIPOLYGON (((121.5599 24...
#> 5 臺北市 文山區 樟樹里 1825 4898 2324 2574 MULTIPOLYGON (((121.5625 24...
請利用 sf_tpe
,計算代表每個村里女性佔比的欄位
f_per
,以及代表台北市人數排行的
p_ranking
(人最多的村里排名 = 1),接著按照
f_per
,由大到小排列,最後將這個 sf
型態的資料轉成 tibble
,選擇 county
,
town
, village
, f_per
,
p_ranking
, p_cnt
共 6 個欄位, 並印出前 5
列
### your code
%>% mutate(f_per = f_cnt/p_cnt) %>%
sf_tpe arrange(desc(p_cnt)) %>% mutate(p_ranking = row_number()) %>%
arrange(desc(f_per)) %>%
slice(1:5) %>% as_tibble() %>% select(1:3, f_per, p_ranking, p_cnt)
### result
#> # A tibble: 5 × 6
#> county town village f_per p_ranking p_cnt
#> <chr> <chr> <chr> <dbl> <int> <dbl>
#> 1 臺北市 中山區 康樂里 0.582 437 2610
#> 2 臺北市 中山區 中山里 0.574 132 6752
#> 3 臺北市 中山區 晴光里 0.570 230 5506
#> 4 臺北市 松山區 富泰里 0.569 313 4652
#> 5 臺北市 中山區 正義里 0.568 254 5251
請將 df_mayor_tpe
轉成寬表格後印出,推上成為寬表格的欄位包含 3
位候選人,數值則是得票率,並將結果儲存到 df_mayor_tpe
中,印出前 5 列
### your code
<- df_mayor_tpe %>% select(-`號次`, -`得票數`) %>%
df_mayor_tpe_wider pivot_wider(names_from = `姓名`, values_from = `得票率`)
%>% head(5)
df_mayor_tpe_wider ### result
#> # A tibble: 5 × 5
#> county town 柯文哲 丁守中 姚文智
#> <chr> <chr> <dbl> <dbl> <dbl>
#> 1 臺北市 松山區 0.396 0.434 0.162
#> 2 臺北市 信義區 0.389 0.44 0.162
#> 3 臺北市 大安區 0.385 0.457 0.150
#> 4 臺北市 中山區 0.415 0.384 0.193
#> 5 臺北市 中正區 0.416 0.418 0.156
請利用 sf_tpe
,以縣市和鄉鎮市區為單位,計算彙總後的戶數、人數、男性人數、女性人數,將資料儲存在
sf_tpe_agg
,並且印出前 5 列。
### your code
<- sf_tpe %>% group_by(county, town) %>% summarise(h_cnt = sum(h_cnt), p_cnt = sum(p_cnt),
sf_tpe_agg f_cnt = sum(f_cnt), m_cnt = sum(m_cnt)) %>%
ungroup()
%>% head(5)
sf_tpe_agg
### result
#> Simple feature collection with 5 features and 6 fields
#> Geometry type: POLYGON
#> Dimension: XY
#> Bounding box: xmin: 121.4588 ymin: 25.00813 xmax: 121.6286 ymax: 25.21018
#> Geodetic CRS: WGS 84
#> # A tibble: 5 × 7
#> county town h_cnt p_cnt f_cnt m_cnt geometry
#> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <POLYGON [°]>
#> 1 臺北市 中山區 100790 223876 120156 103720 ((121.549 25.09124, 121.5489 25.091…
#> 2 臺北市 中正區 65795 155397 81445 73952 ((121.512 25.04986, 121.5118 25.049…
#> 3 臺北市 信義區 88952 215240 113069 102171 ((121.58 25.04946, 121.58 25.04946,…
#> 4 臺北市 內湖區 109891 282525 147901 134624 ((121.5952 25.11452, 121.5951 25.11…
#> 5 臺北市 北投區 98131 250144 130088 120056 ((121.5761 25.19542, 121.576 25.195…
請串起 sf_tpe_agg
和
df_mayor_tpe_wider
,把資料儲存在 sf_tpe_join
後,印出前 5 列
### your code
<- sf_tpe_agg %>% left_join(df_mayor_tpe_wider)
sf_tpe_join %>% head(5)
sf_tpe_join
### result
#> Simple feature collection with 5 features and 9 fields
#> Geometry type: POLYGON
#> Dimension: XY
#> Bounding box: xmin: 121.4588 ymin: 25.00813 xmax: 121.6286 ymax: 25.21018
#> Geodetic CRS: WGS 84
#> # A tibble: 5 × 10
#> county town h_cnt p_cnt f_cnt m_cnt geometry 柯文哲
#> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <POLYGON [°]> <dbl>
#> 1 臺北市 中山區 100790 223876 120156 103720 ((121.549 25.09124, 121.5489… 0.415
#> 2 臺北市 中正區 65795 155397 81445 73952 ((121.512 25.04986, 121.5118… 0.416
#> 3 臺北市 信義區 88952 215240 113069 102171 ((121.58 25.04946, 121.58 25… 0.389
#> 4 臺北市 內湖區 109891 282525 147901 134624 ((121.5952 25.11452, 121.595… 0.437
#> 5 臺北市 北投區 98131 250144 130088 120056 ((121.5761 25.19542, 121.576… 0.418
#> # … with 2 more variables: 丁守中 <dbl>, 姚文智 <dbl>
group_by()
和 summarize()
:請利用 sf_tpe_join
繪製 3 張圖,如果可以的話想辦法讓 3
張圖並排以方便比較,不行的話也沒關係。左邊放柯文哲、中間放丁守中、右邊放姚文智的得票率。
### your code
<- sf_tpe_join %>% mutate(town2 = str_remove(town, "區")) %>%
plot_ko ggplot(aes(fill = 柯文哲)) + geom_sf(color = NA) +
scale_fill_gradient(low = "white", high = "#28C8C8") + ggthemes::theme_map() +
labs(title = "2018 台北市長選舉得票率") +
theme(legend.position="bottom") +
theme(text = element_text(family = "Noto Sans CJK TC Medium")) +
geom_sf_text(aes(label = town2), family = "Noto Sans CJK TC Medium", size = 3)
<- sf_tpe_join %>% mutate(town2 = str_remove(town, "區")) %>%
plot_ting ggplot(aes(fill = 丁守中)) + geom_sf(color = NA) +
scale_fill_gradient(low = "white", high = "#000095") + ggthemes::theme_map() +
labs(title = "2018 台北市長選舉得票率") +
theme(legend.position="bottom") +
theme(text = element_text(family = "Noto Sans CJK TC Medium")) +
geom_sf_text(aes(label = town2), family = "Noto Sans CJK TC Medium", size = 3)
<- sf_tpe_join %>% mutate(town2 = str_remove(town, "區")) %>%
plot_yao ggplot(aes(fill = 姚文智)) + geom_sf(color = NA) +
scale_fill_gradient(low = "white", high = "#1B9431") + ggthemes::theme_map() +
labs(title = "2018 台北市長選舉得票率") +
theme(legend.position="bottom") +
theme(text = element_text(family = "Noto Sans CJK TC Medium")) +
geom_sf_text(aes(label = town2), family = "Noto Sans CJK TC Medium", size = 3)
### result
::grid.arrange(plot_ko,plot_ting,plot_yao,nrow=1) gridExtra