class: center, middle, inverse, title-slide # Lab07_Visualizing-Data-Tips ## Lab06_ggplot2-layered-graphics ### 曾子軒 Dennis Tseng ### 台大新聞所 NTU Journalism ### 2021/04/13

# 今日重點 - 沒有作業 - 期中個人資料新聞 - AS05 檢討 - `ggplot2` layers - Lab067 Practice

# 作業檢討 - [Lab06 範例解答](、[AS05 範例解答](

# ggplot2 layer - 組成 - data + `ggplot(aes( ))` + `geom_**()` + ... - 資料層 + 美學層 + 幾何層 + ... <img src="photo/Lab06_ggplot01.jpg" width="55%" height="55%" /> source: [Datacamp - Introduction to Data Visualization with ggplot2](

# ggplot2 layer - 概念上 - 圖表由 layer + scales + coordinate + facet + theme 所組成 - Layer 負責我們在圖表中看到的物件 - Data - Aesthetic mappings - A statistical transformation (stat) - A geometric object (geom) - A position adjustment

# ggplot2 layer - 概念上 - 圖表由 layer + scales + coordinate + facet + theme 所組成 - Scales 負責控制變數轉換到美學的mapping - 每個變數都需要一個 scale, e.g. x, y, color, fill, etc. - 分為連續和類別,可以手動補值, e.g. `scale_x_continuous()`, `scale_fill_manual()` - 因為它控制轉換,所以也包含怎麼用圖例和座標軸向讀者解釋 - 用英文比教好懂:Each scale is a function from a region in data space (the domain of the scale) to a region in aesthetic space (the range of the scale). The axis or legend is the inverse function: it allows you to convert visual properties back to data. --- # ggplot2 layer - Scales 負責控制變數轉換到美學的mapping Argument name | Axis | Legend --------------|-------|------ name | Label | Title breaks | Ticks & grid line | Key labels | Tick label | Key label <img src="photo/Lab07_ggplot_guides.png" width="55%" height="55%" /> --- # ggplot2 layer - 概念上 - 圖表由 layer + scales + coordinate + facet + theme 所組成 - Coordinate System 負責把物件位置對應到圖片的平面/表面(plane)上 - 最常見到二維,但也有非直角坐標的像是 polar system - Facet 負責將圖表依照特定變數切分成多格,實用所以拉出來談 - Theme 負責實質資料以外的內容 - 內容非常多樣,舉凡字體、位置、框線等皆屬之 - 有現成套件如 `library(ggthemes)` 可以直接調用 --- # ggplot2 layer - 概念上 - 圖表由 layer + scales + coordinate + facet + theme 所組成 - 實務上 - data: 你要用的資料,可以很多 - aesthetics: 選擇要映射的資料變數、怎麼映射,可以很多 - geometries: 不同類型的圖表, 可以很多 - coordinate: 有沒有要調整座標系統、座標軸 - facet: 有沒有要用到 facet - scale: 資料變數映射過程中如何對應 - legend and axis: 視覺變數如何對應回去資料變數 - title and lab: 標題、次標、註解 - theme: 通常有背景、框線、字體 --- # ggplot2 layer ```r library(tidyverse) diamonds %>% head(5) ``` ``` ## # A tibble: 5 x 10 ## carat cut color clarity depth table price x y z ## <dbl> <ord> <ord> <ord> <dbl> <dbl> <int> <dbl> <dbl> <dbl> ## 1 0.23 Ideal E SI2 61.5 55 326 3.95 3.98 2.43 ## 2 0.21 Premium E SI1 59.8 61 326 3.89 3.84 2.31 ## 3 0.23 Good E VS1 56.9 65 327 4.05 4.07 2.31 ## 4 0.290 Premium I VS2 62.4 58 334 4.2 4.23 2.63 ## 5 0.31 Good J SI2 63.3 58 335 4.34 4.35 2.75 `geom_smooth()` using method = 'gam' and formula 'y ~ s(x, bs = "cs")' ```r df_city_taiwan %>% head(2) ``` ``` ## # A tibble: 2 x 6 ## name country.etc pop lat long capital ## <chr> <chr> <int> <dbl> <dbl> <int> ## 1 Changhwa Taiwan 227178 24.1 121. 0 ## 2 Chaochou Taiwan 58839 22.6 121. 0 ``` ```r sf_county %>% head(2) ``` ``` ## Simple feature collection with 2 features and 4 fields ## geometry type: MULTIPOLYGON ## dimension: XY ## bbox: xmin: 119.9089 ymin: 24.30943 xmax: 124.5611 ymax: 26.38528 ## geographic CRS: TWD97 ## COUNTYID COUNTYCODE COUNTYNAME COUNTYENG ## 1 Z 09007 連江縣 Lienchiang County ## 2 G 10002 宜蘭縣 Yilan County ## geometry ## 1 MULTIPOLYGON (((119.9645 25... ## 2 MULTIPOLYGON (((121.9597 24... ## although coordinates are longitude/latitude, st_intersection assumes that they are planar You can override using the `.groups` argument.