ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • model
    카테고리 없음 2018. 8. 3. 15:03

    ggplot2 패키지에서 제공하는 diamonds 데이터의 cut과 price, cut과 carat, carat과 price 강한 관계가 있다. 이러한 강력한 관계를 제거하기 위하여 다음과 같이 model를 사용할 수 있다.


    install.packages("tidyverse")
    install.packages("modelr")
    library(tidyverse)
    library(modelr)


    # 모형
    diamonds.model <- lm(log(price) ~ log(carat), data = diamonds)


    # 산점도
    diamonds %>% 
         modelr::add_residuals(diamonds.model) %>% 
         dplyr::mutate(resid = exp(resid)) %>% 
         ggplot2::ggplot(mapping = aes(x = carat, y = resid)) +
         geom_point()


    # 상자그림
    diamonds %>% 
         modelr::add_residuals(diamonds.model) %>% 
         dplyr::mutate(resid = exp(resid)) %>% 
         ggplot2::ggplot(mapping = aes(x = cut, y = resid)) +
         geom_boxplot()

    자동 대체 텍스트를 사용할 수 없습니다.


    [출처] R for Data Science, Hadley Wickham & Garrett Grolemund, O'REILLY, p106~107


Designed by Tistory.