R
-
비모수적 방법의 다중비교R 2019. 1. 14. 22:13
비모수적 방법의 다중비교 install.packages("MultNonParam") install.packages("PMCMR") install.packages("nycflights13") library(MultNonParam) library(PMCMR) library(nycflights13) nparcomp 패키지에서 제공하는 nparcomp() 함수를 사용할 때에 데이터의 크기가 5000개가 넘으면 비모수적 방법의 다중비교가 되지 않는 것 같다. 이때 할 수 있는 하나의 대안은 MultNonParam 패키지에서 제공하는 tukey.kruskal.test() 함수로 다음과 같이 하면 된다.MultNonParam::tukey.kruskal.test(resp = flights$distance, grp = ..
-
밀도 그림(Density Plot)R 2019. 1. 5. 09:54
Density Plot install.packages("tidyverse") install.packages("ggpubr") install.packages("gridExtra") library(tidyverse) library(ggpubr) library(gridExtra) density.plots % purrr::keep(is.numeric) %>% # numeric인 4개의 열만 추출함 purrr::map(ggpubr::ggdensity) # 각 열에 대한 density plot를 작성함 # 4개의 density plot를 하나의 그래픽 화면에 출력하기 gridExtra::grid.arrange(grobs = density.plots, nrow = 2, ncol = 2)
-
결측치(Missing Value)의 정보와 시각화하기R 2018. 12. 27. 22:20
데이터 있는 결측치(missing value)에 대한 정보를 파악하고 시각화하는 방법은 다음과 같다. install.packages("tidyverse") install.packages("naniar") install.packages("mice") install.packages("VIM") install.packages("cowplot") library(tidyverse) library(naniar) library(mice) library(VIM) library(cowplot) # 작업공간 설정하기 setwd("d:/DataAnalysis") # 데이터 읽어오기 house.price % purrr::map_dbl(naniar::n_miss) # 각 변수에 있는 missing value에 대한 정보 nan..
-
moonBook 패키지를 이용한 도넛 원그래프 작성하기R 2018. 12. 27. 20:34
PieDonut Plot 만들기Pie chart 와 donut chart를 결합한 PieDonut plot을 만들고자 합니다. 여러가지 방법이 있겠지만 저는 ggforce 패키지의 geom_arc_bar() 함수를 이용하였습니다. ggforce 패키지의 vignette는 여기서 보실 수 있습니다.https://cran.r-project.org/web/packages/ggforce/vignettes/Visual_Guide.html오늘의 문제moonBook패키지의 acs데이터를 이용하여 다음과 같은 그림을 그리는 것이 문제였습니다.이 그림은 먼저 진단명으로 pie chart를 그리고 각 진단명에 해당하는 환자들의 흡연상태에 따라 세군으로 나누어 같은 계통의 색깔로 doughnut plot을 그린 것입니다Pi..
-
plotly 패키지를 이용한 원그래프 그리기R 2018. 12. 27. 20:26
install.packages("tidyverse")install.packages("plotly")library(tidyverse) library(plotly) # 작업공간 설정하기 setwd("d:/DataAnalysis") # 데이터 읽어오기 house.price % dplyr::group_by(MSZoning) %>% dplyr::summarise(n = n()) %>% plotly::plot_ly(labels = ~MSZoning, values = ~n, type = "pie") %>% plotly::layout(title = "The General Zoning Classification") # 원그래프 작성하기 02 : label을 원조각 안에 넣기 house.price %>% dplyr::gr..
-
SPSS 스타일로 데이터 분석하기R 2018. 12. 27. 19:00
유용한 패키지를 발견했다. 마케팅 분야나 사회조사에서 빈도표와 교차표(분할표)를 아주 많이 사용하고 있다. 얼마전에 강의했던 곳에서도 SPSS를 대체해서 R로 데이터분석을 하고 싶은데, 가장 많은 질문은 SPSS로 작성하는 빈도표나 교차표를 어떻게 R에서 작성하는 지를 많이 질문했다. 또한 변수가 가지는 값에 대한 설명의 설정도 질문했다. 이 질문에 대답이 될 수 있는 하나의 패키지이다. 바로 expss 이다. 아래의 사이트를 참고하면 많은 도움이 될 것 같다. https://gdemin.github.io/expss/ 앞으로 이 부분을 잘 학습해서, 마케팅 관련된 분야에서 근무하시는 사람들을 위한 책이나 강의를 해야겠다. expss: Tables with Labels in R2018-11-12 Intro..
-
type() 함수와 mode() 함수의 차이에 대한 이해R 2018. 12. 16. 22:55
R언어를 공부하면서 가장 헷갈렸던 부분 중에 하나가 아닐까 한다. object는 뭐고, mode는 또 뭐고, type은 또 무엇이란 말인가? 결론적으로 말하면 object는 R언어에서 다루는 하나의 entity(개체)이고, 이 object가 memory에 올라갈 때의 형식이 type 혹은 mode로 표현된다. 즉, 모든 object는 type과 mode 값을 가지고 있다. 그렇다면 type과 mode의 차이는 무엇인가? 먼저, type은 R언어 자체에서 사용하는 분류이다. R언어는 C언어를 이용해 코딩되었는데, 이 C언어 상에서 실제적으로 서로 구분하는 type을 나타낸다. 반면 mode는 "Becker, R. A., Chambers, J. M. and Wilks, A. R. (1988) The New ..