R

층화추출(Startified Sampling)

이부일 2017. 12. 14. 11:26

install.packages("sampling")

library(sampling)


# 층화추출 방법을 이용하여 iris의 Species라는 세 가지 품종에서 10개씩 표본을 추출

iris.sample.index <- sampling::strata(data = iris,
                                                           stratanames = "Species", # 층화로 사용되는 변수명,
                                                           size = c(10, 10, 10)          # 3개의 그룹에서 각각 10개
                                                           method = "srswor")          # simple random sampling without replacement


# 추출된 데이터의 id를 이용하여 새로운 데이터 생성

iris.subset <- iris[iris.sample.index , ]


# 참고로 sampling 패키지에는 다양한 sampling 방법들을 지원한다.


[참고] R고 하는 금융분석, 파람지트/파라샨트 바츠 지음, 홍영표/오승훈 옮김, p73~74