R

데이터를 랜덤하게 3 등분하기

이부일 2017. 8. 29. 15:29

데이터 분석을 할 때, 데이터를 훈련(train)용, 검증(validation)용, 시험(test)용으로 나누고자 할 때는 다음과 같이 할 수 있다.

여기서는 훈련:검증:시험을 6:2:2로 배분한다.


separate.index <- sample(1:3, size = nrow(iris), replace = TRUE, prob = c(0.6, 0.2, 0.2))
train             <- iris[separate.index == 1, ] 
validation       <- iris[separate.index == 2, ]
test              <- iris[separate.index == 3, ]