-
데이터를 랜덤하게 3 등분하기R 2017. 8. 29. 15:29
데이터 분석을 할 때, 데이터를 훈련(train)용, 검증(validation)용, 시험(test)용으로 나누고자 할 때는 다음과 같이 할 수 있다.
여기서는 훈련:검증:시험을 6:2:2로 배분한다.
separate.index <- sample(1:3, size = nrow(iris), replace = TRUE, prob = c(0.6, 0.2, 0.2))
train <- iris[separate.index == 1, ]
validation <- iris[separate.index == 2, ]
test <- iris[separate.index == 3, ]'R' 카테고리의 다른 글
분석 결과의 정리와 공유 (0) 2017.09.01 랜덤 포레스트를 이용한 위스콘신 유방암 데이터 분석 (0) 2017.08.29 단순 지수평활법(Simple Exponential Smoothing) (0) 2017.08.28 stl() 함수를 사용한 계절분해 (0) 2017.08.28 단순이동평균 (0) 2017.08.28