-
랜덤 포레스트를 이용한 위스콘신 유방암 데이터 분석R 2017. 8. 29. 17:19
위스콘신 유방암 데이터(Wisconsin Breast Cancer Data)를 이용하여 암(악성, 양성)을 예측하는 것을 랜덤 포레스트(random forest)를 이용하여 분석하는 과정은 다음과 같다.
install.packages("randomForest")
install.packages("ROCR")
library(randomForest)
library(ROCR)# 랜덤 포레스트
wdbc.random.forest <- randomForest::randomForest(class ~., data = train)
wdbc.random.forest# 그래프 : 오차율 감소와 설명변수의 중요도
plot(wdbc.random.forest)
randomForest::varImpPlot(wdbc.random.forest)# 모형평가
rf.Y.hat <- predict(wdbc.random.forest, newdata = validation, type = "prob")[ , "1"]
rf.prediction <- ROCR::prediction(rf.Y.hat, validation$class)
ROCR::performance(rf.prediction, "auc")@y.values[[1]][출처] 실리콘밸리 데이터과학자가 알려주는 따라 하며 배우는 데이터과학, 권재명 지음, 제이펍, p238~239
'R' 카테고리의 다른 글
grDevices 패키지의 팔레트 사용하기 (0) 2017.09.06 분석 결과의 정리와 공유 (0) 2017.09.01 데이터를 랜덤하게 3 등분하기 (0) 2017.08.29 단순 지수평활법(Simple Exponential Smoothing) (0) 2017.08.28 stl() 함수를 사용한 계절분해 (0) 2017.08.28