R
-
-
-
데이터 시각화(Data Visualization)의 원칙R 2017. 8. 21. 13:22
데이터 시각화(Data Visualization)의 원칙 1. 비교, 대조, 차이를 드러내라. 2. 인과관계와 상관관계를 보여라. 3. 한 도표에 여러 변수를 보여라. ggplot은 통합적으로 이것을 지원한다. 4. 텍스트, 숫자, 이미지, 그래프 같은 데이터들을 한 곳에 통합하라. 5. 사용된 데이터의 출처를 그래프 안이나 각주로 밝혀라. 6. 의미 있는 내용을 담아라. [출처] 실리콘밸리 데이터과학자가 알려주는 따라 하며 배우는 데이터 과학, 권재명, 제이펍, p88
-
데이터 과학 프로세스R 2017. 8. 20. 23:46
데이터 과학 프로세스 1. 문제 정의(Problem definition) 2. 데이터 정의(Data definition) 3. 실험계획(Design of experiment) or 표본화(sampling) 4. 데이터 취득(Data acquisition) 5. 데이터 가공(Data processing, data wrangling) 6. 탐색적 분석과 데이터 시각화(Exploratory data analysis, data visualization) 7. 모형화(Modeling) 8. 분석 결과 정리(Reporting) [출처] 실리콘밸리 데이터과학자가 알려주는 따라 하며 배우는 데이터 과학, 권재명, 제이펍, p9
-
변수명 변경하기 : rename()R 2017. 8. 14. 11:08
기존의 변수명을 변경하기 위해서dplyr 패키지에서 제공하는 rename() 함수를 사용한다. # 사용하는 방법# dplyr::rename(데이터명, 새로운변수명=기존변수명) install.packages("dplyr")library(dplyr) # R의 기본 기능에서 제공하는 cars 데이터에는# speed와 dist 라는 변수가 있다.# dist 변수명을 distance라는 변수명으로 수정한다. carsDF = dplyr::rename(cars, distance = dist)