-
효율적인 데이터 다듬기를 위한 핵심 팁 다섯 가지R 2018. 7. 17. 22:21
1. 시작 단계에서 데이터를 정리하는 데에 시간을 투자하는 것은 장기적으로 봤을 때, 이후에 겪는 문제를 미리 방지하여 결과적으로 시간을 절약할 수 있게 된다.
2. Tidy 데이터는 데이터 정리에 관한 기본 개념을 제공하며, tidyr 패키지의 일부 함수를 이용하여 이러한 작업을 할 수 있다.
3. tibble 패키지를 이용하여 만든 data_frame 속성을 이용하면 데이터 세트를 효율적으로 출력하고 손쉽게 다룰 수 있다.
4. dplyr 패키지는 빠르고 직관적인 데이터 처리 함수를 제공한다. 몇몇 데이터 처리 애플리케이션의 경우엔 data.table 패키지는 놀라운 속도를 보여준다.
5. %>% 연산자는 복잡한 데이터 처리 작업 과정을 간단명료하게 처리하는 데 도움이 된다.
[출처] 효율적인 R 프로그래밍, 로빈 러브 레이스/콜린 길렙시 지음, R Korea 번역팀 번역, 느린생각, p174
'R' 카테고리의 다른 글
broom::tidy() (0) 2018.07.19 R FOR JOURNALISTS (0) 2018.07.19 funModeling::freq() (0) 2018.07.17 funModeling 패키지 (0) 2018.07.16 R의 모든 패키지 다운로드 받기 (2) 2018.07.10