ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 효율적인 데이터 다듬기를 위한 핵심 팁 다섯 가지
    R 2018. 7. 17. 22:21

    1. 시작 단계에서 데이터를 정리하는 데에 시간을 투자하는 것은 장기적으로 봤을 때, 이후에 겪는 문제를 미리 방지하여 결과적으로 시간을 절약할 수 있게 된다.

    2. Tidy 데이터는 데이터 정리에 관한 기본 개념을 제공하며, tidyr 패키지의 일부 함수를 이용하여 이러한 작업을 할 수 있다.

    3. tibble 패키지를 이용하여 만든 data_frame 속성을 이용하면 데이터 세트를 효율적으로 출력하고 손쉽게 다룰 수 있다.

    4. dplyr 패키지는 빠르고 직관적인 데이터 처리 함수를 제공한다. 몇몇 데이터 처리 애플리케이션의 경우엔 data.table 패키지는 놀라운 속도를 보여준다.

    5. %>% 연산자는 복잡한 데이터 처리 작업 과정을 간단명료하게 처리하는 데 도움이 된다.


    [출처] 효율적인 R 프로그래밍, 로빈 러브 레이스/콜린 길렙시 지음, R Korea 번역팀 번역, 느린생각, p174


    'R' 카테고리의 다른 글

    broom::tidy()  (0) 2018.07.19
    R FOR JOURNALISTS  (0) 2018.07.19
    funModeling::freq()  (0) 2018.07.17
    funModeling 패키지  (0) 2018.07.16
    R의 모든 패키지 다운로드 받기  (2) 2018.07.10
Designed by Tistory.