전체 글
-
시계열 분석모형의 구분(계량경제학 분야)R/TimeSeries 2018. 3. 18. 23:02
계량경제학(Eoconometrics) 분야에서 사용되는 시계열 분석모형은 다음과 같다. 1. AR(Auto Regressive Model) 2. MA(Moving Average Model) 3. ARMA(Auto Regressive Moving Average Model) 4. ARIMA(Auto Regressive Integrated Moving Average Model) 5. AECT(Auto regressive Error Correlation Model) 6. ARCH(Auto Regressive Conditional Heteroscedastic Model) 6. GARCH(Genealized Auto Regressive Conditional Heteroscedastic Model) 7. SV(Sto..
-
2018년도 016번째 읽은 책 : 데이터과학 입문자를 위한 RBooks 2018. 3. 16. 18:11
제 목 : 데이터과학 입문자를 위한 R지 음 : 재리드 랜더 옮 김 : 고석범 출판사 : 에이콘 가 격 : 40,000원 페이지 : p646 독서기간 : 2018년 1월 13일(토) ~ 2018년 3월 16일(금) 이 책은 다음과 같은 내용을 다루고 있다. 1장 ~ 10장 : R의 기초, 11장~ 16장 : 데이터핸들링, 17장 ~ 26장 : 초급/중급/고급통계, 27장 ~ 28장 : Markdown 29장 : Shiny 30장 : Package 개발 이 책을 통해서 몰랐던 많은 패키지들과 함수의 존재를 알게 되었다. 앞으로 잘 활용해야겠다.좋은 책을 써 준 저자, 그리고 번역해 준 또 다른 저자, 출판사 모두에게 감사한다. R과 통계에 대한 실력을 조금씩 조금씩 쌓아가게 된다.
-
-
2018년도 015번째 읽은 책 : R를 이용한 텍스트 마이닝Books 2018. 3. 13. 22:17
제 목 : R를 이용한 텍스트 마이닝지 음 : 백영민 출판사 : 한울 가 격 : 29,500원 페이지 : p295 독서기간 : 2018년 3월 2일(금) ~ 2018년 3월 13일(화) R을 이용하여 관련된 한글 책은 이것이 유일해 보인다. R을 이용한 텍스트마이닝하면 주로 인터넷에 있는 글을 크롤링(crawling)하고, 명사를 추출하고, 일부 문제가 있는 단어들을 변경하거나 삭제하고, 빈도 구하기, 막대그래프/원그래프를 작성하고, 워드 클라우드(word cloud) 작성하는 것이 대부분이다. 하지만 이 책은 텍스트를 처리하기 위한 R의 기본 기능에서 제공하는 함수들stringr 패키지에서 제공하는 함수들tm과 KoNLP를 이용하여 텍스트를 처리하는 방법문서 간의 상관분석유사도 행렬을 이용한 위계적 군..
-
데이터의 유형이 character인 열을 모두 factor로 변경하기R 2018. 3. 13. 19:51
엑셀 데이터를 읽어올 때에 가장 많이 사용하는 방법은readxl 패키지에서 제공하는 read_excel() 함수이다. 다른 함수들과 차이점은 데이터에 문자가 입력되어 있는 경우,stringsAsFactors를 argument를 TRUE를 지정하면 문자로 입력된 것은 R에서 factor로 인식되도록 할 수 있는 기능을 다른 함수들은 제공하지만 readxl::read_excel() 함수에서는 제공하지 않는다. 분석을 하다보면, chr로 되어 있는 모든 열을 factor로 변경할 필요가 있다.그것을 해결하는 방법은 아래와 같다. DF