-
문재인 대통령 취임사의 워드 클라우드 (2)R/TextMining 2019. 11. 8. 12:43
# 패키지 설치와 로딩하기 ----
install.packages("tidyverse")
install.packages("tidytext")
install.packages("KoNLP")
install.packages("reshape2")
library(tidyverse)
library(tidytext)
library(KoNLP)
library(reshape2)# 작업공간 설정하기
setwd("d:/president/")# NIA 사전 등록하기
KoNLP::useNIADic()# 연설문 읽어오기 및 명사추출 작업
readr::read_lines(file = "19문재인.txt") %>%
sapply(KoNLP::extractNoun, USE.NAMES = FALSE) %>%
unlist() %>%
table() %>%
sort(decreasing = TRUE) %>%
tibble::as_tibble() %>%
dplyr::filter(stringr::str_length(.) >= 2) -> moon_df2# 변수명 변경하기
colnames(moon_df2) <- c("noun", "frequency")# 불완전하게 추출된 명사들 수정하기
moon_df2$noun <- stringr::str_replace(string = moon_df2$noun, pattern = "대통령의", replacement = "대통령")
moon_df2$noun <- stringr::str_replace(string = moon_df2$noun, pattern = "일하", replacement = "일")
moon_df2$noun <- stringr::str_replace(string = moon_df2$noun, pattern = "통치하", replacement = "통치")
moon_df2$noun <- stringr::str_replace(string = moon_df2$noun, pattern = "해서", replacement = "")
moon_df2$noun <- stringr::str_replace(string = moon_df2$noun, pattern = "하기", replacement = "")# 워드 클라우드 작성하기
moon_df2 %>%
dplyr::filter(stringr::str_length(noun) >= 2) %>%
wordcloud2::wordcloud2()'R > TextMining' 카테고리의 다른 글
임베딩을 만드는 세 가지 철학 (0) 2019.11.18 임베딩 기법 (0) 2019.11.15 문재인 대통령 취임사의 워드 클라우드 (0) 2019.11.08 term-topic probability (0) 2019.11.04 DFM 객체 정돈하기 (0) 2019.10.30