문재인 대통령 평양 연설문에 대한 Word Cloud 작성하기
# 패키지 설치하기와 로딩하기
# Java 최신 버전 설치하기
install.packages("tidyverse")
install.packages("tidytext")
install.packages("KoNLP")
install.packages("reshape2")
install.packages("wordcloud2")
library(tidyverse)
library(tidytext)
library(KoNLP)
library(reshape2)
library(wordcloud2)
# 작업공간 설정하기
setwd("e:/R/TextMining/")
# KoNLP 패키지에서 제공하는 NIA 사전 사용하기
KoNLP::useNIADic()
# Word Cloud 작성하기
readLines(con = "moon.txt") %>% # 데이터 읽어오기
KoNLP::SimplePos09() %>% # 형태소
reshape2::melt() %>% # 데이터 shape 변경
tibble::as.tibble() %>% # tibble 데이터
dplyr::select(L1, value) %>% # 변수 선택
dplyr::mutate(noun = stringr::str_match(string = value, pattern = "([가-힣]+)/N")[ , 2]) %>% # 한 글자 이상의 명사추출
na.omit() %>% # NA 제거하기
dplyr::mutate(noun_length = stringr::str_length(noun)) %>% # 글자수 계산하기
dplyr::filter(noun_length >= 2) %>% # 2글자 이상의 명사 추출
dplyr::count(noun, sort = TRUE) %>% # 명사의 빈도 구하기
wordcloud2::wordcloud2() # 워드 클라우드