ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 문재인 대통령 취임사의 워드 클라우드 (2)
    R/TextMining 2019. 11. 8. 12:43

    # 패키지 설치와 로딩하기 ----
    install.packages("tidyverse")
    install.packages("tidytext")
    install.packages("KoNLP")
    install.packages("reshape2")
    library(tidyverse)
    library(tidytext)
    library(KoNLP)
    library(reshape2)

     

     

    # 작업공간 설정하기
    setwd("d:/president/")

     

     

    # NIA 사전 등록하기
    KoNLP::useNIADic()

     

     

    # 연설문 읽어오기 및 명사추출 작업
    readr::read_lines(file = "19문재인.txt") %>%
    sapply(KoNLP::extractNoun, USE.NAMES = FALSE) %>%
    unlist() %>%
    table() %>%
    sort(decreasing = TRUE) %>%
    tibble::as_tibble() %>%
    dplyr::filter(stringr::str_length(.) >= 2) -> moon_df2

     

     

    # 변수명 변경하기
    colnames(moon_df2) <- c("noun", "frequency")

     

     

    # 불완전하게 추출된 명사들 수정하기
    moon_df2$noun <- stringr::str_replace(string = moon_df2$noun, pattern = "대통령의", replacement = "대통령")
    moon_df2$noun <- stringr::str_replace(string = moon_df2$noun, pattern = "일하", replacement = "일")
    moon_df2$noun <- stringr::str_replace(string = moon_df2$noun, pattern = "통치하", replacement = "통치")
    moon_df2$noun <- stringr::str_replace(string = moon_df2$noun, pattern = "해서", replacement = "")
    moon_df2$noun <- stringr::str_replace(string = moon_df2$noun, pattern = "하기", replacement = "")

     

     

    # 워드 클라우드 작성하기
    moon_df2 %>%
    dplyr::filter(stringr::str_length(noun) >= 2) %>%
    wordcloud2::wordcloud2()

     

    'R > TextMining' 카테고리의 다른 글

    임베딩을 만드는 세 가지 철학  (0) 2019.11.18
    임베딩 기법  (0) 2019.11.15
    문재인 대통령 취임사의 워드 클라우드  (0) 2019.11.08
    term-topic probability  (0) 2019.11.04
    DFM 객체 정돈하기  (0) 2019.10.30
Designed by Tistory.