-
DFM 객체 정돈하기R/TextMining 2019. 10. 30. 23:37
install.packages("tm")
install.packages("topicmodels")
install.packages("tidyverse")
install.packages("tidytext")
install.packages("quanteda")
install.packages("scales")
library(tm)
library(topicmodels)
library(tidyverse)
library(tidytext)
library(quanteda)
library(scales)data("data_corpus_inaugural")
data_corpus_inaugural
inaug_dfm <- quanteda::dfm(data_corpus_inaugural, verbose = FALSE)
inaug_dfminaug_tidy <- tidytext::tidy(inaug_dfm)
inaug_tidyinaug_tidy %>%
tidytext::bind_tf_idf(term, document, count) %>%
dplyr::arrange(desc(tf_idf)) -> inaug_tf_idfinaug_tidy %>%
tidyr::extract(document, "year", "(\\d+)", convert = TRUE) %>%
tidyr::complete(year, term, fill = list(count = 0)) %>%
dplyr::group_by(year) %>%
dplyr::mutate(year_total = sum(count)) -> year_term_countsyear_term_counts %>%
dplyr::filter(term %in% c("god", "america", "foreign", "freedom")) %>%
ggplot2::ggplot(mapping = aes(x = year, y = count / year_total)) +
ggplot2::geom_point() +
ggplot2::geom_smooth() +
ggplot2::facet_wrap(~term, scales = "free_y") +
ggplot2::scale_y_continuous(labels = scales::percent_format()) +
ggplot2::ylab("% frequency of word in inaugural address")[출처] R로 배우는 텍스트마이닝, 줄리아 실기/데이비드 로빈슨 지음, 박진수 옮김, 제이펍, p89~92
'R > TextMining' 카테고리의 다른 글
문재인 대통령 취임사의 워드 클라우드 (0) 2019.11.08 term-topic probability (0) 2019.11.04 긍정 정서나 부정 정서에 가장 큰 기여를 한 단어들 (0) 2019.10.30 R and BERT (0) 2019.10.29 문재인 대통령 평양 연설문에 대한 Word Cloud 작성하기 (0) 2019.10.24