-
텍스트마이닝 : 워드클라우드 작성하기Python 2018. 2. 26. 19:05
from konlpy.tag import Kkma
from konlpy.tag import Hannanum
from konlpy.tag import Twitter
from wordcloud import WordCloud, STOPWORDS
from PIL import Image
import matplotlib.pyplot as plt
import numpy as np
import platform
%matplotlib inline# 텍스트 파일 읽어오기
text = open("09. alice.txt").read()# png 파일 읽어오기
alice_mask = np.array(Image.open("09. alice_mask.png"))# Stop Words 등록하기
stopwords = set(STOPWORDS)
stopwords.add("said")# 한글 폰트 지원하기
path = "c:/Windows/Fonts/malgun.ttf"
from matplotlib import font_manager, rc
if platform.system() == 'Darwin':
rc('font', family='AppleGothic')
elif platform.system() == 'Windows':
font_name = font_manager.FontProperties(fname=path).get_name()
rc('font', family=font_name)
else:
print('Unknown system... sorry~~~~')plt.rcParams['axes.unicode_minus'] = False
# 워드 클라우드 / 텍스트 분석
wc = WordCloud(background_color = "white", max_words = 2000, mask = alice_mask, stopwords = stopwords)
wc = wc.generate(text)# 이미지 위에 워드클라우스 작성하기
plt.figure(figsize = (12, 12))
plt.imshow(wc, interpolation = "bilinear")
plt.axis("off")
plt.show()[출처] 파이썬으로 데이터 주무르기, 민형기 지음, BJPUBLIC, p287~300
'Python' 카테고리의 다른 글
열 이름을 일목요연하게 정렬하기 (0) 2018.08.24 텍스트마이닝 : 워드 클라우드 작성하기2 (0) 2018.02.26 시카고 샌드위치 맛집 분석하기 (0) 2018.02.22 seaborn 패키지를 이용한 산점도(scatter plot) 작성하기 (0) 2018.02.19 seaborn 패키지를 이용한 상자그림(Boxplot) 작성하기 (0) 2018.02.19