토픽모델
-
LDA(Latent Dirichlet Allocation)Python 2020. 3. 2. 18:05
# gensim 패키지 설치하기 !pip install gensim # 패키지 로딩하기 from nltk.corpus import stopwords from nltk.stem.porter import PorterStemmer from nltk.tokenize import RegexpTokenizer from gensim import corpora, models from gensim.models import CoherenceModel import gensim import matplotlib.pyplot as plt # 텍스트 전처리를 위한 클래스 생성하기 tokenizer = RegexpTokenizer("[\w]+") # 불용어 stop_words = stopwords.words("english") # ..