분류 전체보기
-
-
텍스트마이닝 : 워드 클라우드 작성하기2Python 2018. 2. 26. 19:26
from konlpy.tag import Kkmafrom konlpy.tag import Hannanum from konlpy.tag import Twitter from wordcloud import WordCloud, STOPWORDS from PIL import Image import matplotlib.pyplot as plt import numpy as np import platform import random %matplotlib inline # 텍스트 파일과 이미지 파일 읽어오기 news = open("09. a_new_hope.txt").read() news = news.replace("HAN", "Han") news = news.replace("LUKE's", "Luke") mask = n..
-
텍스트마이닝 : 워드클라우드 작성하기Python 2018. 2. 26. 19:05
from konlpy.tag import Kkmafrom konlpy.tag import Hannanum from konlpy.tag import Twitter from wordcloud import WordCloud, STOPWORDS from PIL import Image import matplotlib.pyplot as plt import numpy as np import platform %matplotlib inline # 텍스트 파일 읽어오기 text = open("09. alice.txt").read() # png 파일 읽어오기 alice_mask = np.array(Image.open("09. alice_mask.png")) # Stop Words 등록하기 stopwords = set(STO..
-
2018년도 010번째 읽은 책 : 뉴턴이 들려주는 미분 2 이야기Books 2018. 2. 25. 22:42
제 목 : 뉴턴이 들려주는 미분 2 이야기 지 음 : 김승태 출판사 : 자음과모음 가 격 : 11,000원 페이지 : p160 독서기간 : 2018년 2월 24일(토) ~ 2018년 2월 25일(일) 경영수학 교재를 만들기 위한 사전작업으로 책을 읽고 있다. 책 한 권을 쓰기 위해서는 3~400권의 책을 읽거나 그 정도 양의 내용이 글쓰는 사람에게 있어야 한다고 들었던 것 같다.그 말에 동의를 한다. 비록 2장을 맡았지만 시작할 때에 너무 경솔하게 예스를 했다. 덕분에 고생을 한다. 후회만 되는 고생은 아니다. 몰랐던 뉴턴과 라이프니츠 간에 벌였던 이야기도 들들을 수 있었다. 글쓰는 사람들을 보면 참 부럽다. 어떻게 날마다 새로운 글들이 쏟아지며 논리 정연하게, 맛깔나게 문장을 만들어 내고 있다.
-
2018년도 009번째 읽은 책 : 뉴턴이 들려주는 미분 1 이야기Books 2018. 2. 24. 15:27
제 목 : 뉴턴이 들려주는 미분 1 이야기 지 음 : 김승태 출판사 : 자음과모음 가 격 : 11,000원 페이지 : p151 독서기간 : 2018년 2월 24일(토) ~ 2018년 2월 24일(토) 평생학습 차원으로 경영학을 지원하여 공부할 수강생들을 위한 교재를 만들기 위해서 과 분야를 맡았다.어떻게 하면 쉽게 행렬과 미분 개념을 전달할 수 있을까 고민하다가 소개받은 책이다. 늘 경험하듯이 책을 쓰는 저자들은 놀랍고 대단하다. 그들이 사용하는 예제의 창의성, 그들이 사용하는 단어의 적절성, 그들이 사용하는 내용 구성의 탁월성에 감탄한다. 2년 정도 이라는 과목을 강의하고 있는데, 강사로서 어떻게 하면 수강생들에게 쉽게 전달할 수 있을까 라는 막연함이 많았는데, 이 책을 통해서 도움을 많이 받는다. 이..
-
시카고 샌드위치 맛집 분석하기Python 2018. 2. 22. 10:26
시카고 매거진 홈페이지에 접속해서 샌드위치 가게 정보를 수집해서 지도에 표현하기 # 패키지 로딩하기from bs4 import BeautifulSoup from urllib.request import urlopen import re from urllib.parse import urljoin import pandas as pd from tqdm import tqdm_notebook import folium import pandas as pd import googlemaps import numpy as np # 웹크롤링할 사이트 url_base = "http://www.chicagomag.com" url_sub = "/Chicago-Magazine/November-2012/Best-Sandwiches-Chi..
-
조선명탐정: 흡혈괴마의 비밀 (2017)에 대한 텍스트마이닝IR/TextMining 2018. 2. 20. 11:10
# 관련 패키지 설치하고 로딩하기install.packages("httr") install.packages("rvest") install.packages("tm") install.packages("slam") install.packages("dplyr") install.packages("readr") install.packages("d:/NLP4kec_1.1.0.zip", repos = NULL) install.packages("ggplot2") install.packages("wordcloud2") install.packages("treemap") install.packages("RColorBrewer") library(httr) library(rvest) library(tm) library(slam)..
-
seaborn 패키지를 이용한 산점도(scatter plot) 작성하기Python 2018. 2. 19. 14:18
import matplotlib.pyplot as plt%matplotlib inline import seaborn as sns # 화면 스타일 설정하기 sns.set_style("ticks") # 파이썬에서 제공하는 데이터 불러오기 iris = sns.load_dataset("iris") iris.head() # 산점도 작성하기 sns.pairplot(iris) plt.show() # 집단별 산점도 작성하기 sns.pairplot(iris, hue = "species") plt.show() [출처] 파이썬으로 데이터 주무르기, 민형기 지음, BJPUBLIC, p102~103