Python
-
텍스트마이닝 : 워드클라우드 작성하기Python 2018. 2. 26. 19:05
from konlpy.tag import Kkmafrom konlpy.tag import Hannanum from konlpy.tag import Twitter from wordcloud import WordCloud, STOPWORDS from PIL import Image import matplotlib.pyplot as plt import numpy as np import platform %matplotlib inline # 텍스트 파일 읽어오기 text = open("09. alice.txt").read() # png 파일 읽어오기 alice_mask = np.array(Image.open("09. alice_mask.png")) # Stop Words 등록하기 stopwords = set(STO..
-
시카고 샌드위치 맛집 분석하기Python 2018. 2. 22. 10:26
시카고 매거진 홈페이지에 접속해서 샌드위치 가게 정보를 수집해서 지도에 표현하기 # 패키지 로딩하기from bs4 import BeautifulSoup from urllib.request import urlopen import re from urllib.parse import urljoin import pandas as pd from tqdm import tqdm_notebook import folium import pandas as pd import googlemaps import numpy as np # 웹크롤링할 사이트 url_base = "http://www.chicagomag.com" url_sub = "/Chicago-Magazine/November-2012/Best-Sandwiches-Chi..
-
seaborn 패키지를 이용한 산점도(scatter plot) 작성하기Python 2018. 2. 19. 14:18
import matplotlib.pyplot as plt%matplotlib inline import seaborn as sns # 화면 스타일 설정하기 sns.set_style("ticks") # 파이썬에서 제공하는 데이터 불러오기 iris = sns.load_dataset("iris") iris.head() # 산점도 작성하기 sns.pairplot(iris) plt.show() # 집단별 산점도 작성하기 sns.pairplot(iris, hue = "species") plt.show() [출처] 파이썬으로 데이터 주무르기, 민형기 지음, BJPUBLIC, p102~103
-
seaborn 패키지를 이용한 상자그림(Boxplot) 작성하기Python 2018. 2. 19. 14:03
# 패키지 불러오기import matplotlib.pyplot as plt%matplotlib inlineimport seaborn as snsimport numpy as np # 화면 스타일 설정하기sns.set_style("whitegrid") # 파이썬에서 제공하는 데이터 불러오기 tips = sns.load_dataset("tips") # 1. 상자그림 작성하기 : 가로 방향sns.boxplot(x = "total_bill", data = tips)plt.show() # 2. 상자그림 작성하기 : 세로 방향sns.boxplot(x = "total_bill", orient = "v", data = tips)plt.show() # 3. 집단별 상자그림 작성하기 : 일변량 질적 자료sns.boxplot..
-
서울특별시 구별 CCTV 현황 분석Python 2018. 2. 10. 22:14
[출처] 파이썬으로 데이터 주무르기, 민형기 지음, BJPublic, p23 ~ 72 In [70]: # 패키지 로딩하기 import pandas as pd import numpy as np import matplotlib.pyplot as plt from matplotlib import font_manager, rc %matplotlib inline In [3]: # csv 데이터 불러오기 cctv_seoul = pd.read_csv("01. CCTV_in_Seoul.csv", encoding = "UTF-8") In [5]: # 데이터의 일부 보기 cctv_seoul.head() Out[5]: 기관명 소계 2013년도 이전 2014년 2015년 2016년 0 강남구 2780 1292 430 584 9..
-
문자열(string)Python 2018. 2. 10. 14:49
함수 이름 설명 lower() 모든 문자를 소문자로 변환 upper() 모든 문자를 대문자로 변환 captitalize() 첫 번째 문자를 대문자로 변환하고 나머지 문자들은 모두 소문자로 변환 islower() 모든 알파벳 문자들이 소문자인지 체크 isupper() 모든 알파벳 문자들이 대문자인지 체크 isspace() 모든 문자가 공백인지 체크 isdigit() 모든 문자가 0~9 사이의 숫자인지 체크 isalpha() 모든 문자가 a~Z 사이의 알파벳인지 체크 decode() 바이너리 배열을 문자열로 변환 encode() 문자열을 바이너리 배열로 변환 lstrip() 문자열에서 왼쪽에 있는 공백 제거 rstrip() 문자열에서 오른쪽에 있는 공백 제거 strip() 문자열에서 왼쪽과 오른쪽에 있는 공..
-