Python
-
집단별 기술통계량 구하기Python 2018. 10. 30. 22:14
import pandas as pdapart = pd.read_excel("d:/apart.xlsx", encoding = "EUC-KR") apart.head() # 시군구별 보증금에 대한 기술통계량 구하기apart.groupby(" 시군구").보증금.describe() # 시군구와 전월세구분에 따른 전용면적, 보증금, 월세에 대한 평균 구하기apart.groupby(["시군구", "전월세구분"])["전용면적", "보증금", "월세"].mean() # 소수점 조정하기 round(apart.groupby(["시군구", "전월세구분"])["전용면적", "보증금", "월세"].mean() , ndigits = 2)
-
중복 데이터 삭제하기Python 2018. 10. 30. 21:46
import pandas as pdapart = pd.read_excel("d:/apart.xlsx", encoding = "EUC-KR") # 행 전체가 중복된 행을 제거함apart.drop_duplicates() # 시군구 변수를 기준으로 중복된 행을 제거함 # 첫 번째 값을 유지함 apart.drop_duplicates(["시군구"], keep = "first") # 시군구 변수를 기준으로 중복된 행을 제거함 # 마지막 값을 유지함 apart.drop_duplicates(["시군구"], keep = "last")
-
데이터 프레임(Data.Frame)를 excel 파일로 저장하기Python 2018. 10. 28. 22:04
# 라이브러리 로딩하기import pandas as pd # 엑셀 데이터 불러오기 apart = pd.read_excel(io = "d:/apart.xls", sheet_name = 0, encoding = "EUC-KR") # Data.Frame를 excel 파일로 저장하기 apart.to_excel(excel_writer = "d:/apart_csv.csv", sheet_name = "data", index = False na_rep = "NA", encoding = "EUC-KR") # excel_writer : 저장될 디렉토리와 파일명# sheet_name : 시트의 이름 # index : 행의 이름을 저장할 지의 여부 # na_rep : missing value를 어떻게 표현할 것인가 # enc..
-
데이터 프레임(Data.Frame)를 csv 파일로 저장하기Python 2018. 10. 28. 21:58
# 라이브러리 로딩하기import pandas as pd # 엑셀 데이터 불러오기apart = pd.read_excel(io = "d:/apart.xls", sheet_name = 0, encoding = "EUC-KR") # Data.Frame를 csv 파일로 저장하기apart.to_csv(path_or_buf = "d:/apart_csv.csv", index = False, na_rep = "NA", encoding = "EUC-KR") # path_or_buf : 저장될 디렉토리와 파일명# index : 행의 이름을 저장할 지의 여부# na_rep : missing value를 어떻게 표현할 것인가# encoding = "EUC-KR" : 한글이 인식되도록 인코딩 지정하기
-
-
-
텍스트마이닝 : 워드 클라우드 작성하기2Python 2018. 2. 26. 19:26
from konlpy.tag import Kkmafrom konlpy.tag import Hannanum from konlpy.tag import Twitter from wordcloud import WordCloud, STOPWORDS from PIL import Image import matplotlib.pyplot as plt import numpy as np import platform import random %matplotlib inline # 텍스트 파일과 이미지 파일 읽어오기 news = open("09. a_new_hope.txt").read() news = news.replace("HAN", "Han") news = news.replace("LUKE's", "Luke") mask = n..