-
중복 데이터 삭제하기Python 2018. 10. 30. 21:46
import pandas as pd
apart = pd.read_excel("d:/apart.xlsx", encoding = "EUC-KR")
# 행 전체가 중복된 행을 제거함
apart.drop_duplicates()
# 시군구 변수를 기준으로 중복된 행을 제거함
# 첫 번째 값을 유지함
apart.drop_duplicates(["시군구"], keep = "first")# 시군구 변수를 기준으로 중복된 행을 제거함
# 마지막 값을 유지함
apart.drop_duplicates(["시군구"], keep = "last")'Python' 카테고리의 다른 글
Missing Value 처리 (0) 2018.11.01 집단별 기술통계량 구하기 (0) 2018.10.30 데이터 프레임(Data.Frame)를 excel 파일로 저장하기 (0) 2018.10.28 데이터 프레임(Data.Frame)를 csv 파일로 저장하기 (0) 2018.10.28 pandas( 문용준 부장) (0) 2018.10.14