Python

중복 데이터 삭제하기

이부일 2018. 10. 30. 21:46

import pandas as pd

apart = pd.read_excel("d:/apart.xlsx", encoding = "EUC-KR")


# 행 전체가 중복된 행을 제거함

apart.drop_duplicates()


# 시군구 변수를 기준으로 중복된 행을 제거함
# 첫 번째 값을 유지함
apart.drop_duplicates(["시군구"], keep = "first")


# 시군구 변수를 기준으로 중복된 행을 제거함
# 마지막 값을 유지함
apart.drop_duplicates(["시군구"], keep = "last")