Python
중복 데이터 삭제하기
이부일
2018. 10. 30. 21:46
import pandas as pd
apart = pd.read_excel("d:/apart.xlsx", encoding = "EUC-KR")
# 행 전체가 중복된 행을 제거함
apart.drop_duplicates()
# 시군구 변수를 기준으로 중복된 행을 제거함
# 첫 번째 값을 유지함
apart.drop_duplicates(["시군구"], keep = "first")
# 시군구 변수를 기준으로 중복된 행을 제거함
# 마지막 값을 유지함
apart.drop_duplicates(["시군구"], keep = "last")