import numpy as np
import pandas as pd
from pandas import Series,DataFrame
# 重複したデータを含むDataFrame
dframe = DataFrame({'key1': ['A'] * 2 + ['B'] * 3,
'key2': [2, 2, 2, 3, 3]})
dframe
# 重複したデータがあるかどうかがわかります。
dframe.duplicated()
# 重複した行を削除できます。
dframe.drop_duplicates()
# 1つの列に注目して、重複を削除できます。
dframe.drop_duplicates(['key1'])
# 元のデータです。
dframe
# 最初の重複ではなく、最後のデータを残す事もできます。
dframe.drop_duplicates(['key1'],take_last=True)