pandas数据处理 1、删除重复元素 使用duplicated()函数检测重复的行,返回元素为布尔类型的Series对象,每个元素对应一行,如果该行不是第一次出现,则元素为True - keep参数:指定保留哪一重复的行数据 创建具有重复元素行的DataFrame In [1]: import numpy as np import pandas as pd from pandas import Series,DataFrame In [2]: #创建一个df np.random.seed(1) df = DataFrame(data=np.random.randint(0,100,size=(8,4))) df Out[2]: 0 1 2 3 0 37 12 72 9 1 75 5 79 64 2 16 1 76 71 3 6 25 50 20 4 18 84 11 28 5 29 14 50 68 6 87 87 94 96 7 86 13 9 7 In [4]: #手动将df的某几行设置成相同的内容 df.iloc[2] = [66,66,66,66] df.iloc[4] = [66,66,66,66] df.iloc[7] = [66,66,66,66] df Out[4]: 0 1 2 3 0 37 12 72 9 1 75 5 79 64 2 66 66 66 66