色拉木女郎 发表于 2021-3-22 17:30:03

python中如何计算Excel某列中重复数据项的次数


对于上面Excel表格的日期项,怎么使用python统计不同的日期出现的次数,统计完成后删除重复的日期项并记录到‘次数’列。就像下面的示例:

目前只能想到以下思路:
data = pd.read_excel('./统计日期次数.xls')
cleandata= data.drop_duplicates() #使用drop_duplicates(['日期']) 可以返回没有重复项的日期列,但是如何统计重复的日期数并记录到‘次数’这列呢?

人言信 发表于 2021-4-6 18:41:12

data.value_counts()

可恶咯 发表于 2021-4-27 20:05:37

import openpyxl
from collections import Counter

wb = openpyxl.load_workbook('tt.xlsx')
ws = wb.active
print(ws.max_row)
list = []
list_set = []
for i in range(1,ws.max_row+1):
    list.append(str(ws.cell(i,1).value))
list_set = set(list) #去重之后列表
c = Counter(list) #统计出现次数
print(list_set,c)
页: [1]
查看完整版本: python中如何计算Excel某列中重复数据项的次数