EXCEL重复数据处理,求方法或Python代码。

查看 77|回复 9
作者:我爱猫哥   
手里有很多重复数据需要处理,手动处理太麻烦了。求大佬给个操作方法,或者帮忙写个python也行。。。
谢谢
[i]
[i]
其中需要处理的Excel文件样品,还有很多这种的,谢谢大佬!
https://f.ws59.cn/f/e92genb6dit 复制链接到浏览器打开

大佬, 数据处理

shuisanyue   

安装个方方格子插件……就能完成了
小小涩郎   

这个简单啊    几个公式就可以了  或者VBA也行
jyjjf   

你直接透视表不用公式就行,对值:客户编号计数就行,然后复制出数据到另一张表筛选客户编码大于2的就行了
小小涩郎   

链接:https://pan.baidu.com/s/1glyvB0p3WxY5UdceodpuSA?pwd=ezv5
提取码:ezv5
--来自百度网盘超级会员V7的分享
我爱猫哥
OP
  


小小涩郎 发表于 2024-6-1 17:13
链接:https://pan.baidu.com/s/1glyvB0p3WxY5UdceodpuSA?pwd=ezv5
提取码:ezv5
--来自百度网盘超级会 ...

大佬,求方法
jyjjf   


我爱猫哥 发表于 2024-6-1 17:17
大佬,求方法

上面不是有了方法公式了么
小小涩郎   


我爱猫哥 发表于 2024-6-1 17:17
大佬,求方法

公式在里面啊  
cndeng   

[Python] 纯文本查看 复制代码
import pandas as pd
# 1. 读取Excel表格
df = pd.read_excel('dup.xlsx')
# 2. 按空格分割出日期,添加一列为date存放分割出的日期
df['计费时间'] = df['计费时间'].astype(str)
df['date'] = df['计费时间'].str.split(' ').str[0]
# 3. 遍历表格,检查重复并添加是否重复的列
df['重复计费'] = df.duplicated(subset=['客户编号', 'date']).map({True: '是', False: '否'})
# 4. 导出表格
df.to_excel('output_file.xlsx', index=False)
laoda1228   

https://cowtransfer.com/s/8c829fd75ff04f 点击链接查看 [ 重复计费.xlsx ] ,或访问奶牛快传 cowtransfer.com 输入传输口令 n0ba19 查看;
您需要登录后才可以回帖 登录 | 立即注册

返回顶部