我有两个 excel ,一个 4 千行,6 列 名字叫 tb4k ,一个 6 千行,10 列,名字叫 tb6k 。
都用 pandas 接成 df 对象,然后循环两个 df 。最后保存成 excel 。
伪代码
遍历 tb4k 的每一行,取前三列的内容:
遍历 tb6k:
tb6k 的前三列一致:
将 tb6k 的后面第 5,8,10 行的内容赋值给 tb4k 的后三列
停止遍历 tb6k
保存 tb4k 到原 excel
我执行段代码。tb4k 遍历每一行大概需要 1s 左右(包含 tb6k 的遍历)。导致我运行这段程序要接近 1 小时。
这速度也太慢了吧。还是我水平太菜了,没有用好 pandas ?