请教：notepad或者wps表格如何标记重复一定字数的行？ ...

作者：逗号广告联盟发布时间：2024-1-23 16:02:02

如题，比如有1万行文字，如何标记出这一万行里面有重复字数超过5个字的？

相关帖子

制心一处 2024-1-23 16:02:54

要标记出一万行文字中重复字数超过5个字的部分，可以使用以下步骤：
将每一行文字存储在一个列表或数组中，以便后续处理。
创建一个空的字典，用于存储重复的文本和它们的出现次数。
遍历每一行文字，对于每一行，执行以下步骤：
      将当前行与其他行进行比较，检查是否有超过5个字的重复部分。
      如果有重复部分，将其添加到字典中，并增加其出现次数。
遍历字典，找到出现次数超过1的重复文本。
标记出重复文本所在的行。
以下是一个示例代码，用于实现上述步骤：
lines = [...]  # 存储一万行文字的列表
repeated_text = {}  # 存储重复文本和出现次数的字典
# 遍历每一行文字
for i in range(len(lines)):
current_line = lines[i]

# 检查当前行与其他行是否有重复部分
for j in range(i+1, len(lines)):
      other_line = lines[j]

      # 检查是否有超过5个字的重复部分
      for k in range(len(current_line)-5):
         if current_line[k:k+5] in other_line:
            repeated_text[current_line[k:k+5]] = repeated_text.get(current_line[k:k+5], 0) + 1
# 找到出现次数超过1的重复文本
for text, count in repeated_text.items():
if count > 1:
      print("重复文本:", text)

      # 标记出重复文本所在的行
      for i in range(len(lines)):
         if text in lines[i]:
            print("行号:", i+1)
请注意，这只是一个示例代码，具体实现可能需要根据实际情况进行调整。

请教：notepad或者wps表格如何标记重复一定字数的行？

相关帖子

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

请教：notepad或者wps表格如何标记重复一定字数的行？

相关帖子

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告