比如当我想要了解“数据质量管理”相关话题时,会在网上搜索多篇文章,每篇文章大致都会经过"What-Why-How"这几个阶段。
这些文章有重复的部分,有互补的部分,也有冗余的部分。最终,我都需要将它们整理成一篇笔记。
[问题提出]
请问有什么好的工具或策略,能简化筛选、合并的过程?
[核心诉求]
目前我正在构建这样一款谷歌插件,但不知道该如何设计处理方案。这也是提出该问题的真实出发点:寻求参考方案。
[目前我的处理方案]
将每篇文章切割,形成的最小单位便是上面所述的 What 、Why 、How ,然后将多篇文章中的 What 部分( Why|How )摆在一起,让用户自行筛选、过滤,合并成一块新的内容。Why 部分和 How 部分同样如此。最终,产生一篇新的笔记。
例如,将多篇文章中关于“数据质量管理的基本定义”放在一起,用户剔除掉其中重复、冗余的部分,将真正有价值的部分保留下来。