筛选文章中重复段落的内容

查看 136|回复 10
作者:williamipod   
需要把你自己的内容把代码替换掉、请确保你的Python环境中已经安装了scikit-learn库、datasketch库、jieba 库。
图片上传不了,代码放在文档里了,有需要可以自己下载


1.png (95.08 KB, 下载次数: 0)
下载附件
2024-1-22 19:38 上传



2.png (156.91 KB, 下载次数: 0)
下载附件
2024-1-22 19:39 上传



3.png (215.52 KB, 下载次数: 0)
下载附件
2024-1-22 19:39 上传


python代码.txt
(1.39 KB, 下载次数: 21)
2024-1-22 19:37 上传
点击文件名下载附件
下载积分: 吾爱币 -1 CB

下载次数, 下载附件

xkh5823   

弄成成品exe会不会更好一点
williamipod
OP
  


weilai8023 发表于 2024-1-23 09:42
如果能封装成成品使用,就完美了

可以做成EXE的,PyInstaller Documentation,用这个就可以弄成
安装PyInstaller:
在命令行中运行以下命令来安装PyInstaller:
pip install pyinstaller
转换Python脚本:
在命令行中,使用以下命令将Python脚本转换成EXE文件:
pyinstaller 1.py
默认情况下,PyInstaller会在当前目录下创建一个名为“dist”的文件夹,并在其中生成EXE文件。
可选参数:
如果你想要EXE文件在运行时不显示命令行窗口,可以添加--noconsole参数:
pyinstaller --noconsole 1.py
sai609   

复制粘贴到Excel,把重复项ko掉,在合并
390660860   

收藏研究一下,
dell2000   

要成品啊!预先谢过!
weilai8023   

如果能封装成成品使用,就完美了
d199212   

正好有一个需求是做对比分析两份文档不重复的地方,学习了!
bdcpc   

成品exe会更好一点
dell2000   

还在等待成品中
您需要登录后才可以回帖 登录 | 立即注册

返回顶部