建议在5118、站长工具之类去开个会员,那个导出的都是很有质量的词。 也比较准确点。 微信截图_20230708175744.png (22.27 KB, 下载次数: 0) 下载附件 保存到相册 3天前 上传
tf-idf,计算相似度,不过很慢..或者利用word2evc 以前整理过,提供参考: 利用word2vec对关键词进行聚类:https://blog.csdn.net/z747795161/article/details/49633803?spm=1001.2014.3001.5501 基于k-means和tfidf的文本聚类代码简单实现:https://blog.csdn.net/z747795161/article/details/77253254?spm=1001.2014.3001.5501
前几年写个一个工具 如何区分500w的关键词中的相关性,就是根据程序 区分的 就差不多你说的这个意思 程序检测到关键词是个相关就集合在一个地方 最后差不多输出了100左右的关键词分组, 不过只是按照表面的意思划分,并不能AI划分,比如 优化网站和网站SEO 这两个关键词的相关性计算的不高,但是真实的是相关性很高的。 思路的话 1、根据分词,分词计算相关性 2、关键词加密排序,加密成字符串 然后对字符串排序,两个思路得到的都差不多 可惜工具没找到,不知道扔哪去了,你可以借鉴下思路