现在有一个需要提取网页正文的需求。大佬们有什么觉得很好用的开源库啊。 另外开源知识库产品也求个推荐。 想要做一个网页爬取,正文提取,然后到知识库,最后 api 输出的组合。 谢谢大佬们 知识库, 正文, 大佬, 提取